tslearn.metrics.dtw_path

tslearn.metrics.dtw_path(s1, s2, global_constraint=None, sakoe_chiba_radius=None, itakura_max_slope=None, be=None)[source]

计算(可能是多维的)时间序列之间的动态时间规整(DTW)相似度度量,并返回路径和相似度。

DTW 计算为对齐时间序列之间的欧几里得距离,即如果 \(\pi\) 是对齐路径:

\[DTW(X, Y) = \sqrt{\sum_{(i, j) \in \pi} (X_{i} - Y_{j})^2}\]

不要求两个时间序列的大小相同,但它们必须具有相同的维度。DTW最初在[1]中提出,并在我们的专用用户指南页面中进行了更详细的讨论。

Parameters:
s1array-like, shape=(sz1, d) or (sz1,)

一个时间序列。如果形状是 (sz1,),则假定时间序列是单变量的。

s2array-like, shape=(sz2, d) or (sz2,)

另一个时间序列。如果形状是 (sz2,),则假定时间序列是单变量的。

global_constraint{“itakura”, “sakoe_chiba”} or None (default: None)

全局约束以限制DTW的可接受路径。

sakoe_chiba_radiusint or None (default: None)

用于Sakoe-Chiba带全局约束的半径。 如果为None且global_constraint设置为“sakoe_chiba”,则使用半径为1。 如果同时设置了sakoe_chiba_radiusitakura_max_slope, 则使用global_constraint来推断在这两者中使用哪个约束。 在这种情况下,如果global_constraint不对应任何全局约束, 则会引发RuntimeWarning并且不使用任何全局约束。

itakura_max_slopefloat or None (default: None)

Itakura平行四边形约束的最大斜率。 如果为None且global_constraint设置为“itakura”,则使用最大斜率为2。 如果同时设置了sakoe_chiba_radiusitakura_max_slope, 则使用global_constraint来推断使用哪种约束。在这种情况下,如果global_constraint不对应任何全局约束,则会引发RuntimeWarning并且不使用任何全局约束。

beBackend object or string or None

后端。如果 be 是类 NumPyBackend 的实例或字符串 “numpy”,则使用 NumPy 后端。 如果 be 是类 PyTorchBackend 的实例或字符串 “pytorch”,则使用 PyTorch 后端。 如果 beNone,则后端由输入数组决定。 更多信息请参阅我们的 专用用户指南页面

Returns:
list of integer pairs

匹配路径表示为索引对的列表。在每一对中,第一个索引对应于s1,第二个索引对应于s2。

float

相似度分数

另请参阅

dtw

仅获取DTW的相似度分数

cdist_dtw

时间序列数据集之间的交叉相似性矩阵

dtw_path_from_metric

使用用户定义的距离度量计算DTW

参考文献

[1]

H. Sakoe, S. Chiba, “动态规划算法优化用于语音识别,” IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 26(1), pp. 43–49, 1978.

示例

>>> path, dist = dtw_path([1, 2, 3], [1., 2., 2., 3.])
>>> path
[(0, 0), (1, 1), (1, 2), (2, 3)]
>>> dist
0.0
>>> dtw_path([1, 2, 3], [1., 2., 2., 3., 4.])[1]
1.0

使用tslearn.metrics.dtw_path的示例

最长公共子序列

Longest Common Subsequence

规范时间扭曲

Canonical Time Warping

动态时间规整

Dynamic Time Warping