tslearn.metrics.lcss

tslearn.metrics.lcss(s1, s2, eps=1.0, global_constraint=None, sakoe_chiba_radius=None, itakura_max_slope=None, be=None)[source]

计算(可能是多维的)时间序列之间的最长公共子序列(LCSS)相似度度量,并返回相似度。

LCSS通过匹配直到达到eps阈值的索引来计算,因此它会留下一些未匹配的点,并专注于两个序列的相似部分。即使时间索引不同,也可以通过delta参数调节匹配的发生,该参数定义了可以走多远。为了从最长公共子序列的长度中检索出有意义的相似性值,返回该值相对于最短时间序列长度的百分比。

根据这个定义,LCSS返回的值范围从0到1,当两个时间序列完全匹配时取最高值,反之亦然。不要求两个时间序列具有相同的大小,但它们必须具有相同的维度。LCSS最初在[1]中提出,并在我们的专用用户指南页面中进行了更详细的讨论。

Parameters:
s1array-like, shape=(sz1, d) or (sz1,)

一个时间序列。如果形状是 (sz1,),则假定时间序列是单变量的。

s2array-like, shape=(sz2, d) or (sz2,)

另一个时间序列。如果形状是 (sz2,),则假定时间序列是单变量的。

epsfloat (default: 1.)

最大匹配距离阈值。

global_constraint{“itakura”, “sakoe_chiba”} or None (default: None)

全局约束以限制LCSS的可接受路径。

sakoe_chiba_radiusint or None (default: None)

用于Sakoe-Chiba带全局约束的半径。 如果为None且global_constraint设置为“sakoe_chiba”,则使用半径为1。 如果同时设置了sakoe_chiba_radiusitakura_max_slope, 则使用global_constraint来推断在这两者中使用哪个约束。 在这种情况下,如果global_constraint不对应任何全局约束, 则会引发RuntimeWarning并且不使用任何全局约束。

itakura_max_slopefloat or None (default: None)

Itakura平行四边形约束的最大斜率。 如果为None且global_constraint设置为“itakura”,则使用最大斜率为2。 如果同时设置了sakoe_chiba_radiusitakura_max_slope, 则使用global_constraint来推断使用哪种约束。在这种情况下,如果global_constraint不对应任何全局约束,则会引发RuntimeWarning并且不使用任何全局约束。

beBackend object or string or None

后端。如果 be 是类 NumPyBackend 的实例或字符串 “numpy”,则使用 NumPy 后端。 如果 be 是类 PyTorchBackend 的实例或字符串 “pytorch”,则使用 PyTorch 后端。 如果 beNone,则后端由输入数组决定。 更多信息请参阅我们的 专用用户指南页面

Returns:
float

相似度分数

另请参阅

lcss_path

获取LCSS的匹配路径和相似度分数

参考文献

[1]

M. Vlachos, D. Gunopoulos, 和 G. Kollios. 2002. “发现相似的多维轨迹”,在第十八届国际数据工程会议(ICDE '02)的会议录中。IEEE计算机协会,美国,673页。

示例

>>> lcss([1, 2, 3], [1., 2., 2., 3.])
1.0
>>> lcss([1, 2, 3], [1., 2., 2., 4., 7.])
1.0
>>> lcss([1, 2, 3], [1., 2., 2., 2., 3.], eps=0)
1.0
>>> lcss([1, 2, 3], [-2., 5., 7.], eps=3)
0.6666666666666666