tslearn.piecewise.分段聚合近似¶
- class tslearn.piecewise.PiecewiseAggregateApproximation(n_segments=1)[source]¶
分段聚合近似(PAA)变换。
PAA最初在[1]中提出。
- Parameters:
- n_segmentsint (default: 1)
要计算的PAA段数
注释
此方法需要一个等长时间序列的数据集。
参考文献
[1]E. Keogh & M. Pazzani. 扩展动态时间规整以用于数据挖掘应用。SIGKDD 2000, 第285–289页。
示例
>>> paa = PiecewiseAggregateApproximation(n_segments=3) >>> data = [[-1., 2., 0.1, -1., 1., -1.], [1., 3.2, -1., -3., 1., -1.]] >>> paa_data = paa.fit_transform(data) >>> paa_data.shape (2, 3, 1) >>> paa_data array([[[ 0.5 ], [-0.45], [ 0. ]], [[ 2.1 ], [-2. ], [ 0. ]]]) >>> paa.distance_paa(paa_data[0], paa_data[1]) 3.15039... >>> paa.distance(data[0], data[1]) 3.15039... >>> paa.inverse_transform(paa_data) array([[[ 0.5 ], [ 0.5 ], [-0.45], [-0.45], [ 0. ], [ 0. ]], [[ 2.1 ], [ 2.1 ], [-2. ], [-2. ], [ 0. ], [ 0. ]]])
方法
distance(ts1, ts2)计算PAA表示之间的距离,定义见[1]。
distance_paa(paa1, paa2)计算PAA表示之间的距离,定义见[1]。
fit(X[, y])拟合一个PAA表示。
fit_transform(X[, y])拟合PAA表示并相应地转换数据。
from_hdf5(path)从HDF5文件加载模型。
from_json(path)从JSON文件加载模型。
from_pickle(path)从pickle文件加载模型。
获取此对象的元数据路由。
get_params([deep])获取此估计器的参数。
计算与给定PAA表示对应的时间序列。
set_output(*[, transform])设置输出容器。
set_params(**params)设置此估计器的参数。
to_hdf5(path)将模型保存到HDF5文件。
to_json(path)将模型保存为JSON文件。
to_pickle(path)将模型保存到pickle文件中。
transform(X[, y])将时间序列数据集转换为其PAA表示。
- distance(ts1, ts2)[source]¶
计算PAA表示之间的距离,如[1]中所定义。
- Parameters:
- ts1array-like
时间序列
- ts2array-like
另一个时间序列
- Returns:
- float
PAA距离
参考文献
- distance_paa(paa1, paa2)[source]¶
计算PAA表示之间的距离,如[1]中所定义。
- Parameters:
- paa1array-like
时间序列的PAA表示
- paa2array-like
另一个时间序列的PAA表示
- Returns:
- float
PAA距离
参考文献
- fit(X, y=None)[source]¶
拟合一个PAA表示。
- Parameters:
- Xarray-like of shape (n_ts, sz, d)
时间序列数据集
- Returns:
- PiecewiseAggregateApproximation
自身
- fit_transform(X, y=None, **fit_params)[source]¶
拟合一个PAA表示并相应地转换数据。
- Parameters:
- Xarray-like of shape (n_ts, sz, d)
时间序列数据集
- Returns:
- numpy.ndarray of shape (n_ts, n_segments, d)
PAA转换后的数据集
- classmethod from_hdf5(path)[source]¶
从HDF5文件加载模型。 需要
h5pyhttp://docs.h5py.org/- Parameters:
- pathstr
文件的完整路径。
- Returns:
- Model instance
- classmethod from_json(path)[source]¶
从JSON文件加载模型。
- Parameters:
- pathstr
文件的完整路径。
- Returns:
- Model instance
- classmethod from_pickle(path)[source]¶
从pickle文件加载模型。
- Parameters:
- pathstr
文件的完整路径。
- Returns:
- Model instance
- get_metadata_routing()[source]¶
获取此对象的元数据路由。
请查看用户指南了解路由机制的工作原理。
- Returns:
- routingMetadataRequest
一个封装了路由信息的
MetadataRequest。
- get_params(deep=True)[source]¶
获取此估计器的参数。
- Parameters:
- deepbool, default=True
如果为True,将返回此估计器及其包含的子对象(如果也是估计器)的参数。
- Returns:
- paramsdict
参数名称映射到它们的值。
- inverse_transform(X)[source]¶
计算与给定PAA表示相对应的时间序列。
- Parameters:
- Xarray-like of shape (n_ts, sz_paa, d)
PAA系列的数据集。
- Returns:
- numpy.ndarray of shape (n_ts, sz_original_ts, d)
与提供的表示相对应的时间序列数据集。
- set_output(*, transform=None)[source]¶
设置输出容器。
请参阅Introducing the set_output API 以了解如何使用API的示例。
- Parameters:
- transform{“default”, “pandas”}, default=None
配置transform和fit_transform的输出。
“default”: 转换器的默认输出格式
“pandas”: DataFrame 输出
None: 转换配置未更改
- Returns:
- selfestimator instance
估计器实例。
- set_params(**params)[source]¶
设置此估计器的参数。
该方法适用于简单的估计器以及嵌套对象(如
Pipeline)。后者具有形式为<component>__<parameter>的参数,以便可以更新嵌套对象的每个组件。- Parameters:
- **paramsdict
估计器参数。
- Returns:
- selfestimator instance
估计器实例。
- to_hdf5(path)[source]¶
将模型保存到HDF5文件。 需要
h5pyhttp://docs.h5py.org/- Parameters:
- pathstr
完整文件路径。文件必须不存在。
- Raises:
- FileExistsError
如果已经存在具有相同路径的文件。