load_arrow_head#

load_arrow_head(split=None, return_X_y=True, return_type=None)[源代码][源代码]#

加载 ArrowHead 时间序列分类问题并返回 X 和 y。

参数:
split: None 或 ‘TRAIN’, ‘TEST’ 之一,可选(默认=None)

是否加载问题的训练或测试实例。默认情况下,它会加载训练和测试实例(在一个容器中)。

return_X_y: bool, 可选 (默认=True)

如果为 True,则分别返回 (特征, 目标),而不是一个包含特征和目标列的单一数据框。

return_type: 有效的Panel mtype字符串或None,可选(默认=None=”nested_univ”)

返回 X 的内存数据格式规范,None = “nested_univ” 类型。str 可以是任何支持的 sktime Panel mtype。

有关mtypes的列表,请参见datatypes.MTYPE_REGISTER;有关规范,请参见examples/AA_datatypes_and_datasets.ipynb

常用规范:

nested_univ: 单元格中的嵌套 pd.DataFrame, pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例, 变量, 时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例, 时间索引) “pd-multiindex”: 具有2级(实例, 时间) MultiIndex 的 pd.DataFrame

如果数据无法存储在请求的类型中,则会引发异常。

返回:
X: sktime 数据容器,遵循 mtype 规范 return_type

问题的时序数据,包含 n 个实例

y: 长度为 n 的一维 numpy 数组,仅在 return_X_y 为 True 时返回

X 中每个时间序列实例的类别标签。如果 return_X_y 为 False,则 y 会被附加到 X 中。

注释

维度: 单变量 序列长度: 251 训练样本: 36 测试样本: 175 类别数量: 3

箭头数据由箭头图像的轮廓组成。投射点的形状使用基于角度的方法转换为时间序列。投射点的分类是人类学中的一个重要课题。类别基于形状差异,例如箭头中凹口的存在和位置。存储库中的问题是Ye09shapelets中使用的长度归一化版本。这三个类别被称为“Avonlea”、“Clovis”和“Mix”。

数据集详情: http://timeseriesclassification.com/description.php ?Dataset=ArrowHead

示例

>>> from sktime.datasets import load_arrow_head
>>> X, y = load_arrow_head()