make_example_multi_index_dataframe¶

make_example_multi_index_dataframe(n_cases: int = 10, n_channels: int = 1, min_n_timepoints: int = 8, max_n_timepoints: int = 12, n_labels: int = 2, regression_target: bool = False, random_state=None, return_y: bool = True)[source]¶

随机生成多索引 pd.DataFrame X 和 numpy y 数据用于测试。

生成‘pd-multiindex’格式的数据。

如果返回的是分类标签（regression_target=False），将确保每个标签至少有一个样本。

Parameters:

n_casesint, default = 10: 要生成的样本数量。
n_channelsint, default = 1: 要生成的系列通道数量。
min_n_timepointsint, default = 12: 为单个系列生成的最小特征数/系列长度。
max_n_timepointsint, default = 12: 为单个系列生成的最大特征/系列长度。
n_labelsint, default = 2: 要生成的唯一标签的数量。
regression_targetbool, default = False: 如果为True，目标将是浮点数，否则为离散值。
random_stateint or None, default = None: 随机数生成的种子。
return_ybool, default = True: 返回目标变量 y。

Returns:

Xpd.DataFrame: 随机生成的潜在不等长3D数据。
ynp.ndarray: 如果 return_y 为 True，则随机生成标签。

示例

>>> from aeon.testing.data_generation import make_example_multi_index_dataframe
>>> from aeon.utils.validation.collection import get_type
>>> data, labels = make_example_multi_index_dataframe(
...     n_cases=2,
...     n_channels=2,
...     min_n_timepoints=4,
...     max_n_timepoints=6,
...     n_labels=2,
...     random_state=0,
... )
>>> print(data)  
                channel_0  channel_1
case timepoint
0    0           0.000000   1.247127
     1           1.688531   0.768763
     2           1.715891   0.595069
     3           1.694503   0.113426
1    0           2.000000   3.702387
     1           3.166900   0.284144
     2           2.115580   0.348517
     3           2.272178   0.080874
>>> print(labels)
[0 1]
>>> get_type(data)
'pd-multiindex'