make_example_multi_index_dataframe¶
- make_example_multi_index_dataframe(n_cases: int = 10, n_channels: int = 1, min_n_timepoints: int = 8, max_n_timepoints: int = 12, n_labels: int = 2, regression_target: bool = False, random_state=None, return_y: bool = True)[source]¶
随机生成多索引 pd.DataFrame X 和 numpy y 数据用于测试。
生成‘pd-multiindex’格式的数据。
如果返回的是分类标签(regression_target=False),将确保每个标签至少有一个样本。
- Parameters:
- n_casesint, default = 10
要生成的样本数量。
- n_channelsint, default = 1
要生成的系列通道数量。
- min_n_timepointsint, default = 12
为单个系列生成的最小特征数/系列长度。
- max_n_timepointsint, default = 12
为单个系列生成的最大特征/系列长度。
- n_labelsint, default = 2
要生成的唯一标签的数量。
- regression_targetbool, default = False
如果为True,目标将是浮点数,否则为离散值。
- random_stateint or None, default = None
随机数生成的种子。
- return_ybool, default = True
返回目标变量 y。
- Returns:
- Xpd.DataFrame
随机生成的潜在不等长3D数据。
- ynp.ndarray
如果 return_y 为 True,则随机生成标签。
示例
>>> from aeon.testing.data_generation import make_example_multi_index_dataframe >>> from aeon.utils.validation.collection import get_type >>> data, labels = make_example_multi_index_dataframe( ... n_cases=2, ... n_channels=2, ... min_n_timepoints=4, ... max_n_timepoints=6, ... n_labels=2, ... random_state=0, ... ) >>> print(data) channel_0 channel_1 case timepoint 0 0 0.000000 1.247127 1 1.688531 0.768763 2 1.715891 0.595069 3 1.694503 0.113426 1 0 2.000000 3.702387 1 3.166900 0.284144 2 2.115580 0.348517 3 2.272178 0.080874 >>> print(labels) [0 1] >>> get_type(data) 'pd-multiindex'