pyts.datasets.load_coffee

pyts.datasets.load_coffee(return_X_y=False)[来源]

加载并返回咖啡数据集。

食品光谱图在化学计量学中用于分类食品类型,这项任务在食品安全和质量保证方面具有明显的应用价值。咖啡数据集是一个二分类问题,用于区分罗布斯塔和阿拉比卡咖啡豆。

训练样本数 28
测试样本 28
时间戳 286
类别数 2
Parameters:
return_X_y : bool (default = False)

如果为True,则返回 (data_train, data_test, target_train, target_test) 而不是返回 Bunch对象。

Returns:
data : Bunch

类似字典的对象,具有以下属性:

data_train : array of floats

训练集中的时间序列。

data_test : array of floats

测试集中的时间序列。

target_train : array of integers

训练集中的分类标签。

target_test : array of integers

测试集中的分类标签。

DESCR : str

数据集的完整描述。

url : str

数据集的URL地址。

(data_train, data_test, target_train, target_test) : tuple if return_X_y is True

参考文献

[1]R. Briandet, E.K. Kemsley, 和 R.H. Wilson, "通过傅里叶变换红外光谱和化学计量学鉴别速溶咖啡中的阿拉比卡和罗布斯塔品种"。《农业与食品化学杂志》(1996)。
[2]A. Bagnall, L. Davis, J. Hills 和 J. Lines, "基于转换的集成方法用于时间序列分类"。SDM (2012).
[3]UCR档案中PigCVP数据集的条目

示例

>>> from pyts.datasets import load_coffee
>>> bunch = load_coffee()
>>> bunch.data_train.shape
(28, 286)
>>> X_train, X_test, y_train, y_test = load_coffee(return_X_y=True)
>>> X_train.shape
(28, 286)