pyts.datasets.load_coffee¶
-
pyts.datasets.load_coffee(return_X_y=False)[来源]¶ 加载并返回咖啡数据集。
食品光谱图在化学计量学中用于分类食品类型,这项任务在食品安全和质量保证方面具有明显的应用价值。咖啡数据集是一个二分类问题,用于区分罗布斯塔和阿拉比卡咖啡豆。
训练样本数 28 测试样本 28 时间戳 286 类别数 2 Parameters: - return_X_y : bool (default = False)
如果为True,则返回
(data_train, data_test, target_train, target_test)而不是返回 Bunch对象。
Returns: - data : Bunch
类似字典的对象,具有以下属性:
- data_train : array of floats
训练集中的时间序列。
- data_test : array of floats
测试集中的时间序列。
- target_train : array of integers
训练集中的分类标签。
- target_test : array of integers
测试集中的分类标签。
- DESCR : str
数据集的完整描述。
- url : str
数据集的URL地址。
- (data_train, data_test, target_train, target_test) : tuple if
return_X_yis True
参考文献
[1] R. Briandet, E.K. Kemsley, 和 R.H. Wilson, "通过傅里叶变换红外光谱和化学计量学鉴别速溶咖啡中的阿拉比卡和罗布斯塔品种"。《农业与食品化学杂志》(1996)。 [2] A. Bagnall, L. Davis, J. Hills 和 J. Lines, "基于转换的集成方法用于时间序列分类"。SDM (2012). [3] UCR档案中PigCVP数据集的条目 示例
>>> from pyts.datasets import load_coffee >>> bunch = load_coffee() >>> bunch.data_train.shape (28, 286) >>> X_train, X_test, y_train, y_test = load_coffee(return_X_y=True) >>> X_train.shape (28, 286)