InceptionTimeRegressor

class InceptionTimeRegressor(n_regressors=5, n_filters=32, n_conv_per_layer=3, kernel_size=40, use_max_pooling=True, max_pool_size=3, strides=1, dilation_rate=1, padding='same', activation='relu', use_bias=False, use_residual=True, use_bottleneck=True, bottleneck_size=32, depth=6, use_custom_filters=False, output_activation='linear', file_path='./', save_last_model=False, save_best_model=False, save_init_model=False, best_file_name='best_model', last_file_name='last_model', init_file_name='init_model', batch_size=64, use_mini_batch_size=False, n_epochs=1500, callbacks=None, random_state=None, verbose=False, loss='mean_squared_error', metrics='mean_squared_error', optimizer=None)[source]

InceptionTime 集成回归器。

Ensemble of IndividualInceptionRegressor,如[1]_中所述。 这个集成回归器是从分类器InceptionTime改编而来的

Parameters:
n_regressorsint, default = 5,

用于创建InceptionTime的集成中使用的Inception模型的数量。

depthint, default = 6,

使用的初始模块数量

n_filtersint or list of int32, default = 32,

在一个inception模块中使用的过滤器数量,如果不是一个列表,则在所有inception模块中使用相同数量的过滤器

n_conv_per_layerint or list of int, default = 3,

每个inception模块中的卷积层数量,如果不是一个列表,则在所有inception模块中使用相同数量的卷积层

kernel_sizeint or list of int, default = 40,

用于每个inception模块的头部核大小,如果不是一个列表,则在所有inception模块中使用相同的值

use_max_poolingbool or list of bool, default = True,

决定是否在inception模块中使用最大池化层,如果不是一个列表,则在所有inception模块中使用相同的设置

max_pool_sizeint or list of int, default = 3,

最大池化层的大小,如果不是一个列表,则在所有初始模块中使用相同的值

stridesint or list of int, default = 1,

每个inception模块中卷积层的核步幅,如果不是列表,则在所有inception模块中使用相同的步幅

dilation_rateint or list of int, default = 1,

每个inception模块中卷积的扩张率,如果不是一个列表,则在所有inception模块中使用相同的值

paddingstr or list of str, default = “same”,

用于每个inception模块的卷积填充类型,如果不是列表,则在所有inception模块中使用相同的填充类型

activationstr or list of str, default = “relu”,

在每个inception模块中使用的激活函数,如果不是一个列表,则在所有inception模块中使用相同的激活函数

use_biasbool or list of bool, default = False,

条件,决定是否在每个inception模块中使用卷积的偏置值,如果不是一个列表,则在所有inception模块中使用相同的值

use_residualbool, default = True,

条件是否在整个Inception中使用残差连接

use_bottleneckbool, default = True,

条件是否在整个Inception中使用瓶颈

bottleneck_sizeint, default = 32,

当 use_bottleneck = True 时的瓶颈大小

use_custom_filtersbool, default = False,

条件,决定是否在第一个初始模块中使用自定义过滤器

output_activationstr, default = “linear”,

回归器的输出激活

batch_sizeint, default = 64

每次梯度更新的样本数量。

use_mini_batch_sizebool, default = False

使用小批量大小的条件 公式 Wang 等人

n_epochsint, default = 1500

训练模型的轮数。

callbackskeras callback or list of callbacks,

默认 = None 默认的回调列表设置为 ModelCheckpoint 和 ReduceLROnPlateau。

file_pathstr, default = ‘./’

保存模型检查点回调时的文件路径

save_best_modelbool, default = False

是否保存最佳模型,如果默认使用modelcheckpoint回调,此条件如果为True,将防止自动删除从文件中保存的最佳模型,用户可以选择文件名

save_last_modelbool, default = False

是否使用基类方法 save_last_model_to_file 保存最后一个模型,最后一个训练过的 epoch

save_init_modelbool, default = False

是否保存模型的初始化。

best_file_namestr, default = “best_model”

最佳模型文件的名称,如果save_best_model设置为False,则此参数将被丢弃

last_file_namestr, default = “last_model”

最后一个模型的文件名,如果save_last_model设置为False,则此参数将被丢弃

init_file_namestr, default = “init_model”

初始化模型文件的名称,如果 save_init_model 设置为 False,则此参数将被忽略。

random_stateint, RandomState instance or None, default=None

如果int,random_state是随机数生成器使用的种子; 如果RandomState实例,random_state是随机数生成器; 如果None,随机数生成器是np.random使用的RandomState实例。 只能在CPU处理上保证种子随机数生成, GPU处理将是非确定性的。

verboseboolean, default = False

是否输出额外信息

optimizerkeras.optimizer, default = tf.keras.optimizers.Adam()

用于训练的keras优化器。

lossstr, default = “mean_squared_error”

Keras 训练损失函数的名称。

metricsstr or list[str], default=”mean_squared_error”

训练期间使用的评估指标。如果提供单个字符串指标,它将作为唯一指标使用。如果提供了一系列指标,所有指标都将用于评估。

注释

Capabilities

缺失值

多线程

单变量

多变量

不等长

训练估计

可收缩

改编自Fawaz等人的实现..[1]

以及Ismail-Fawaz等人。 https://github.com/MSD-IRIMAS/CF-4-TSC

参考文献

..[1] Fawaz 等人。InceptionTime: 寻找时间序列回归的AlexNet,数据挖掘与知识发现,34,2020

..[2] Ismail-Fawaz 等人。使用新的手工卷积滤波器进行时间序列回归的深度学习,2022年IEEE国际大数据会议。

示例

>>> from aeon.regression.deep_learning import InceptionTimeRegressor
>>> from aeon.testing.data_generation import make_example_3d_numpy
>>> X, y = make_example_3d_numpy(n_cases=10, n_channels=1, n_timepoints=12,
...                              return_y=True, regression_target=True,
...                              random_state=0)
>>> inctime = InceptionTimeRegressor(n_epochs=20,batch_size=4)  
>>> inctime.fit(X, y)  
InceptionTimeRegressor(...)

方法

clone([random_state])

获取具有相同超参数的对象的克隆。

fit(X, y)

将时间序列回归器拟合到训练数据。

fit_predict(X, y)

拟合回归器并预测X的类别标签。

get_class_tag(tag_name[, raise_error, ...])

从估计器类获取标签值(仅限类标签)。

get_class_tags()

从估计器类及其所有父类中获取类标签。

get_fitted_params([deep])

获取拟合参数。

get_metadata_routing()

Sklearn 元数据路由。

get_params([deep])

获取此估计器的参数。

get_tag(tag_name[, raise_error, ...])

从估计器类中获取标签值。

get_tags()

从估计器中获取标签。

predict(X)

预测X中时间序列的目标变量。

reset([keep])

将对象重置为初始化后的干净状态。

score(X, y[, metric, metric_params])

在X上对预测标签与真实标签进行评分。

set_params(**params)

设置此估计器的参数。

set_tags(**tag_dict)

将动态标签设置为给定值。

clone(random_state=None)[source]

获取具有相同超参数的对象克隆。

克隆是一个没有共享引用的不同对象,处于初始化后的状态。 这个函数等同于返回自身的sklearn.clone。 在值上等同于type(self)(**self.get_params(deep=False))

Parameters:
random_stateint, RandomState instance, or None, default=None

设置克隆的随机状态。如果为None,则不设置随机状态。 如果为int,random_state是随机数生成器使用的种子。 如果为RandomState实例,random_state是随机数生成器。

Returns:
estimatorobject

type(self) 的实例,self 的克隆(见上文)

fit(X, y) BaseCollectionEstimator[source]

将时间序列回归器拟合到训练数据。

Parameters:
Xnp.ndarray or list

输入数据,可以是任意数量的通道,形状为( n_cases, n_channels, n_timepoints) 的等长序列,或形状为(n_cases, n_timepoints) 的2D np.array(单变量,等长序列),或形状为[n_cases]的numpy数组列表(任意数量的通道,不等长序列), 其中每个数组为2D np.array (n_channels, n_timepoints_i), 其中n_timepoints_i是序列i的长度。其他类型的数据也是允许的,并且会被转换为上述类型之一。

不同的估计器具有处理不同类型输入的不同能力。如果self.get_tag("capability:multivariate")为False,它们无法处理多变量序列,因此要么n_channels == 1为真,要么X是形状为(n_cases, n_timepoints)的二维数组。如果self.get_tag("capability:unequal_length")为False,它们无法处理不等长的输入。在这两种情况下,如果X具有估计器不具备的能力特征,则会引发ValueError

ynp.ndarray

1D np.array of float, 形状为 (n_cases) - 回归目标 (真实值)用于拟合与X中实例索引对应的索引。

Returns:
selfBaseRegressor

自我引用。

注释

通过创建一个拟合模型来改变状态,该模型更新以“_”结尾的属性,并将is_fitted标志设置为True。

fit_predict(X, y) ndarray[source]

拟合回归器并预测X的类别标签。

fit_predict 仅使用训练数据生成预测估计值。 默认情况下,这是通过10倍交叉验证进行的,尽管一些估计器可能会使用特殊技术,如袋外估计或留一法交叉验证。

重写 _fit_predict 的回归器将具有 capability:train_estimate 标签设置为 True。

通常,这与在整个训练数据上拟合然后进行训练预测不同。要做到这一点,你应该调用 fit(X,y).predict(X)

Parameters:
Xnp.ndarray or list

输入数据,任意数量的通道,形状为( n_cases, n_channels, n_timepoints) 的等长序列或形状为(n_cases, n_timepoints) 的2D np.array(单变量,等长序列)或形状为[n_cases]的numpy数组列表(任意数量的通道,不等长序列), 其中(n_channels, n_timepoints_i), 其中n_timepoints_i是序列i的长度。允许其他类型并转换为上述类型之一。

不同的估计器具有处理不同类型输入的不同能力。如果self.get_tag("capability:multivariate")为False,它们无法处理多变量序列,因此要么n_channels == 1为真,要么X是形状为(n_cases, n_timepoints)的二维数组。如果self.get_tag("capability:unequal_length")为False,它们无法处理不等长的输入。在这两种情况下,如果X具有估计器不具备的能力特征,则会引发ValueError

ynp.ndarray

1D np.array of float, 形状为 (n_cases) - 回归目标 (真实值)用于拟合与X中实例索引对应的索引。

Returns:
predictionsnp.ndarray

1D np.array of float, 形状为 (n_cases) - 预测的回归标签 索引对应于 X 中的实例索引

classmethod get_class_tag(tag_name, raise_error=True, tag_value_default=None)[source]

从估计器类获取标签值(仅限类标签)。

Parameters:
tag_namestr

标签值的名称。

raise_errorbool, default=True

当未找到标签时是否引发ValueError。

tag_value_defaultany type, default=None

如果未找到标签且未引发错误,则使用默认/回退值。

Returns:
tag_value

cls中tag_name标签的值。 如果未找到,当raise_error为True时返回错误,否则返回tag_value_default

Raises:
ValueError

如果 raise_error 为 True 并且 tag_name 不在 self.get_tags().keys()

示例

>>> from aeon.classification import DummyClassifier
>>> DummyClassifier.get_class_tag("capability:multivariate")
True
classmethod get_class_tags()[source]

从估计器类及其所有父类获取类标签。

Returns:
collected_tagsdict

标签名称和标签值对的字典。 通过嵌套继承从_tags类属性中收集。 这些不会被set_tags或类__init__调用设置的动态标签覆盖。

get_fitted_params(deep=True)[source]

获取拟合参数。

State required:

需要状态为“已拟合”。

Parameters:
deepbool, default=True

如果为True,将返回此估计器的拟合参数以及包含的作为估计器的子对象。

Returns:
fitted_paramsdict

拟合参数名称映射到它们的值。

get_metadata_routing()[source]

Sklearn 元数据路由。

不支持 aeon 估计器。

get_params(deep=True)[source]

获取此估计器的参数。

Parameters:
deepbool, default=True

如果为True,将返回此估计器及其包含的子对象的参数。

Returns:
paramsdict

参数名称映射到它们的值。

get_tag(tag_name, raise_error=True, tag_value_default=None)[source]

从估计器类获取标签值。

包括动态和覆盖的标签。

Parameters:
tag_namestr

要检索的标签名称。

raise_errorbool, default=True

当未找到标签时是否引发ValueError。

tag_value_defaultany type, default=None

如果未找到标签且未引发错误,则使用默认/回退值。

Returns:
tag_value

自身中tag_name标签的值。 如果未找到,当raise_error为True时返回错误,否则返回tag_value_default

Raises:
ValueError

如果 raise_error 是 True 并且 tag_name 不在 self.get_tags().keys()

示例

>>> from aeon.classification import DummyClassifier
>>> d = DummyClassifier()
>>> d.get_tag("capability:multivariate")
True
get_tags()[source]

从估计器中获取标签。

包括动态和覆盖的标签。

Returns:
collected_tagsdict

标签名称和标签值对的字典。 通过嵌套继承从_tags类属性收集,然后从__init__set_tags中收集任何被覆盖和新添加的标签。

predict(X) ndarray[source]

预测X中时间序列的目标变量。

Parameters:
Xnp.ndarray or list

输入数据,可以是任意数量的通道,形状为( n_cases, n_channels, n_timepoints) 的等长序列,或形状为(n_cases, n_timepoints) 的2D np.array(单变量,等长序列),或形状为[n_cases]的numpy数组列表(任意数量的通道,不等长序列),其中每个数组为2D np.array (n_channels, n_timepoints_i), 其中n_timepoints_i是序列i的长度。 其他类型的数据也是允许的,并且会被转换为上述类型之一。

不同的估计器具有处理不同类型输入的不同能力。如果self.get_tag("capability:multivariate")为False,它们无法处理多变量序列,因此要么n_channels == 1为真,要么X是形状为(n_cases, n_timepoints)的二维数组。如果self.get_tag("capability:unequal_length")为False,它们无法处理不等长的输入。在这两种情况下,如果X具有估计器不具备的能力特征,则会引发ValueError

Returns:
predictionsnp.ndarray

1D np.array of float, 形状为 (n_cases) - 预测的回归标签 索引对应于 X 中的实例索引

reset(keep=None)[source]

将对象重置为初始化后的干净状态。

在调用self.reset()之后,self的值等于或类似于type(self)(**self.get_params(deep=False)),假设没有使用keep保留其他属性。

Detailed behaviour:
removes any object attributes, except:

超参数(__init__的参数) 包含双下划线的对象属性,即字符串“__”

使用当前超参数的值(get_params的结果)运行__init__

Not affected by the reset are:

包含双下划线的对象属性 类和对象方法,类属性 在keep参数中指定的任何属性

Parameters:
keepNone, str, or list of str, default=None

如果为None,则除了超参数外,所有属性都将被移除。 如果为str,则仅保留具有此名称的属性。 如果为str列表,则仅保留具有这些名称的属性。

Returns:
selfobject

自我引用。

score(X, y, metric='r2', metric_params=None) float[source]

在X上预测标签与真实标签的得分。

Parameters:
Xnp.ndarray or list

输入数据,任意数量的通道,形状为( n_cases, n_channels, n_timepoints) 的等长序列或形状为(n_cases, n_timepoints) 的2D np.array(单变量,等长序列)或形状为[n_cases]的numpy数组列表(任意数量的通道,不等长序列), 其中(n_channels, n_timepoints_i), 其中n_timepoints_i是序列i的长度。允许其他类型并转换为上述类型之一。

不同的估计器具有处理不同类型输入的不同能力。如果self.get_tag("capability:multivariate")为False,它们无法处理多变量序列,因此要么n_channels == 1为真,要么X是形状为(n_cases, n_timepoints)的二维数组。如果self.get_tag("capability:unequal_length")为False,它们无法处理不等长的输入。在这两种情况下,如果X具有估计器不具备的能力特征,则会引发ValueError

ynp.ndarray

1D np.array of float, 形状为 (n_cases) - 回归目标 (真实值)用于拟合与X中实例索引对应的索引。

metricUnion[str, callable], default=”r2”,

定义用于测试模型拟合度的评分指标。有关支持的字符串参数,请查看sklearn.metrics.get_scorer_names

metric_paramsdict, default=None,

包含要传递给评分函数的参数。如果为None,则不传递任何参数。

Returns:
scorefloat

预测(X)与y的MSE分数

set_params(**params)[source]

设置此估计器的参数。

该方法适用于简单的估计器以及嵌套对象(如Pipeline)。后者具有<component>__<parameter>形式的参数,以便可以更新嵌套对象的每个组件。

Parameters:
**paramsdict

估计器参数。

Returns:
selfestimator instance

估计器实例。

set_tags(**tag_dict)[source]

将动态标签设置为给定值。

Parameters:
**tag_dictdict

标签名称和标签值对的字典。

Returns:
selfobject

自我引用。