NaN标签编码器#

class pytorch_forecasting.data.encoders.NaNLabelEncoder(add_nan: bool = False, warn: bool = True)[来源]#

基础: InitialParameterRepresenterMixIn, BaseEstimator, TransformerMixin, TransformMixIn

标签编码器,可以选择性地在转换时将nan和未知类别始终编码为类别 0

初始化 NaNLabelEncoder

Returns:

  • add_nan – 是否强制将nan编码为0

  • warn – 如果由于项目未知而添加了额外的nans,是否发出警告

Inherited-members:

方法

extra_repr()

fit(y[, overwrite])

拟合变换器

fit_transform(y[, overwrite])

拟合和转化数据。

get_metadata_routing()

获取此对象的元数据路由。

get_parameters([groups, group_names])

获取给定组的拟合缩放参数。

get_params([deep])

获取此估计器的参数。

get_transform(转换)

返回变换函数。

inverse_preprocess(y)

逆向预处理重新缩放的数据(例如,取指数)。

inverse_transform(y)

解码数据,即将整数转换为标签。

is_numeric(y)

确定序列是否为数字。

preprocess(y)

预处理输入数据(例如,取对数)。

set_fit_request(*[, overwrite])

传递给fit方法的请求元数据。

set_output(*[, transform])

设置输出容器。

set_params(**params)

设置此估计器的参数。

set_transform_request(*[, ignore_na, ...])

传递给transform方法的请求元数据。

transform(y[, return_norm, target_scale, ...])

用整数编码可迭代对象。

属性

转换

fit(y: Series, overwrite: bool = False)[来源]#

拟合变换器

Parameters:
  • y (pd.Series) – 用于拟合的输入数据

  • overwrite (bool) – 是否覆盖当前映射或者是添加到现有映射中。

Returns:

NaN标签编码器

Return type:

自己

fit_transform(y: Series, overwrite: bool = False) ndarray[来源]#

拟合和转化数据。

Parameters:
  • y (pd.Series) – 输入数据

  • overwrite (bool) – 是否覆盖当前映射或添加到其中。

Returns:

编码数据

Return type:

np.ndarray

get_parameters(groups=None, group_names=None) ndarray[来源]#

获取给定组的拟合缩放参数。

所有参数均未使用 - 存在是为了兼容性。

Returns:

零数组。

Return type:

np.ndarray

inverse_transform(y: Tensor | ndarray) ndarray[来源]#

解码数据,即将整数转换为标签。

Parameters:

y (联合[torch.Tensor, np.ndarray]) – 编码数据

Raises:

KeyError – 如果未知元素应该被解码

Returns:

解码数据

Return type:

np.ndarray

static is_numeric(y: Series) bool[来源]#

判断系列是否为数字类型。如果系列是具有基础整数的分类类型,也会返回 True。

Parameters:

y (pd.Series) – 要进行评估的序列

Returns:

如果系列是数字,则为真

Return type:

布尔值

set_fit_request(*, overwrite: bool | None | str = '$UNCHANGED$') NaN标签编码器#

传递给fit方法的请求元数据。

请注意,该方法仅在 enable_metadata_routing=True 的情况下相关(见 sklearn.set_config())。有关路由机制如何工作的说明,请参见 用户指南

每个参数的选项为:

  • True: 请求元数据,如果提供,则传递给 fit。如果未提供元数据,则该请求将被忽略。

  • False: 未请求元数据,元估计器将不会将其传递给 fit

  • None: 未请求元数据,如果用户提供了,元估计器将引发错误。

  • str: 元数据应该通过这个给定的别名传递给元估计器,而不是原始名称。

默认值(sklearn.utils.metadata_routing.UNCHANGED)保留现有请求。这允许您更改某些参数的请求,而不更改其他参数。

在1.3版本中新增。

注意

此方法仅在此估计器作为元估计器的子估计器时相关,例如在一个 Pipeline内部使用。否则它没有效果。

Parameters:

overwrite (str, True, False, 或 None, default=sklearn.utils.metadata_routing.UNCHANGED) – 用于 fitoverwrite 参数的元数据路由。

Returns:

self – 更新后的对象。

Return type:

对象

set_transform_request(*, ignore_na: bool | None | str = '$UNCHANGED$', return_norm: bool | None | str = '$UNCHANGED$', target_scale: bool | None | str = '$UNCHANGED$') NaN标签编码器#

传递给transform方法的请求元数据。

请注意,该方法仅在 enable_metadata_routing=True 的情况下相关(见 sklearn.set_config())。有关路由机制如何工作的说明,请参见 用户指南

每个参数的选项为:

  • True: 请求元数据,如果提供,则传递给 transform。如果未提供元数据,则请求将被忽略。

  • False: 未请求元数据,元估计器将不会将其传递给 transform

  • None: 未请求元数据,如果用户提供了,元估计器将引发错误。

  • str: 元数据应该通过这个给定的别名传递给元估计器,而不是原始名称。

默认值(sklearn.utils.metadata_routing.UNCHANGED)保留现有请求。这允许您更改某些参数的请求,而不更改其他参数。

在1.3版本中新增。

注意

此方法仅在此估计器作为元估计器的子估计器时相关,例如在一个 Pipeline内部使用。否则它没有效果。

Parameters:
  • ignore_na (str, True, False, 或 None, 默认为sklearn.utils.metadata_routing.UNCHANGED) – transform中的ignore_na参数的元数据路由。

  • return_norm (str, True, False, 或 None, 默认=sklearn.utils.metadata_routing.UNCHANGED) – transformreturn_norm 参数的元数据路由。

  • target_scale (str, True, False, 或 None, 默认=sklearn.utils.metadata_routing.UNCHANGED) – transformtarget_scale 参数的元数据路由。

Returns:

self – 更新后的对象。

Return type:

对象

transform(y: Iterable, return_norm: bool = False, target_scale=None, ignore_na: bool = False) Tensor | ndarray[来源]#

用整数编码可迭代对象。

Parameters:
  • y (可迭代对象) – 需要编码的可迭代对象

  • return_norm – 仅为与其他编码器的兼容性而存在 - 如果为真,则返回一个元组。

  • target_scale – 仅用于与其他编码器兼容 - 没有影响。

  • ignore_na (bool) – 是否忽略na值并将其映射为零(这与add_nan=True选项不同,该选项仅将NAs映射为零,而此选项将首类和NAs映射为零)

Returns:

根据输入类型返回编码数据作为torch张量或numpy数组

Return type:

联合[torch.Tensor, np.ndarray]