sklearn.preprocessing#

方法用于缩放、中心化、归一化、二值化等操作。

User guide. See the 数据预处理 section for further details.

Binarizer

二值化数据(根据阈值将特征值设置为0或1)。

FunctionTransformer

构建一个来自任意可调用对象的转换器。

KBinsDiscretizer

将连续数据分箱到区间中。

KernelCenterer

中心化任意核矩阵 \(K\)

LabelBinarizer

将标签二值化以进行一对多的分类。

LabelEncoder

编码目标标签,使其值在0到n_classes-1之间。

MaxAbsScaler

缩放每个特征以其最大绝对值。

MinMaxScaler

转换特征通过将每个特征缩放到给定范围。

MultiLabelBinarizer

转换可迭代对象和多标签格式之间的转换。

Normalizer

标准化样本为单位范数。

OneHotEncoder

将分类特征编码为独热数值数组。

OrdinalEncoder

将分类特征编码为整数数组。

PolynomialFeatures

生成多项式和交互特征。

PowerTransformer

应用幂变换特征以使数据更接近高斯分布。

QuantileTransformer

使用分位数信息转换特征。

RobustScaler

使用对异常值具有鲁棒性的统计数据来缩放特征。

SplineTransformer

生成单变量B样条基函数。

StandardScaler

标准化特征通过去除均值并缩放到单位方差。

TargetEncoder

目标编码器用于回归和分类目标。

add_dummy_feature

增强数据集以添加额外的虚拟特征。

binarize

布尔阈值处理数组类或scipy.sparse矩阵。

label_binarize

二值化标签以一对多的方式进行。

maxabs_scale

将每个特征缩放到 [-1, 1] 范围而不破坏稀疏性。

minmax_scale

转换特征通过将每个特征缩放到给定范围。

normalize

缩放输入向量以单位范数(向量长度)。

power_transform

参数化、单调变换使数据更符合高斯分布。

quantile_transform

使用分位数信息转换特征。

robust_scale

标准化一个数据集沿着任何轴。

scale

标准化一个数据集沿着任意轴。