sklearn.preprocessing#
方法用于缩放、中心化、归一化、二值化等操作。
User guide. See the 数据预处理 section for further details.
二值化数据(根据阈值将特征值设置为0或1)。 |
|
构建一个来自任意可调用对象的转换器。 |
|
将连续数据分箱到区间中。 |
|
中心化任意核矩阵 \(K\) 。 |
|
将标签二值化以进行一对多的分类。 |
|
编码目标标签,使其值在0到n_classes-1之间。 |
|
缩放每个特征以其最大绝对值。 |
|
转换特征通过将每个特征缩放到给定范围。 |
|
转换可迭代对象和多标签格式之间的转换。 |
|
标准化样本为单位范数。 |
|
将分类特征编码为独热数值数组。 |
|
将分类特征编码为整数数组。 |
|
生成多项式和交互特征。 |
|
应用幂变换特征以使数据更接近高斯分布。 |
|
使用分位数信息转换特征。 |
|
使用对异常值具有鲁棒性的统计数据来缩放特征。 |
|
生成单变量B样条基函数。 |
|
标准化特征通过去除均值并缩放到单位方差。 |
|
目标编码器用于回归和分类目标。 |
|
增强数据集以添加额外的虚拟特征。 |
|
布尔阈值处理数组类或scipy.sparse矩阵。 |
|
二值化标签以一对多的方式进行。 |
|
将每个特征缩放到 [-1, 1] 范围而不破坏稀疏性。 |
|
转换特征通过将每个特征缩放到给定范围。 |
|
缩放输入向量以单位范数(向量长度)。 |
|
参数化、单调变换使数据更符合高斯分布。 |
|
使用分位数信息转换特征。 |
|
标准化一个数据集沿着任何轴。 |
|
标准化一个数据集沿着任意轴。 |