mars.learn.preprocessing.normalize#

mars.learn.preprocessing.normalize(X, norm='l2', axis=1, copy=True, return_norm=False)[来源]#

将输入向量单独缩放到单位范数(向量长度)。

Parameters
  • X ({数组样式, 稀疏矩阵}, 形状 [样本数, 特征数]) – 要进行标准化的数据,按元素处理。 scipy.sparse 矩阵应采用 CSR 格式,以避免不必要的复制。

  • norm ('l1', 'l2', 或 'max', 可选 (默认是 'l2')) – 用于标准化每个非零样本(或如果轴为 0 则为每个非零特征)的范数。

  • axis (01, 可选 (默认为 1)) – 用于标准化数据的轴。如果为 1,则独立标准化每个样本;否则(如果为 0),则标准化每个特征。

  • copy (boolean, optional, default True) – 设置为 False 以执行就地行标准化并避免复制(如果输入已经是一个张量并且如果轴为 1)。

  • return_norm (boolean, 默认值为 False) – 是否返回计算出的范数

Returns

  • X ({数组类型,稀疏矩阵}, 形状 [n_samples, n_features]) – 规范化的输入 X。

  • norms (张量,形状 [n_samples] 如果 axis=1 否则 [n_features]) – 沿给定轴的 X 的范数的张量。 当 X 为稀疏时,将抛出 NotImplementedError 对于范数 ‘l1’ 或 ‘l2’。

另请参阅

Normalizer

使用 Transformer API 进行标准化(例如,作为预处理 mars.learn.pipeline.Pipeline 的一部分)。