mars.learn.datasets.make_regression#

mars.learn.datasets.make_regression(n_samples=100, n_features=100, *, n_informative=10, n_targets=1, bias=0.0, effective_rank=None, tail_strength=0.5, noise=0.0, shuffle=True, coef=False, random_state=None)[来源]#

生成一个随机回归问题。

输入集可以是良好条件的(默认)或具有低秩-厚尾奇异特征。有关更多细节,请参见 make_low_rank_matrix()

输出是通过将一个(可能有偏差的)随机线性回归模型应用于之前生成的输入和一些具有可调规模的高斯中心噪声生成的,模型中包含n_informative个非零回归变量。

用户指南中阅读更多内容。

Parameters
  • n_samples (int, default=100) – 样本数量。

  • n_features (int, default=100) – 特征数量。

  • n_informative (int, default=10) – 有用特征的数量,即用于构建生成输出的线性模型的特征数量。

  • n_targets (int, default=1) – 回归目标的数量,即与样本相关的y输出向量的维度。默认情况下,输出是一个标量。

  • bias (float, default=0.0) – 基本线性模型中的偏置项。

  • effective_rank (int, default=None) –

    if not None:

    所需的近似奇异向量的数量,以通过线性组合解释大部分输入数据。使用这种奇异谱作为输入可以使生成器重现实践中常观察到的相关性。

    if None:

    输入集是良好条件的,中心化的,并且具有单位方差的高斯分布。

  • tail_strength (float, default=0.5) – 如果effective_rank不为None,奇异值分布的肥胖噪声尾部的相对重要性。当为浮点数时,它应该介于0和1之间。

  • 噪声 (浮点数, 默认=0.0) – 应用于输出的高斯噪声的标准偏差。

  • shuffle (bool, default=True) – 打乱样本和特征。

  • coef (bool, default=False) – 如果为真,则返回基础线性模型的系数。

  • random_state (int, RandomState 实例None, 默认=None) – 决定数据集创建的随机数生成。传入一个整数以便在多个函数调用中获得可重复的输出。请参见 术语表

Returns

  • X (形状为 (n_samples, n_features) 的张量) – 输入样本。

  • y (形状为 (n_samples,) 或 (n_samples, n_targets) 的张量) – 输出值。

  • coef (形状为 (n_features,) 或 (n_features, n_targets) 的张量) – 基础线性模型的系数。仅当 coef 为 True 时返回。