mars.tensor.random.normal#

mars.tensor.random.normal(loc=0.0, scale=1.0, size=None, chunk_size=None, gpu=None, dtype=None)[来源]#

从正态（高斯）分布中抽取随机样本。

正态分布的概率密度函数，由德·莫弗首次推导，200年后由高斯和拉普拉斯独立推导2，通常被称为钟形曲线，因为它的特征形状（见下例）。

正态分布在自然界中经常出现。例如，它描述了受到大量微小随机扰动影响的样本的常见分布，每个扰动都有其独特的分布 2。

Parameters

loc (float 或 类似数组 的 浮点数) – 分布的平均值（“中心”）。
scale (float 或 array_like 的 浮点数) – 分布的标准差（散布或“宽度”）。
size (int 或 tuple 的 ints, 可选) – 输出形状。如果给定的形状是，例如，(m, n, k)，则 m * n * k 样本将被抽取。如果 size 为 None（默认），当 loc 和 scale 都是标量时，将返回单个值。否则，将抽取 mt.broadcast(loc, scale).size 样本。
chunk_size (int 或 tuple 的 int 或 tuple 的 ints, 可选) – 每个维度上所需的块大小
gpu (bool, 可选) – 如果为True，则在GPU上分配张量，默认为False
dtype (数据类型, 可选) – 返回的张量的数据类型。

Returns

out – 从参数化的正态分布中抽取的样本。

Return type

张量或标量

另请参阅

scipy.stats.norm: 概率密度函数，分布或累积分布函数等。

备注

高斯分布的概率密度为

\[p(x) = \frac{1}{\sqrt{ 2 \pi \sigma^2 }} e^{ - \frac{ (x - \mu)^2 } {2 \sigma^2} },\]

其中 \(\mu\) 是均值，\(\sigma\) 是标准差。标准差的平方 \(\sigma^2\) 被称为方差。

该函数在均值处达到峰值，其“分散度”随着标准差增加（该函数在\(x + \sigma\)和\(x - \sigma\) 2时达到其最大值的0.607倍）。这意味着numpy.random.normal更有可能返回接近均值的样本，而不是远离均值的样本。

参考文献

1: 维基百科，“正态分布”， http://en.wikipedia.org/wiki/Normal_distribution
2(1,2,3): P. R. Peebles Jr.，“中心极限定理”在“概率、随机变量与随机信号原理”，第4版，2001年，第51页，第51页，第125页。

示例

从分布中抽样：

>>> import mars.tensor as mt

>>> mu, sigma = 0, 0.1 # mean and standard deviation
>>> s = mt.random.normal(mu, sigma, 1000)

验证均值和方差：

>>> (abs(mu - mt.mean(s)) < 0.01).execute()
True

>>> (abs(sigma - mt.std(s, ddof=1)) < 0.01).execute()
True

显示样本的直方图，以及概率密度函数：

>>> import matplotlib.pyplot as plt
>>> count, bins, ignored = plt.hist(s.execute(), 30, normed=True)
>>> plt.plot(bins, (1/(sigma * mt.sqrt(2 * mt.pi)) *
...                mt.exp( - (bins - mu)**2 / (2 * sigma**2) )).execute(),
...          linewidth=2, color='r')
>>> plt.show()