mars.tensor.random.lognormal#
- mars.tensor.random.lognormal(mean=0.0, sigma=1.0, size=None, chunk_size=None, gpu=None, dtype=None)[来源]#
从对数正态分布中抽样。
从具有指定均值、标准差和数组形状的对数正态分布中抽取样本。 注意,均值和标准差并不是分布本身的值,而是它所衍生的基础正态分布的值。
- Parameters
mean (float 或 数组类型的 浮点数, 可选) – 基础正态分布的平均值。默认值为 0。
sigma (float 或 array_like 的 浮点数, 可选) – 基本正态分布的标准差。应该大于零。默认为 1.
size (int 或 tuple 的 ints, 可选) – 输出形状。如果给定的形状是,例如,
(m, n, k),则m * n * k个样本被抽取。如果 size 是None(默认), 如果mean和sigma都是标量,则返回单个值。 否则,np.broadcast(mean, sigma).size个样本被抽取。chunk_size (int 或 tuple 的 int 或 tuple 的 ints, 可选) – 每个维度上所需的块大小
gpu (bool, 可选) – 如果为True,则在GPU上分配张量,默认为False
dtype (数据类型, 可选) – 返回的张量的数据类型。
- Returns
out – 从参数化的对数正态分布中抽取的样本。
- Return type
张量或标量
另请参阅
scipy.stats.lognorm概率密度函数,分布,累积分布函数等。
备注
如果log(x)服从正态分布,则变量x具有对数正态分布。对数正态分布的概率密度函数为:
\[p(x) = \frac{1}{\sigma x \sqrt{2\pi}} e^{(-\frac{(ln(x)-\mu)^2}{2\sigma^2})}\]其中 \(\mu\) 是均值,\(\sigma\) 是变量的对数正态分布的标准差。 如果一个随机变量是大量独立、同分布变量的 乘积,则结果为对数正态分布;而如果变量是大量独立、同分布变量的 和,则结果为正态分布。
参考文献
- 1
Limpert, E., Stahel, W. A., and Abbt, M., “对数正态分布在科学中的应用:关键和线索,” BioScience, 第51卷,第5期,2001年5月。 http://stat.ethz.ch/~stahel/lognormal/bioscience.pdf
- 2
Reiss,R.D. 和 Thomas,M.,“极值的统计分析,” 巴塞尔:Birkhauser Verlag,2001年,第31-32页。
示例
从分布中抽样:
>>> import mars.tensor as mt
>>> mu, sigma = 3., 1. # mean and standard deviation >>> s = mt.random.lognormal(mu, sigma, 1000)
显示样本的直方图,以及概率密度函数:
>>> import matplotlib.pyplot as plt >>> count, bins, ignored = plt.hist(s.execute(), 100, normed=True, align='mid')
>>> x = mt.linspace(min(bins), max(bins), 10000) >>> pdf = (mt.exp(-(mt.log(x) - mu)**2 / (2 * sigma**2)) ... / (x * sigma * mt.sqrt(2 * mt.pi)))
>>> plt.plot(x.execute(), pdf.execute(), linewidth=2, color='r') >>> plt.axis('tight') >>> plt.show()
演示从均匀分布中随机抽样的乘积可以很好地拟合对数正态概率密度函数。
>>> # Generate a thousand samples: each is the product of 100 random >>> # values, drawn from a normal distribution. >>> b = [] >>> for i in range(1000): ... a = 10. + mt.random.random(100) ... b.append(mt.product(a).execute())
>>> b = mt.array(b) / mt.min(b) # scale values to be positive >>> count, bins, ignored = plt.hist(b.execute(), 100, normed=True, align='mid') >>> sigma = mt.std(mt.log(b)) >>> mu = mt.mean(mt.log(b))
>>> x = mt.linspace(min(bins), max(bins), 10000) >>> pdf = (mt.exp(-(mt.log(x) - mu)**2 / (2 * sigma**2)) ... / (x * sigma * mt.sqrt(2 * mt.pi)))
>>> plt.plot(x.execute(), pdf.execute(), color='r', linewidth=2) >>> plt.show()