dask.array.random.choice

dask.array.random.choice

dask.array.random.choice(*args, **kwargs)

从一个给定的1-D数组生成一个随机样本

此文档字符串是从 numpy.random.mtrand.RandomState.choice 复制而来的。

Dask 版本可能存在一些不一致性。

1.7.0 新版功能.

备注

新代码应使用 ~numpy.random.Generator 实例的 ~numpy.random.Generator.choice 方法;请参阅 随机快速入门

警告

此函数使用 C-long 数据类型,在 Windows 上为 32 位,在其他 64 位平台上为 64 位(在 32 位平台上为 32 位)。自 NumPy 2.0 起,NumPy 的默认整数在 32 位平台上为 32 位,在 64 位平台上为 64 位。

参数
a1-D 数组类或整数

如果是一个 ndarray,则从其元素中生成随机样本。如果是一个 int,则随机样本的生成方式如同它是 np.arange(a)

大小int 或 int 的元组,可选

输出形状。如果给定的形状是,例如,(m, n, k),那么会抽取 m * n * k 个样本。默认是 None,在这种情况下会返回一个单一值。

替换布尔值,可选

样本是否为有放回抽样。默认为True,意味着值``a``可以被多次选中。

p一维数组类,可选

a 中每个条目相关的概率。如果未给出,样本假设 a 中所有条目的均匀分布。

返回
示例单个项目或 ndarray

生成的随机样本

Raises
ValueError

如果 a 是 int 且小于零,如果 a 或 p 不是一维的,如果 a 是大小为 0 的类数组对象,如果 p 不是概率向量,如果 a 和 p 的长度不同,或者如果 replace=False 且样本大小大于总体大小

参见

randint, shuffle, permutation
random.Generator.choice

应在新的代码中使用

注释

通过 p 设置用户指定的概率使用了一个比默认更通用但效率较低的采样器。即使 p 的每个元素都是 1 / len(a),通用采样器生成的样本也与优化采样器不同。

使用此函数无法从二维数组中随机抽取行,但可以通过 Generator.choiceaxis 关键字实现。

示例

从 np.arange(5) 生成一个大小为 3 的均匀随机样本:

>>> np.random.choice(5, 3)  
array([0, 3, 4]) # random
>>> #This is equivalent to np.random.randint(0,5,3)

从 np.arange(5) 生成一个大小为 3 的非均匀随机样本:

>>> np.random.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0])  
array([3, 3, 0]) # random

从 np.arange(5) 中生成一个大小为 3 的无放回均匀随机样本:

>>> np.random.choice(5, 3, replace=False)  
array([3,1,0]) # random
>>> #This is equivalent to np.random.permutation(np.arange(5))[:3]

从 np.arange(5) 中生成一个大小为 3 的非均匀随机样本,不进行替换:

>>> np.random.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0])  
array([2, 3, 0]) # random

以上任何一项都可以用任意类似数组的对象代替整数来重复。例如:

>>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']  
>>> np.random.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])  
array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'], # random
      dtype='<U11')