ray.data.Dataset.to_numpy_refs#

Dataset.to_numpy_refs(*, column: str | None = None) List[ObjectRef[numpy.ndarray]][源代码]#

将此 Dataset 转换为分布式的 NumPy ndarray 集合或 NumPy ndarray 的字典。

这仅支持可转换为 NumPy ndarrays 的数据集。此函数会引发数据的副本。对于底层数据的零拷贝访问,请考虑使用 Dataset.to_arrow_refs()Dataset.iter_internal_ref_bundles()

示例

>>> import ray
>>> ds = ray.data.range(10, override_num_blocks=2)
>>> refs = ds.to_numpy_refs()
>>> len(refs)
2

时间复杂度:O(数据集大小 / 并行度)

参数:
  • column – 要转换为 numpy 的列名。如果为 None,则使用所有列。如果指定了多个列,则每个列都会返回

  • None. (future represents a dict of ndarrays. Defaults to)

返回:

从此数据集创建的远程 NumPy ndarray 列表。

开发者API: 此API可能会在Ray的次要版本之间发生变化。