输入/输出#

I/O 实用工具类#

pylibcudf.io.types.ColumnEncoding#

另请参阅 cudf::column_encoding

枚举成员

  • USE_DEFAULT

  • DICTIONARY

  • PLAIN

  • DELTA_BINARY_PACKED

  • DELTA_LENGTH_BYTE_ARRAY

  • DELTA_BYTE_ARRAY

  • BYTE_STREAM_SPLIT

  • DIRECT

  • DIRECT_V2

  • DICTIONARY_V2

pylibcudf.io.types.CompressionType#

另请参阅 cudf::compression_type

枚举成员

  • NONE

  • AUTO

  • SNAPPY

  • GZIP

  • BZIP2

  • BROTLI

  • ZIP

  • XZ

  • ZLIB

  • LZ4

  • LZO

  • ZSTD

pylibcudf.io.types.DictionaryPolicy#

另请参阅 cudf::dictionary_policy

枚举成员

  • NEVER

  • ADAPTIVE

  • ALWAYS

pylibcudf.io.types.JSONRecoveryMode#

另请参阅 cudf::json_recovery_mode_t

枚举成员

  • FAIL

  • RECOVER_WITH_NULL

pylibcudf.io.types.QuoteStyle#

另请参阅 cudf::quote_style

枚举成员

  • MINIMAL

  • ALL

  • NONNUMERIC

  • NONE

class pylibcudf.io.types.SinkInfo(list sinks)#

一个包含有关写入数据的目标(接收器)详细信息的类。

更多详情,请参见 cudf::io::sink_info

Parameters:
sinkslist of str, PathLike, or io.IOBase instances

写入数据的接收器列表。每个接收器可以是:

  • 表示文件名的字符串。

  • 一个 PathLike 对象。

  • Python I/O 类的一个实例,它是 io.IOBase 的子类 (例如,io.BytesIO, io.StringIO)。

列表中的类型必须一致,除非所有的接收器都是io.IOBase的子类实例。混合不同类型的接收器(不全是io.IOBase实例)将会引发ValueError。

class pylibcudf.io.types.SourceInfo(list sources)#

一个包含读取源详细信息的类。

详情请参阅 cudf::io::source_info

Parameters:
sourcesList[Union[str, os.PathLike, bytes, io.BytesIO, DataSource]]

要读取的源的同质列表。

混合不同类型的源将引发ValueError

pylibcudf.io.types.StatisticsFreq#

另请参阅 cudf::statistics_freq

枚举成员

  • STATISTICS_NONE

  • STATISTICS_ROWGROUP

  • STATISTICS_PAGE

  • STATISTICS_COLUMN

class pylibcudf.io.types.TableWithMetadata(Table tbl, list column_names) A container holding a table and its associated metadata (e.g. column names)#

一个包含表及其相关元数据的容器 (例如列名)

详情请参见 cudf::io::table_with_metadata

Parameters:
tblTable

输入表。

column_nameslist

一个元组列表,每个元组包含每个列的名称及其子列的名称(格式相同)。 例如: [(“id”, []), (“name”, [(“first”, []), (“last”, [])])]

属性

child_names

返回一个字典,将具有子列的列名映射到其子列的名称

columns

返回包含表格列的列表

per_file_user_data

返回一个列表,其中包含每个正在读取的文件的文件格式特定元数据的字典。

tbl

tbl: pylibcudf.table.Table

方法

column_names(self[, include_children])

返回包含表格列名的列表

child_names#

返回一个字典,将具有子列的列名映射到其子列的名称

column_names(self, include_children=False)#

返回包含表列名的列表

columns#

返回包含表格列的列表

per_file_user_data#

返回一个包含字典的列表,每个字典包含正在读取的文件的文件格式特定元数据。

tbl#

tbl: pylibcudf.table.Table

I/O 函数#