文本#

class pylibcudf.io.text.DataChunkSource#

multibyte_split的数据源

Parameters:

class pylibcudf.io.text.ParseOptions(byte_range=None, *, strip_delimiters=False)#

解析选项用于 multibyte_split

Parameters:

pylibcudf.io.text.make_source(unicode data) → DataChunkSource#

创建一个能够生成给定字符串的设备缓冲视图的数据源。

Parameters:

Returns:

pylibcudf.io.text.make_source_from_bgzip_file(unicode filename, int virtual_begin=-1, int virtual_end=-1) → DataChunkSource#

创建一个能够生成带有虚拟记录偏移量的BGZIP压缩文件的设备缓冲视图的数据源。

Parameters:

Returns:

pylibcudf.io.text.make_source_from_file(unicode filename) → DataChunkSource#

创建一个能够生成文件的设备缓冲视图的数据源。

Parameters:

Returns:

pylibcudf.io.text.multibyte_split(DataChunkSource source, unicode delimiter, ParseOptions options=None) → Column#

使用多字节分隔符将源文本拆分为字符串列。

Parameters:

Returns: