字符串复制#

group strings_copy

函数

std::unique_ptr<string_scalar> repeat_string(string_scalar const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#

重复给定的字符串标量指定的次数。

通过将输入字符串重复repeat_times参数指定的次数来生成输出字符串标量。

在特殊情况下:

  • 如果 repeat_times 不是一个正值,将返回一个空(有效)的字符串标量。

  • 无论repeat_times参数的值如何,无效的输入标量将始终导致无效的输出标量。

Example:
s   = '123XYZ-'
out = repeat_strings(s, 3)
out is '123XYZ-123XYZ-123XYZ-'
Throws:

std::overflow_error – 如果输出字符串标量的大小超过了标量可以存储的最大值:input.size() * repeat_times > max of size_type

Parameters:
  • input – 包含要重复的字符串的标量

  • repeat_times – 输入字符串重复的次数

  • stream – 用于设备内存操作和内核启动的CUDA流

  • mr – 用于分配返回的字符串标量的设备内存资源

Returns:

新的字符串标量,其中输入字符串被重复

std::unique_ptr<column> repeat_strings(strings_column_view const &input, size_type repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#

将给定字符串列中的每个字符串重复指定的次数。

通过将输入字符串列中的每个字符串重复repeat_times参数指定的次数来生成输出字符串列。

在特殊情况下:

  • 如果 repeat_times 不是一个正数,非空的输入字符串将始终导致输出字符串为空。

  • 无论 repeat_times 参数的值如何,空输入字符串将始终导致空输出字符串。

Example:
strs = ['aa', null, '', 'bbc']
out  = repeat_strings(strs, 3)
out is ['aaaaaa', null, '', 'bbcbbcbbc']
Parameters:
  • input – 包含要重复的字符串的列

  • repeat_times – 每个输入字符串重复的次数

  • stream – 用于设备内存操作和内核启动的CUDA流

  • mr – 用于分配返回字符串列的设备内存资源

Returns:

包含重复字符串的新列

std::unique_ptr<column> repeat_strings(strings_column_view const &input, column_view const &repeat_times, rmm::cuda_stream_view stream = cudf::get_default_stream(), rmm::device_async_resource_ref mr = cudf::get_current_device_resource_ref())#

将给定字符串列中的每个字符串按照另一个数值列中给定的次数重复。

通过将每个输入字符串重复repeat_times数值列中对应行给定的次数,生成一个输出字符串列。

在特殊情况下:

  • 任何空行(无论是来自输入字符串列还是repeat_times列)都将始终导致输出字符串为空。

  • 如果repeat_times列中的任何值不是正数且其对应的输入字符串不为空,则输出字符串将为空字符串。

Example:
strs         = ['aa', null, '', 'bbc-']
repeat_times = [ 1,   2,     3,  4   ]
out          = repeat_strings(strs, repeat_times)
out is ['aa', null, '', 'bbc-bbc-bbc-bbc-']
Throws:
Parameters:
  • input – 包含要重复的字符串的列

  • repeat_times – 包含每行对应输入字符串重复次数的列

  • stream – 用于设备内存操作和内核启动的CUDA流

  • mr – 用于分配返回字符串列的设备内存资源

Returns:

包含重复字符串的新列。