替换#

pylibcudf.nvtext.replace.filter_tokens(Column input, size_type min_token_length, Scalar replacement=None, Scalar delimiter=None) → Column#

移除长度小于指定字符数的标记。

详情请参阅 filter_tokens()

Parameters:

inputColumn: 要替换的字符串列
min_token_lengthsize_type: 输出字符串中保留一个标记的最小字符数
replacementScalar, optional: 可选替换字符串，用于替换被移除的标记
delimiterScalar, optional: 用于将每个字符串分隔成标记的字符。默认的空字符串将使用空格来识别标记。
Returns
——-
Column: 过滤字符串的新字符串列

pylibcudf.nvtext.replace.replace_tokens(Column input, Column targets, Column replacements, Scalar delimiter=None) → Column#

用相应的替换字符串替换指定的标记。

详情请参阅 replace_tokens()

Parameters:

inputColumn: 要替换的字符串列
targetsColumn: 要与在input中找到的标记进行比较的字符串
replacementsColumn: 用于targets中每个字符串的替换字符串
delimiterScalar, optional: 用于将每个字符串分隔成标记的字符。默认的空字符串将使用空格来识别标记。

Returns:

Column: 替换字符串后的新字符串列