替换#
- pylibcudf.nvtext.replace.filter_tokens(Column input, size_type min_token_length, Scalar replacement=None, Scalar delimiter=None) Column#
移除长度小于指定字符数的标记。
详情请参阅
filter_tokens()- Parameters:
- inputColumn
要替换的字符串列
- min_token_lengthsize_type
输出字符串中保留一个标记的最小字符数
- replacementScalar, optional
可选替换字符串,用于替换被移除的标记
- delimiterScalar, optional
用于将每个字符串分隔成标记的字符。 默认的空字符串将使用空格来识别标记。
- Returns
- ——-
- Column
过滤字符串的新字符串列
- pylibcudf.nvtext.replace.replace_tokens(Column input, Column targets, Column replacements, Scalar delimiter=None) Column#
用相应的替换字符串替换指定的标记。
详情请参阅
replace_tokens()- Parameters:
- inputColumn
要替换的字符串列
- targetsColumn
要与在
input中找到的标记进行比较的字符串- replacementsColumn
用于
targets中每个字符串的替换字符串- delimiterScalar, optional
用于将每个字符串分隔成标记的字符。 默认的空字符串将使用空格来识别标记。
- Returns:
- Column
替换字符串后的新字符串列