字符串#

以下方法可在 expr.str 属性下使用。

Expr.str.concat([delimiter, ignore_nulls])

将列中的字符串值垂直连接为单个字符串值。

Expr.str.contains(pattern, *[, literal, strict])

检查字符串是否包含与模式匹配的子字符串。

Expr.str.contains_any(patterns, *[, ...])

使用Aho-Corasick算法来查找匹配项。

Expr.str.count_matches(pattern, *[, literal])

计算所有连续不重叠的正则表达式匹配。

Expr.str.decode(encoding, *[, strict])

使用提供的编码解码值。

Expr.str.encode(encoding)

使用提供的编码对值进行编码。

Expr.str.ends_with(suffix)

检查字符串值是否以子字符串结尾。

Expr.str.escape_regex()

返回所有正则表达式元字符转义后的字符串值。

Expr.str.explode()

返回一个列,其中每个字符串字符都有一行。

Expr.str.extract(pattern[, group_index])

从提供的模式中提取目标捕获组。

Expr.str.extract_all(pattern)

提取给定正则表达式模式的所有匹配项。

Expr.str.extract_groups(pattern)

提取给定正则表达式模式的所有捕获组。

Expr.str.extract_many(patterns, *[, ...])

使用Aho-Corasick算法提取多个匹配项。

Expr.str.find(pattern, *[, literal, strict])

返回与模式匹配的第一个子字符串的字节偏移量。

Expr.str.find_many(patterns, *[, ...])

使用Aho-Corasick算法来查找多个匹配项。

Expr.str.head(n)

返回字符串系列中每个字符串的前n个字符。

Expr.str.join([delimiter, ignore_nulls])

将列中的字符串值垂直连接为单个字符串值。

Expr.str.json_decode([dtype, ...])

将字符串值解析为JSON。

Expr.str.json_path_match(json_path)

使用提供的JSONPath表达式提取JSON字符串的第一个匹配项。

Expr.str.len_bytes()

返回每个字符串的字节长度。

Expr.str.len_chars()

返回每个字符串的长度作为字符数。

Expr.str.pad_end(length[, fill_char])

将字符串的末尾填充,直到达到给定的长度。

Expr.str.pad_start(length[, fill_char])

将字符串的开头填充,直到达到给定的长度。

Expr.str.replace(pattern, value, *[, literal, n])

用新的字符串值替换第一个匹配的正则表达式/字面量子字符串。

Expr.str.replace_all(pattern, value, *[, ...])

用新的字符串值替换所有匹配的正则表达式/字面量子字符串。

Expr.str.replace_many(patterns[, ...])

使用Aho-Corasick算法替换多个匹配项。

Expr.str.reverse()

返回字符串值的反转顺序。

Expr.str.slice(offset[, length])

从每个字符串值中提取一个子字符串。

Expr.str.split(by, *[, inclusive])

通过子字符串分割字符串。

Expr.str.split_exact(by, n, *[, inclusive])

使用n次分割将字符串按子字符串分割。

Expr.str.splitn(by, n)

通过子字符串分割字符串,限制最多返回n个项目。

Expr.str.starts_with(prefix)

检查字符串值是否以子字符串开头。

Expr.str.strip_chars([characters])

移除前导和尾随字符。

Expr.str.strip_chars_start([characters])

移除前导字符。

Expr.str.strip_chars_end([characters])

移除尾部字符。

Expr.str.strip_prefix(prefix)

移除前缀。

Expr.str.strip_suffix(suffix)

移除后缀。

Expr.str.strptime(dtype[, format, strict, ...])

将字符串列转换为日期/日期时间/时间列。

Expr.str.tail(n)

返回字符串系列中每个字符串的最后n个字符。

Expr.str.to_date([format, strict, exact, cache])

将字符串列转换为日期列。

Expr.str.to_datetime([format, time_unit, ...])

将字符串列转换为日期时间列。

Expr.str.to_decimal([inference_length])

将字符串列转换为十进制列。

Expr.str.to_integer(*[, base, strict])

将字符串列转换为具有基数进制的Int64列。

Expr.str.to_lowercase()

将字符串修改为它们的小写等效形式。

Expr.str.to_time([format, strict, cache])

将字符串列转换为时间列。

Expr.str.to_titlecase()

将字符串修改为它们的标题大小写等效形式。

Expr.str.to_uppercase()

将字符串修改为其大写形式。

Expr.str.zfill(length)

用零填充字符串的开头,直到达到给定的长度。