pandas.arrays.StringArray#

class pandas.arrays.StringArray(values, copy=False)[源代码][源代码]#

字符串数据的扩展数组。

警告

StringArray 被认为是实验性的。其实现和部分 API 可能会在没有警告的情况下发生变化。

参数:
类数组

数据数组。

警告

目前,这需要一个对象类型的 ndarray,其中元素是 Python 字符串或类似 nan 的值(Nonenp.nanNA)。这在未来可能会在没有警告的情况下发生变化。使用 pandas.array() 并设置 dtype="string" 可以稳定地从任何序列创建一个 StringArray

在 1.5.0 版本发生变更: StringArray 现在接受包含 nan-likes(Nonenp.nan)的类数组对象作为 values 参数,除了字符串和 pandas.NA

复制bool, 默认 False

是否复制数据数组。

属性

None

方法

None

参见

数组()

创建 StringArray 的推荐函数。

Series.str

字符串方法在由 StringArray 支持的 Series 上是可用的。

备注

StringArray 为比较方法返回一个 BooleanArray。

示例

>>> pd.array(["This is", "some text", None, "data."], dtype="string")
<StringArray>
['This is', 'some text', <NA>, 'data.']
Length: 4, dtype: string

与使用 dtype="object" 实例化的数组不同,StringArray 会将值转换为字符串。

>>> pd.array(["1", 1], dtype="object")
<NumpyExtensionArray>
['1', 1]
Length: 2, dtype: object
>>> pd.array(["1", 1], dtype="string")
<StringArray>
['1', '1']
Length: 2, dtype: string

然而,直接使用非字符串实例化 StringArrays 将会引发错误。

对于比较方法,StringArray 返回一个 pandas.BooleanArray

>>> pd.array(["a", None, "c"], dtype="string") == "a"
<BooleanArray>
[True, <NA>, False]
Length: 3, dtype: boolean