pandas.arrays.StringArray#
- class pandas.arrays.StringArray(values, copy=False)[源代码][源代码]#
字符串数据的扩展数组。
警告
StringArray 被认为是实验性的。其实现和部分 API 可能会在没有警告的情况下发生变化。
- 参数:
- 值类数组
数据数组。
警告
目前,这需要一个对象类型的 ndarray,其中元素是 Python 字符串或类似 nan 的值(
None
、np.nan
、NA
)。这在未来可能会在没有警告的情况下发生变化。使用pandas.array()
并设置dtype="string"
可以稳定地从任何序列创建一个 StringArray。在 1.5.0 版本发生变更: StringArray 现在接受包含 nan-likes(
None
,np.nan
)的类数组对象作为values
参数,除了字符串和pandas.NA
- 复制bool, 默认 False
是否复制数据数组。
属性
None
方法
None
参见
数组()
创建 StringArray 的推荐函数。
Series.str
字符串方法在由 StringArray 支持的 Series 上是可用的。
备注
StringArray 为比较方法返回一个 BooleanArray。
示例
>>> pd.array(["This is", "some text", None, "data."], dtype="string") <StringArray> ['This is', 'some text', <NA>, 'data.'] Length: 4, dtype: string
与使用
dtype="object"
实例化的数组不同,StringArray
会将值转换为字符串。>>> pd.array(["1", 1], dtype="object") <NumpyExtensionArray> ['1', 1] Length: 2, dtype: object >>> pd.array(["1", 1], dtype="string") <StringArray> ['1', '1'] Length: 2, dtype: string
然而,直接使用非字符串实例化 StringArrays 将会引发错误。
对于比较方法,StringArray 返回一个
pandas.BooleanArray
:>>> pd.array(["a", None, "c"], dtype="string") == "a" <BooleanArray> [True, <NA>, False] Length: 3, dtype: boolean