pandas.SparseDtype#
- class pandas.SparseDtype(dtype=<class 'numpy.float64'>, fill_value=None)[源代码][源代码]#
存储在
SparseArray
中的数据的 Dtype。SparseDtype
用作SparseArray
的数据类型,能够更有效地存储包含大量重复值的数据,这些重复值通常由一个填充值表示。它支持任何标量数据类型作为非填充值的基础数据类型。- 参数:
- dtypestr, ExtensionDtype, numpy.dtype, type, 默认 numpy.float64
存储非填充值的基础数组的 dtype。
- fill_value标量,可选
标量值未存储在 SparseArray 中。默认情况下,这取决于
dtype
。dtype
na_value
float
np.nan
complex
np.nan
int
0
bool
False
datetime64
pd.NaT
timedelta64
pd.NaT
默认值可以通过指定
fill_value
来覆盖。
属性
None
方法
None
参见
arrays.SparseArray
使用 SparseDtype 表示数据的数组结构。
示例
>>> ser = pd.Series([1, 0, 0], dtype=pd.SparseDtype(dtype=int, fill_value=0)) >>> ser 0 1 1 0 2 0 dtype: Sparse[int64, 0] >>> ser.sparse.density 0.3333333333333333