pandas.SparseDtype#
- class pandas.SparseDtype(dtype=<class 'numpy.float64'>, fill_value=None)[源代码][源代码]#
存储在
SparseArray中的数据的 Dtype。SparseDtype用作SparseArray的数据类型,能够更有效地存储包含大量重复值的数据,这些重复值通常由一个填充值表示。它支持任何标量数据类型作为非填充值的基础数据类型。- 参数:
- dtypestr, ExtensionDtype, numpy.dtype, type, 默认 numpy.float64
存储非填充值的基础数组的 dtype。
- fill_value标量,可选
标量值未存储在 SparseArray 中。默认情况下,这取决于
dtype。dtype
na_value
float
np.nancomplex
np.nanint
0bool
Falsedatetime64
pd.NaTtimedelta64
pd.NaT默认值可以通过指定
fill_value来覆盖。
属性
None
方法
None
参见
arrays.SparseArray使用 SparseDtype 表示数据的数组结构。
示例
>>> ser = pd.Series([1, 0, 0], dtype=pd.SparseDtype(dtype=int, fill_value=0)) >>> ser 0 1 1 0 2 0 dtype: Sparse[int64, 0] >>> ser.sparse.density 0.3333333333333333