pandas.SparseDtype#

class pandas.SparseDtype(dtype=<class 'numpy.float64'>, fill_value=None)[源代码][源代码]#

存储在 SparseArray 中的数据的 Dtype。

SparseDtype 用作 SparseArray 的数据类型,能够更有效地存储包含大量重复值的数据,这些重复值通常由一个填充值表示。它支持任何标量数据类型作为非填充值的基础数据类型。

参数:
dtypestr, ExtensionDtype, numpy.dtype, type, 默认 numpy.float64

存储非填充值的基础数组的 dtype。

fill_value标量,可选

标量值未存储在 SparseArray 中。默认情况下,这取决于 dtype

dtype

na_value

float

np.nan

complex

np.nan

int

0

bool

False

datetime64

pd.NaT

timedelta64

pd.NaT

默认值可以通过指定 fill_value 来覆盖。

属性

None

方法

None

参见

arrays.SparseArray

使用 SparseDtype 表示数据的数组结构。

示例

>>> ser = pd.Series([1, 0, 0], dtype=pd.SparseDtype(dtype=int, fill_value=0))
>>> ser
0    1
1    0
2    0
dtype: Sparse[int64, 0]
>>> ser.sparse.density
0.3333333333333333