pandas.Index#
- class pandas.Index(data=None, dtype=None, copy=False, name=None, tupleize_cols=True)[源代码][源代码]#
用于索引和对齐的不可变序列。
存储所有 pandas 对象的轴标签的基本对象。
在 2.0.0 版本发生变更: 索引可以包含所有 numpy 数值类型(除了 float16)。以前只接受 int64/uint64/float64 类型。
- 参数:
- 数据类数组(一维)
一个包含索引数据的类似数组的结构。这可以是 Python 列表、NumPy 数组或 pandas Series。
- dtypestr, numpy.dtype, 或 ExtensionDtype, 可选
输出索引的数据类型。如果未指定,这将根据 data 推断。更多用法请参见 用户指南。
- 复制布尔值, 默认为 False
复制输入数据。
- 名字对象
要存储在索引中的名称。
- tupleize_colsbool (默认: True)
当为 True 时,如果可能,尝试创建一个 MultiIndex。
参见
RangeIndex实现单调整数范围的索引。
CategoricalIndexCategorical的索引。MultiIndex一个多级别的,或层次化的索引。
IntervalIndex一个
区间的索引。DatetimeIndexdatetime64 数据的索引。
TimedeltaIndextimedelta64 数据的索引。
PeriodIndex周期数据索引。
备注
一个 Index 实例 只能 包含可哈希对象。一个 Index 实例 不能 持有 numpy float16 数据类型。
例子
>>> pd.Index([1, 2, 3]) Index([1, 2, 3], dtype='int64')
>>> pd.Index(list("abc")) Index(['a', 'b', 'c'], dtype='object')
>>> pd.Index([1, 2, 3], dtype="uint8") Index([1, 2, 3], dtype='uint8')
属性
返回转置,根据定义这是自身。
支持此 Series 或 Index 的数据的 ExtensionArray。
返回底层数据的 dtype 对象。
指示索引是否为空。
检查索引是否有重复值。
如果存在任何 NaN,则返回 True。
返回从值推断出的类型字符串。
如果值相等或递减,则返回一个布尔值。
如果值相等或递增,则返回一个布尔值。
如果索引具有唯一值,则返回。
返回 Index 或 MultiIndex 名称。
获取索引中的名称。
返回底层数据中的字节数。
底层数据维度的数量,定义为1。
nlevels层数。
返回基础数据形状的元组。
返回基础数据中的元素数量。
返回一个表示索引中数据的数组。
方法
all(*args, **kwargs)返回所有元素是否为真值。
any(*args, **kwargs)返回是否有任何元素为真值。
追加(其他)将一系列索引选项附加在一起。
argmax([axis, skipna])返回 Series 中最大值的整数位置。
argmin([axis, skipna])返回 Series 中最小值的整数位置。
argsort(*args, **kwargs)返回将排序索引的整数索引。
asof(label)返回索引中的标签,如果不存在,则返回前一个标签。
asof_locs(where, mask)返回索引中标签的位置(索引)。
astype(dtype[, copy])创建一个带有转换为 dtypes 的值的索引。
复制([name, deep])复制这个对象。
删除(loc)通过删除传递的位置(-s)创建新的索引。
diff([periods])计算 Index 对象中连续值之间的差异。
差集(other[, sort])返回一个新的索引,其中包含在索引中但不在 other 中的元素。
drop(labels[, errors])使用传递的标签列表创建新的索引并删除。
drop_duplicates(*[, keep])返回删除了重复值的索引。
droplevel([level])返回移除了请求级别的索引。
dropna([how])返回不包含 NA/NaN 值的索引。
重复的([keep])指示重复的索引值。
等于(other)确定两个 Index 对象是否相等。
factorize([sort, use_na_sentinel])将对象编码为枚举类型或分类变量。
fillna(value)用指定值填充 NA/NaN 值。
get_indexer(target[, method, limit, tolerance])计算给定当前索引的新索引的索引器和掩码。
get_indexer_for(target)即使在非唯一情况下,也保证返回一个索引器。
get_indexer_non_unique(target)计算给定当前索引的新索引的索引器和掩码。
get_level_values(level)返回请求级别的值索引。
get_loc(key)获取请求标签的整数位置、切片或布尔掩码。
get_slice_bound(label, side)计算对应于给定标签的切片边界。
groupby(values)根据给定的值数组对索引标签进行分组。
相同(其他)类似于等于,但还会检查对象属性和类型是否也相等。
infer_objects([copy])如果我们有一个对象数据类型,尝试推断一个非对象数据类型。
插入(loc, item)在指定位置插入新项目创建新索引。
交集(other[,sort])形成两个索引对象的交集。
is_(其他)更灵活,更快的检查,类似于
is但可以通过视图工作。isin(values[, level])返回一个布尔数组,其中索引值在 values 中。
isna()检测缺失值。
isnull()检测缺失值。
项目()将底层数据的第一个元素作为Python标量返回。
join(other, *[, how, level, ...])计算 join_index 和索引器以使数据结构符合新索引。
map(mapper[, na_action])使用输入映射或函数映射值。
最大值([axis, skipna])返回索引的最大值。
memory_usage([deep])值的内存使用情况。
最小值([axis, skipna])返回索引的最小值。
notna()检测现有的(非缺失的)值。
notnull()检测现有的(非缺失的)值。
nunique([dropna])返回对象中唯一元素的数量。
putmask(mask, value)返回一个用掩码设置的值的新索引。
ravel([order])返回一个对自身的视图。
reindex(目标[, 方法, 层级, 限制, ...])使用目标的值创建索引。
重命名(name, *[, inplace])更改索引或 MultiIndex 名称。
repeat(repeats[, axis])重复索引的元素。
round([decimals])将索引中的每个值四舍五入到给定的位数。
searchsorted(value[, side, sorter])查找元素应插入以保持顺序的索引。
set_names(names, *[, level, inplace])设置索引或复合索引的名称。
shift([periods, freq])按所需的时间频率增量数移动索引。
slice_indexer([start, end, step])计算输入标签和步长的切片索引器。
slice_locs([start, end, step])计算输入标签的切片位置。
sort_values(*[, return_indexer, ascending, ...])返回索引的排序副本。
sortlevel([level, ascending, ...])为了与索引API的内部兼容。
symmetric_difference(other[, result_name, sort])计算两个 Index 对象的对称差集。
take(indices[, axis, allow_fill, fill_value])返回由索引选择的值的新索引。
to_flat_index()身份方法。
to_frame([index, name])创建一个包含索引列的 DataFrame。
to_list()返回一个值的列表。
to_numpy([dtype, copy, na_value])表示此 Series 或 Index 中值的 NumPy ndarray。
to_series([index, name])创建一个索引和值都等于索引键的序列。
tolist()返回一个值的列表。
转置(*args, **kwargs)返回转置,根据定义这是自身。
并集(other[, sort])形成两个索引对象的并集。
唯一([level])返回索引中的唯一值。
value_counts([normalize, sort, ascending, ...])返回一个包含唯一值计数的系列。
视图([cls])返回具有指定 dtype 的 Index 视图或新的 Index 实例。
where(cond[, other])在条件为假的地方替换值。