Index objects

Index

索引

pandas-on-Spark 索引,逻辑上对应于 pandas 索引。

Properties

Index.is_monotonic

返回布尔值,判断对象中的值是否单调递增。

Index.is_monotonic_increasing

如果对象中的值是单调递增的,则返回布尔值。

Index.is_monotonic_decreasing

返回布尔值,判断对象中的值是否单调递减。

Index.is_unique

返回索引是否具有唯一值。

Index.has_duplicates

如果索引有重复项,返回True,否则返回False。

Index.hasnans

如果它有任何缺失值,则返回True。

Index.dtype

返回底层数据的dtype对象。

Index.inferred_type

返回从值推断出的类型字符串。

Index.is_all_dates

返回索引的所有数据类型是否均为日期时间。

Index.shape

返回底层数据形状的元组。

Index.name

返回索引的名称。

Index.names

返回索引的名称。

Index.ndim

返回一个表示数组维数数量的整数。

Index.size

返回一个表示此对象中元素数量的整数。

Index.nlevels

索引和多索引中的层级数量。

Index.empty

如果当前对象为空,则返回 true。

Index.T

返回转置,对于索引,它将是索引本身。

Index.values

返回一个数组,表示索引中的数据。

Modifying and computations

Index.all ([axis, skipna])

返回是否所有元素都为真。

Index.any ([axis])

返回是否有任何元素为真。

Index.argmin ()

返回一个最小参数索引器。

Index.argmax ()

返回一个最大参数索引器。

Index.copy ([name, deep])

制作此对象的副本。

Index.delete (位置)

创建一个新的索引,删除传递的位置。

Index.equals (其他)

确定两个 Index 对象是否包含相同的元素。

Index.factorize ([sort, na_sentinel])

将对象编码为枚举类型或分类变量。

Index.identical (其他)

类似于equals,但检查其他可比较属性是否也相等。

Index.insert (位置, 项目)

在指定位置插入新项目以创建新索引。

Index.is_boolean ()

返回当前索引类型是否为布尔类型。

Index.is_categorical ()

返回当前索引类型是否为分类类型。

Index.is_floating ()

返回当前索引类型是否为浮点类型。

Index.is_integer ()

返回当前索引类型是否为整数类型。

Index.is_interval ()

返回当前索引类型是否为区间类型。

Index.is_numeric ()

返回当前索引类型是否为数值类型。

Index.is_object ()

返回当前索引类型是否为对象类型。

Index.drop (标签)

创建一个新的索引,删除传递的标签列表。

Index.drop_duplicates ([保留])

返回移除重复值后的索引。

Index.min ()

返回索引的最小值。

Index.max ()

返回索引的最大值。

Index.map (mapper[, na_action])

使用输入对应关系(字典、Series 或函数)映射值。

Index.rename (名称[, 原地])

更改索引或MultiIndex名称。

Index.repeat (重复次数)

重复一个 Index/MultiIndex 的元素。

Index.take (indices)

返回沿轴的给定 位置 索引中的元素。

Index.unique ([level])

返回索引中的唯一值。

Index.nunique ([dropna, approx, rsd])

返回对象中唯一元素的数量。

Index.value_counts ([normalize, sort, …])

返回一个包含唯一值计数的序列。

Compatibility with MultiIndex

Index.set_names (names[, level, inplace])

设置索引或MultiIndex的名称。

Index.droplevel (level)

返回移除了请求级别的索引。

Missing Values

Index.fillna (值)

用指定值填充NA/NaN值。

Index.dropna ([如何])

返回不包含NA/NaN值的Index或MultiIndex

Index.isna ()

检测现有的(非缺失的)值。

Index.notna ()

检测现有的(非缺失的)值。

Conversion

Index.astype (dtype)

将 pandas-on-Spark 对象转换为指定的数据类型 dtype

Index.item ()

返回底层数据的第一个元素作为Python标量。

Index.to_list ()

返回一个值的列表。

Index.to_series ([名称])

创建一个索引和值都等于索引键的序列,适用于基于索引返回索引器的映射。

Index.to_frame ([index, name])

创建一个包含索引列的DataFrame。

Index.view ()

这被定义为一个具有相同身份的副本

Index.to_numpy ([dtype, copy])

一个表示此索引或多级索引中值的NumPy ndarray。

Numeric Index

Int64Index

用于索引和对齐的不可变序列。

Float64Index

用于索引和对齐的不可变序列。

CategoricalIndex

CategoricalIndex

基于底层 分类 的索引。

Categorical components

CategoricalIndex.codes

这个分类的类别代码。

CategoricalIndex.categories

这个分类的类别。

CategoricalIndex.ordered

类别是否具有有序关系。

CategoricalIndex.rename_categories (…[, …])

重命名类别。

CategoricalIndex.reorder_categories (…[, …])

按照 new_categories 中指定的方式重新排序类别。

CategoricalIndex.add_categories (新类别)

添加新类别。

CategoricalIndex.remove_categories (移除项)

移除指定的分类。

CategoricalIndex.remove_unused_categories ([…])

移除未使用的分类。

CategoricalIndex.set_categories (新类别)

将类别设置为指定的新类别。

CategoricalIndex.as_ordered ([inplace])

设置分类变量为有序。

CategoricalIndex.as_unordered ([原地])

将分类设置为无序。

CategoricalIndex.map (mapper)

使用输入对应关系(字典、Series 或函数)映射值。

MultiIndex

MultiIndex

pandas-on-Spark 多重索引,逻辑上对应于 pandas 多重索引。

MultiIndex Constructors

MultiIndex.from_arrays (数组[, 排序顺序, …])

将数组转换为MultiIndex。

MultiIndex.from_tuples (元组[, sortorder, …])

将元组列表转换为多重索引。

MultiIndex.from_product (可迭代对象[, …])

从多个可迭代对象的笛卡尔积创建一个MultiIndex。

MultiIndex.from_frame (df[, names])

从 DataFrame 创建一个 MultiIndex。

MultiIndex Properties

MultiIndex.has_duplicates

如果索引有重复项,返回True,否则返回False。

MultiIndex.hasnans

如果它有任何缺失值,则返回True。

MultiIndex.inferred_type

返回从值推断出的类型字符串。

MultiIndex.is_all_dates

is_all_dates 对于 MultiIndex 总是返回 False

MultiIndex.shape

返回底层数据形状的元组。

MultiIndex.names

返回索引的名称。

MultiIndex.ndim

返回一个表示数组维数数量的整数。

MultiIndex.empty

如果当前对象为空,则返回 true。

MultiIndex.T

返回转置,对于索引,它将是索引本身。

MultiIndex.size

返回一个表示此对象中元素数量的整数。

MultiIndex.nlevels

索引和多索引中的层级数量。

MultiIndex.levshape

每个级别长度的元组。

MultiIndex.values

返回一个数组,表示索引中的数据。

MultiIndex.dtypes

返回底层 MultiIndex 的数据类型为一个 Series。

MultiIndex components

MultiIndex.swaplevel ([i, j])

交换第 i 层与第 j 层。

MultiIndex components

MultiIndex.droplevel (level)

返回移除了请求级别的索引。

MultiIndex Missing Values

MultiIndex.fillna (值)

用指定值填充NA/NaN值。

MultiIndex.dropna ([how])

返回不包含NA/NaN值的Index或MultiIndex

MultiIndex Modifying and computations

MultiIndex.equals (其他)

确定两个 Index 对象是否包含相同的元素。

MultiIndex.equal_levels (other)

如果两个MultiIndex对象的级别相同,则返回True

MultiIndex.identical (其他)

类似于equals,但检查其他可比较属性是否也相等。

MultiIndex.insert (位置, 项目)

在指定位置插入新项目以创建新的多级索引。

MultiIndex.drop (codes[, level])

创建一个新的MultiIndex,删除传递的标签列表

MultiIndex.copy ([deep])

制作此对象的副本。

MultiIndex.delete (位置)

创建一个新的索引,删除传递的位置。

MultiIndex.rename (名称[, 原地])

更改索引或MultiIndex名称。

MultiIndex.repeat (重复次数)

重复 Index/MultiIndex 的元素。

MultiIndex.take (indices)

返回沿轴的给定 位置 索引中的元素。

MultiIndex.unique ([level])

返回索引中的唯一值。

MultiIndex.min ()

返回索引的最小值。

MultiIndex.max ()

返回索引的最大值。

MultiIndex.value_counts ([normalize, sort, …])

返回一个包含唯一值计数的序列。

MultiIndex Combining / joining / set operations

MultiIndex.append (其他)

将一系列索引选项附加在一起。

MultiIndex.intersection (其他)

形成两个 Index 对象的交集。

MultiIndex.union (其他[, 排序])

形成两个 Index 对象的并集。

MultiIndex.difference (其他[, 排序])

返回一个新的 Index,其中包含不在 other 中的元素。

MultiIndex.symmetric_difference (其他[, …])

计算两个MultiIndex对象的对称差集。

MultiIndex Conversion

MultiIndex.astype (dtype)

将 pandas-on-Spark 对象转换为指定的数据类型 dtype

MultiIndex.item ()

返回底层数据的第一个元素作为一个Python元组。

MultiIndex.to_list ()

返回一个值的列表。

MultiIndex.to_series ([name])

创建一个索引和值都等于索引键的序列,适用于基于索引返回索引器的映射。

MultiIndex.to_frame ([index, name])

创建一个DataFrame,将MultiIndex的级别作为列。

MultiIndex.view ()

这被定义为一个具有相同身份的副本

MultiIndex.to_numpy ([dtype, copy])

一个表示此索引或多级索引中值的NumPy ndarray。

DatatimeIndex

DatetimeIndex

不可变的类似ndarray的datetime64数据。

Time/date components

DatetimeIndex.year

日期时间中的年份。

DatetimeIndex.month

时间戳的月份,1月 = 1,12月 = 12。

DatetimeIndex.day

日期时间中的天数。

DatetimeIndex.hour

日期时间的小时部分。

DatetimeIndex.minute

日期时间的分钟部分。

DatetimeIndex.second

日期时间的秒数。

DatetimeIndex.微秒

日期时间中的微秒。

DatetimeIndex.week

一年中的周序数。

DatetimeIndex.weekofyear

一年中的周序数。

DatetimeIndex.dayofweek

星期几,星期一=0,星期日=6。

DatetimeIndex.day_of_week

星期几,其中星期一=0,星期日=6。

DatetimeIndex.weekday

星期几,星期一=0,星期日=6。

DatetimeIndex.dayofyear

一年中的第几天。

DatetimeIndex.day_of_year

一年中的第几天。

DatetimeIndex.quarter

日期的季度。

DatetimeIndex.is_month_start

指示日期是否为月份的第一天。

DatetimeIndex.is_month_end

指示日期是否为该月的最后一天。

DatetimeIndex.is_quarter_start

指示日期是否为季度第一天的指标。

DatetimeIndex.is_quarter_end

指示日期是否为季度最后一天的指标。

DatetimeIndex.is_year_start

指示日期是否为某年的第一天。

DatetimeIndex.is_year_end

指示日期是否为一年的最后一天。

DatetimeIndex.is_leap_year

布尔指示符,表示日期是否属于闰年。

DatetimeIndex.daysinmonth

该月份的天数。

DatetimeIndex.days_in_month

该月份的天数。

Selecting

DatetimeIndex.indexer_between_time (…[, …])

返回特定时间段内的值的索引位置(例如:上午9:00-9:30)。

DatetimeIndex.indexer_at_time (时间[, asof])

返回特定时间点的值的索引位置(例如:上午9:30)。

Time-specific operations

DatetimeIndex.normalize ()

将时间转换为午夜。

DatetimeIndex.strftime (日期格式)

使用指定的日期格式转换为字符串索引。

DatetimeIndex.round (freq, *args, **kwargs)

对数据执行四舍五入操作到指定的频率。

DatetimeIndex.floor (freq, *args, **kwargs)

对数据执行向下取整操作到指定的频率。

DatetimeIndex.ceil (频率, *参数, **关键字参数)

对数据执行ceil操作到指定的freq。

DatetimeIndex.month_name ([locale])

返回具有指定区域设置的 DatetimeIndex 的月份名称。

DatetimeIndex.day_name ([locale])

返回带有指定区域设置的序列的日期名称。

TimedeltaIndex

TimedeltaIndex

不可变的 timedelta64 数据 ndarray-like,内部表示为 int64,并且可以装箱为 timedelta 对象。

Components

TimedeltaIndex.days

每个元素的天数。

TimedeltaIndex.seconds

每个元素的秒数(>= 0 且小于 1 天)。

TimedeltaIndex.microseconds

每个元素的微秒数(>= 0 且小于1秒)。