操作/选择#

DataFrame.__getitem__(key)

获取DataFrame的一部分作为新的DataFrame、Series或标量。

DataFrame.bottom_k(k, *, by[, reverse])

返回k个最小的行。

DataFrame.cast(dtypes, *[, strict])

将DataFrame列转换为指定的数据类型。

DataFrame.clear([n])

创建一个空的(n=0)或n行空填充(n>0)的DataFrame副本。

DataFrame.clone()

创建此DataFrame的副本。

DataFrame.drop(*columns[, strict])

从数据框中移除列。

DataFrame.drop_in_place(name)

就地删除单个列并返回被删除的列。

DataFrame.drop_nans([subset])

删除包含一个或多个NaN值的所有行。

DataFrame.drop_nulls([subset])

删除所有包含空值的行。

DataFrame.explode(columns, *more_columns)

将数据框通过展开给定列来转换为长格式。

DataFrame.extend(other)

扩展由这个DataFrame支持的内存,使用other中的值。

DataFrame.fill_nan(value)

通过表达式评估填充浮点NaN值。

DataFrame.fill_null([value, strategy, ...])

使用指定的值或策略填充空值。

DataFrame.filter(*predicates, **constraints)

根据一个或多个谓词表达式过滤DataFrame中的行。

DataFrame.gather_every(n[, 偏移量])

从DataFrame中每隔n行取一行,并返回一个新的DataFrame。

DataFrame.get_column(name, *[, default])

按名称获取单个列。

DataFrame.get_column_index(name)

按名称查找列的索引。

DataFrame.get_columns()

将DataFrame作为Series的列表获取。

DataFrame.group_by(*by[, maintain_order])

开始一个分组操作。

DataFrame.group_by_dynamic(index_column, *, ...)

基于时间值(或类型为Int32、Int64的索引值)进行分组。

DataFrame.head([n])

获取前n行。

DataFrame.hstack(columns, *[, in_place])

返回一个新的DataFrame,通过将多个Series水平堆叠来扩展它。

DataFrame.insert_column(index, column)

在某个列索引处插入一个Series。

DataFrame.interpolate()

插值中间值。

DataFrame.item([行, 列])

将DataFrame作为标量返回,或返回给定行/列的元素。

DataFrame.iter_columns()

返回此DataFrame列的迭代器。

DataFrame.iter_rows(*[, named, buffer_size])

返回一个迭代器,用于遍历由Python原生值组成的DataFrame行。

DataFrame.iter_slices([n_rows])

返回一个不复制底层DataFrame切片的迭代器。

DataFrame.join(other[, on, how, left_on, ...])

以类似SQL的方式连接。

DataFrame.join_asof(other, *[, left_on, ...])

执行一个asof连接。

DataFrame.join_where(other, *predicates[, ...])

基于一个或多个(不)等式谓词执行连接。

DataFrame.limit([n])

获取前n行。

DataFrame.melt([id_vars, value_vars, ...])

将DataFrame从宽格式转换为长格式。

DataFrame.merge_sorted(other, key)

取两个已排序的DataFrame并按排序键合并它们。

DataFrame.partition_by(by, *more_by[, ...])

按给定的列进行分组,并将分组作为单独的数据框返回。

DataFrame.pipe(function, *args, **kwargs)

提供了一种结构化的方式来应用一系列用户定义的函数(UDFs)。

DataFrame.pivot(on, *[, index, values, ...])

创建一个电子表格样式的数据透视表作为DataFrame。

DataFrame.rechunk()

将此DataFrame中的数据重新分块为连续分配。

DataFrame.rename(mapping, *[, strict])

重命名列名。

DataFrame.replace_column(index, column)

在索引位置替换一列。

DataFrame.reverse()

反转DataFrame。

DataFrame.rolling(index_column, *, period[, ...])

基于时间或整数列创建滚动组。

DataFrame.row([index, by_predicate, named])

通过索引或谓词获取单行的值。

DataFrame.rows(*[, named])

返回DataFrame中的所有数据作为Python原生值的行列表。

DataFrame.rows_by_key(key, *[, named, ...])

返回所有数据作为以某列作为键的Python原生值的字典。

DataFrame.sample([n, fraction, ...])

从这个DataFrame中取样。

DataFrame.select(*exprs, **named_exprs)

从这个DataFrame中选择列。

DataFrame.select_seq(*exprs, **named_exprs)

从这个DataFrame中选择列。

DataFrame.set_sorted(column, *[, descending])

指示一个或多个列已排序。

DataFrame.shift([n, fill_value])

将值按给定的索引数进行移动。

DataFrame.shrink_to_fit(*[, in_place])

缩小DataFrame的内存使用。

DataFrame.slice(offset[, length])

获取此DataFrame的一个切片。

DataFrame.sort(by, *more_by[, descending, ...])

按给定的列对数据框进行排序。

DataFrame.sql(query, *[, table_name])

对DataFrame执行SQL查询。

DataFrame.tail([n])

获取最后 n 行。

DataFrame.to_dummies([columns, separator, ...])

将分类变量转换为虚拟/指示变量。

DataFrame.to_series([index])

在索引位置选择列作为Series。

DataFrame.top_k(k, *, by[, reverse])

返回k个最大的行。

DataFrame.transpose(*[, include_header, ...])

将DataFrame沿对角线进行转置。

DataFrame.unique([subset, keep, maintain_order])

从这个数据框中删除重复的行。

DataFrame.unnest(columns, *more_columns)

将结构体列分解为每个字段的单独列。

DataFrame.unpivot([on, index, ...])

将DataFrame从宽格式转换为长格式。

DataFrame.unstack(step[, how, columns, ...])

将长表展开为宽表形式,而不进行聚合操作。

DataFrame.update(other[, on, how, left_on, ...])

使用other中的值更新此DataFrame中的值。

DataFrame.upsample(time_column, *, every[, ...])

以固定频率对DataFrame进行上采样。

DataFrame.vstack(other, *[, in_place])

通过将一个DataFrame堆叠到它上面,垂直扩展这个DataFrame。

DataFrame.with_columns(*exprs, **named_exprs)

向此DataFrame添加列。

DataFrame.with_columns_seq(*exprs, **named_exprs)

向此DataFrame添加列。

DataFrame.with_row_count([name, offset])

在第0列添加一个用于计算行数的列。

DataFrame.with_row_index([name, offset])

在DataFrame中添加一行索引作为第一列。