DataFrame.__getitem__(key)
|
获取DataFrame的一部分作为新的DataFrame、Series或标量。 |
DataFrame.bottom_k(k, *, by[, reverse])
|
返回k个最小的行。 |
DataFrame.cast(dtypes, *[, strict])
|
将DataFrame列转换为指定的数据类型。 |
DataFrame.clear([n])
|
创建一个空的(n=0)或n行空填充(n>0)的DataFrame副本。 |
DataFrame.clone()
|
创建此DataFrame的副本。 |
DataFrame.drop(*columns[, strict])
|
从数据框中移除列。 |
DataFrame.drop_in_place(name)
|
就地删除单个列并返回被删除的列。 |
DataFrame.drop_nans([subset])
|
删除包含一个或多个NaN值的所有行。 |
DataFrame.drop_nulls([subset])
|
删除所有包含空值的行。 |
DataFrame.explode(columns, *more_columns)
|
将数据框通过展开给定列来转换为长格式。 |
DataFrame.extend(other)
|
扩展由这个DataFrame支持的内存,使用other中的值。 |
DataFrame.fill_nan(value)
|
通过表达式评估填充浮点NaN值。 |
DataFrame.fill_null([value, strategy, ...])
|
使用指定的值或策略填充空值。 |
DataFrame.filter(*predicates, **constraints)
|
根据一个或多个谓词表达式过滤DataFrame中的行。 |
DataFrame.gather_every(n[, 偏移量])
|
从DataFrame中每隔n行取一行,并返回一个新的DataFrame。 |
DataFrame.get_column(name, *[, default])
|
按名称获取单个列。 |
DataFrame.get_column_index(name)
|
按名称查找列的索引。 |
DataFrame.get_columns()
|
将DataFrame作为Series的列表获取。 |
DataFrame.group_by(*by[, maintain_order])
|
开始一个分组操作。 |
DataFrame.group_by_dynamic(index_column, *, ...)
|
基于时间值(或类型为Int32、Int64的索引值)进行分组。 |
DataFrame.head([n])
|
获取前n行。 |
DataFrame.hstack(columns, *[, in_place])
|
返回一个新的DataFrame,通过将多个Series水平堆叠来扩展它。 |
DataFrame.insert_column(index, column)
|
在某个列索引处插入一个Series。 |
DataFrame.interpolate()
|
插值中间值。 |
DataFrame.item([行, 列])
|
将DataFrame作为标量返回,或返回给定行/列的元素。 |
DataFrame.iter_columns()
|
返回此DataFrame列的迭代器。 |
DataFrame.iter_rows(*[, named, buffer_size])
|
返回一个迭代器,用于遍历由Python原生值组成的DataFrame行。 |
DataFrame.iter_slices([n_rows])
|
返回一个不复制底层DataFrame切片的迭代器。 |
DataFrame.join(other[, on, how, left_on, ...])
|
以类似SQL的方式连接。 |
DataFrame.join_asof(other, *[, left_on, ...])
|
执行一个asof连接。 |
DataFrame.join_where(other, *predicates[, ...])
|
基于一个或多个(不)等式谓词执行连接。 |
DataFrame.limit([n])
|
获取前n行。 |
DataFrame.melt([id_vars, value_vars, ...])
|
将DataFrame从宽格式转换为长格式。 |
DataFrame.merge_sorted(other, key)
|
取两个已排序的DataFrame并按排序键合并它们。 |
DataFrame.partition_by(by, *more_by[, ...])
|
按给定的列进行分组,并将分组作为单独的数据框返回。 |
DataFrame.pipe(function, *args, **kwargs)
|
提供了一种结构化的方式来应用一系列用户定义的函数(UDFs)。 |
DataFrame.pivot(on, *[, index, values, ...])
|
创建一个电子表格样式的数据透视表作为DataFrame。 |
DataFrame.rechunk()
|
将此DataFrame中的数据重新分块为连续分配。 |
DataFrame.rename(mapping, *[, strict])
|
重命名列名。 |
DataFrame.replace_column(index, column)
|
在索引位置替换一列。 |
DataFrame.reverse()
|
反转DataFrame。 |
DataFrame.rolling(index_column, *, period[, ...])
|
基于时间或整数列创建滚动组。 |
DataFrame.row([index, by_predicate, named])
|
通过索引或谓词获取单行的值。 |
DataFrame.rows(*[, named])
|
返回DataFrame中的所有数据作为Python原生值的行列表。 |
DataFrame.rows_by_key(key, *[, named, ...])
|
返回所有数据作为以某列作为键的Python原生值的字典。 |
DataFrame.sample([n, fraction, ...])
|
从这个DataFrame中取样。 |
DataFrame.select(*exprs, **named_exprs)
|
从这个DataFrame中选择列。 |
DataFrame.select_seq(*exprs, **named_exprs)
|
从这个DataFrame中选择列。 |
DataFrame.set_sorted(column, *[, descending])
|
指示一个或多个列已排序。 |
DataFrame.shift([n, fill_value])
|
将值按给定的索引数进行移动。 |
DataFrame.shrink_to_fit(*[, in_place])
|
缩小DataFrame的内存使用。 |
DataFrame.slice(offset[, length])
|
获取此DataFrame的一个切片。 |
DataFrame.sort(by, *more_by[, descending, ...])
|
按给定的列对数据框进行排序。 |
DataFrame.sql(query, *[, table_name])
|
对DataFrame执行SQL查询。 |
DataFrame.tail([n])
|
获取最后 n 行。 |
DataFrame.to_dummies([columns, separator, ...])
|
将分类变量转换为虚拟/指示变量。 |
DataFrame.to_series([index])
|
在索引位置选择列作为Series。 |
DataFrame.top_k(k, *, by[, reverse])
|
返回k个最大的行。 |
DataFrame.transpose(*[, include_header, ...])
|
将DataFrame沿对角线进行转置。 |
DataFrame.unique([subset, keep, maintain_order])
|
从这个数据框中删除重复的行。 |
DataFrame.unnest(columns, *more_columns)
|
将结构体列分解为每个字段的单独列。 |
DataFrame.unpivot([on, index, ...])
|
将DataFrame从宽格式转换为长格式。 |
DataFrame.unstack(step[, how, columns, ...])
|
将长表展开为宽表形式,而不进行聚合操作。 |
DataFrame.update(other[, on, how, left_on, ...])
|
使用other中的值更新此DataFrame中的值。 |
DataFrame.upsample(time_column, *, every[, ...])
|
以固定频率对DataFrame进行上采样。 |
DataFrame.vstack(other, *[, in_place])
|
通过将一个DataFrame堆叠到它上面,垂直扩展这个DataFrame。 |
DataFrame.with_columns(*exprs, **named_exprs)
|
向此DataFrame添加列。 |
DataFrame.with_columns_seq(*exprs, **named_exprs)
|
向此DataFrame添加列。 |
DataFrame.with_row_count([name, offset])
|
在第0列添加一个用于计算行数的列。 |
DataFrame.with_row_index([name, offset])
|
在DataFrame中添加一行索引作为第一列。 |