pyspark.sql.DataFrame.offset

DataFrame. 偏移 ( num : int ) → pyspark.sql.dataframe.DataFrame [source]

返回一个新的 :class: DataFrame ,通过跳过前 n 行。

新增于版本 3.4.0。

在版本 3.5.0 中更改: 支持原生 PySpark。

Parameters
num int

要跳过的记录数。

Returns
DataFrame

记录的子集

示例

>>> df = spark.createDataFrame(
...     [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
>>> df.offset(1).show()
+---+-----+
|age| name|
+---+-----+
| 23|Alice|
| 16|  Bob|
+---+-----+
>>> df.offset(10).show()
+---+----+
|age|name|
+---+----+
+---+----+