pyspark.sql.DataFrame.collect

DataFrame. collect ( ) → List [ pyspark.sql.types.Row ] [source]

返回所有记录作为 Row 的列表。

新增于版本 1.3.0。

在版本 3.4.0 中更改: 支持 Spark Connect。

Returns
list

行列表。

示例

>>> df = spark.createDataFrame(
...     [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
>>> df.collect()
[Row(age=14, name='Tom'), Row(age=23, name='Alice'), Row(age=16, name='Bob')]