从 Koalas 迁移到 Spark 上的 pandas API ¶
-
导入的包名应该从
databricks.koalas更改为pyspark.pandas。# 导入 databricks.koalas 为 ks import pyspark.pandas as ps
-
Koalas DataFrame 中的
DataFrame.koalas被重命名为 pandas-on-Spark DataFrame 中的DataFrame.pandas_on_spark。出于兼容性原因保留了DataFrame.koalas,但自 Spark 3.2 起已被弃用。 未来的版本中将移除DataFrame.koalas。 -
在 PySpark DataFrame 中被 Monkey-patch 的
DataFrame.to_koalas被重命名为 PySpark DataFrame 中的DataFrame.pandas_api。出于兼容性原因保留了DataFrame.to_koalas。 未来的版本中将移除DataFrame.to_koalas。 -
在 PySpark DataFrame 中被 Monkey-patch 的
DataFrame.to_pandas_on_spark被重命名为 PySpark DataFrame 中的DataFrame.pandas_api。出于兼容性原因保留了DataFrame.to_pandas_on_spark,但自 Spark 3.3 起已被弃用。 未来的版本中将移除DataFrame.to_pandas_on_spark。 -
databricks.koalas.__version__被移除。应该使用pyspark.__version__。