输入/输出#
Avro#
|
从Apache Avro格式读取到DataFrame中。 |
|
写入Apache Avro文件。 |
剪贴板#
|
从剪贴板读取文本并传递给 |
|
将 |
CSV#
|
将CSV文件读取到DataFrame中。 |
|
批量读取CSV文件。 |
|
通过通配符模式从CSV文件或多个文件中懒加载读取。 |
|
写入逗号分隔值(CSV)文件。 |
|
在流模式下评估查询并将结果写入CSV文件。 |
从阅读器中读取 |
数据库#
|
将SQL查询的结果读取到DataFrame中,给定一个连接对象。 |
|
将SQL查询的结果读取到DataFrame中,给定一个URI。 |
|
将Polars DataFrame中的数据写入数据库。 |
Delta Lake#
|
从Delta湖表中读取数据到DataFrame。 |
|
从Delta湖表中懒加载读取。 |
|
将DataFrame写入为delta表。 |
Excel / ODS#
|
将Excel电子表格数据读取到DataFrame中。 |
|
将OpenOffice(ODS)电子表格数据读取到DataFrame中。 |
|
将框架数据写入Excel工作簿/工作表中的表格。 |
Feather / IPC#
|
从Arrow IPC(Feather v2)文件读取到DataFrame中。 |
|
获取IPC文件的模式而不读取数据。 |
|
从Arrow IPC记录批次流中读取到DataFrame。 |
|
通过glob模式从Arrow IPC(Feather v2)文件或多个文件中懒加载读取。 |
|
写入Arrow IPC二进制流或Feather文件。 |
|
写入Arrow IPC记录批次流。 |
|
在流模式下评估查询并将结果写入IPC文件。 |
Iceberg#
|
从Apache Iceberg表中懒加载读取。 |
JSON#
|
从JSON文件读取到DataFrame中。 |
|
从以换行符分隔的JSON文件中读取到DataFrame。 |
|
通过glob模式从以换行符分隔的JSON文件或多个文件中懒加载读取。 |
|
序列化为JSON表示。 |
|
序列化为换行符分隔的JSON表示。 |
|
在流模式下评估查询并将结果写入NDJSON文件。 |
Parquet#
|
从parquet文件中读取数据到DataFrame。 |
|
获取Parquet文件的模式而不读取数据。 |
|
从本地或云托管的parquet文件(或文件)中懒加载读取。 |
|
写入Apache Parquet文件。 |
|
在流模式下评估查询并将结果写入Parquet文件。 |
PyArrow 数据集#
连接到pyarrow数据集。
|
扫描一个pyarrow数据集。 |
云凭证#
云凭证配置。
凭证提供者的基类。 |
|
|
AWS 凭证提供者。 |
|
Azure 凭证提供者。 |
|
GCP 凭证提供者。 |