logo
  • 概述
  • 开始使用
  • 用户指南
  • API 参考
  • 开发
  • 迁移指南
  • 安装
  • 快速入门:DataFrame
  • 快速入门:Spark 连接
  • 快速入门:Spark上的Pandas API
  • 测试 PySpark

开始使用 ¶

本页面概述了设置和开始使用 PySpark 所需的基本步骤。 还有更多与其他语言相关的指南,例如 快速入门 在编程指南中 位于 Spark 文档 。

有可以在线使用的笔记本,你可以直接尝试PySpark,而无需其他步骤:

  • 实时笔记本:数据框

  • 实时笔记本:Spark 连接

  • 实时笔记本:Spark 上的 pandas API

下面的列表是这个快速开始页面的内容:

  • 安装
    • 支持的 Python 版本
    • 使用 PyPI
    • 使用 Conda
    • 手动下载
    • 从源代码安装
    • 依赖
  • 快速入门:DataFrame
    • 创建 DataFrame
    • 查看数据
    • 选择和访问数据
    • 应用函数
    • 分组数据
    • 获取数据进/出
    • 与 SQL 一起工作
  • 快速入门:Spark 连接
    • 使用 Spark Connect 启动 Spark 服务器
    • 连接到 Spark Connect 服务器
    • 创建 DataFrame
  • 快速入门:Spark上的Pandas API
    • 对象创建
    • 缺失数据
    • 操作
    • 分组
    • 绘图
    • 获取数据进/出
  • 测试 PySpark
    • 构建 PySpark 应用程序
    • 测试你的 PySpark 应用程序
    • 将所有内容组合在一起!

上一个

PySpark 概述

下一个

安装

© 版权 .

使用 Sphinx 3.0.4 创建。