3.5.3
概述
编程指南
快速入门
RDDs, 累加器, 广播变量
SQL, DataFrames 和 Datasets
结构化流处理
Spark Streaming (DStreams)
MLlib (机器学习)
GraphX (图处理)
SparkR (在 Spark 上使用 R)
PySpark (在 Spark 上使用 Python)
API 文档
Scala
Java
Python
R
SQL, 内置函数
部署
概述
提交应用程序
Spark 独立模式
Mesos
YARN
Kubernetes
更多
配置
监控
调优指南
作业调度
安全性
硬件配置
迁移指南
构建 Spark
为 Spark 贡献代码
第三方项目
Spark SQL 指南
开始使用
数据源
性能调优
分布式 SQL 引擎
带 Apache Arrow 的 Pandas 的 PySpark 使用指南
迁移指南
SQL 参考
ANSI 兼容性
数据类型
日期时间模式
数字模式
函数
标识符
字面量
空值语义
SQL 语法
错误条件
SQL参考
Spark SQL 是 Apache Spark 用于处理结构化数据的模块。此指南是结构化查询语言(SQL)的参考,包括语法、语义、关键字和常见 SQL 用法的示例。它包含以下主题的信息:
ANSI 合规性
数据类型
日期时间模式
数字模式
函数
内置函数
标量用户定义函数 (UDFs)
用户定义聚合函数 (UDAFs)
与 Hive UDFs/UDAFs/UDTFs 的集成
标识符
IDENTIFIER 子句
文字常量
空语义
SQL 语法
DDL 语句
DML 语句
数据检索语句
辅助语句