Spark Session ¶
使用数据集和数据框API编程Spark的入口点。
要创建一个Spark会话,您应该使用
SparkSession.builder
属性。
另见
SparkSession
。
返回当前线程的活动或默认
|
|
为应用程序设置一个名称,该名称将在Spark网页用户界面中显示。 |
|
|
设置一个配置选项。 |
启用Hive支持,包括与持久Hive元存储的连接、对Hive SerDes的支持和Hive用户定义函数。 |
|
获取一个现有的
|
|
设置要连接的 Spark master URL,例如“local”表示本地运行,“local[4]”表示在本地使用 4 个核心运行,或“spark://master:7077”表示在 Spark 独立集群上运行。 |
|
设置要连接的 Spark 远程 URL,例如“sc://host:port”,以通过 Spark Connect 服务器运行。 |
|
用户可以通过此接口创建、删除、修改或查询底层数据库、表、函数等。 |
|
Spark的运行时配置接口。 |
|
|
从一个
|
返回当前线程的活动
|
|
返回一个新的
|
|
|
创建一个
|
返回一个
|
|
返回一个
|
|
返回基础的
|
|
|
返回一个
|
停止基础的
|
|
返回一个
|
|
|
返回指定的表作为一个
|
返回一个
|
|
返回一个
|
|
该应用程序运行的Spark版本。 |
Spark Connect Only ¶
创建一个新的 SparkSession。 |
|
|
将工件添加到客户端会话。 |
|
将工件添加到客户端会话。 |
|
将文件从本地复制到云存储文件系统。 |
提供对Spark Connect客户端的访问。 |
|
中断当前在连接服务器上运行的所有操作。 |
|
使用给定的操作标签中断此会话的所有操作。 |
|
|
使用给定的 operationId 中断此会话的操作。 |
|
为本会话中由此线程启动的所有操作分配一个标签。 |
移除之前添加的标签,以便分配给该会话中由此线程启动的所有操作。 |
|
获取目前设置为分配给此线程启动的所有操作的标签。 |
|
清除当前线程的操作标记。 |