Apache Zeppelin 的 Hive 解释器

重要通知

Hive 解释器已被弃用并合并到 JDBC 解释器中。您可以通过使用具有相同功能的 JDBC 解释器来使用 Hive 解释器。请参阅下面的设置和依赖项示例。

属性

属性	值
default.driver	org.apache.hive.jdbc.HiveDriver
default.url	jdbc:hive2://localhost:10000
default.user	hiveUser
默认密码	hivePassword

依赖项

工件	排除
org.apache.hive:hive-jdbc:0.14.0
org.apache.hadoop:hadoop-common:2.6.0

配置

属性	默认值	描述
default.driver	org.apache.hive.jdbc.HiveDriver	JDBC驱动程序的类路径
default.url	jdbc:hive2://localhost:10000	连接URL
default.user		( 可选 ) 连接的用户名
default.password		( 可选 ) 连接的密码
default.xxx		( 可选 ) 驱动程序使用的其他属性
zeppelin.jdbc.hive.timeout.threshold	60000	Hive作业超时的时间阈值
zeppelin.jdbc.hive.monitor.query_interval	1000	Hive语句的查询间隔
zeppelin.jdbc.hive.engines.tag.enable	true	为hive引擎启动的应用程序设置应用标签

概述

Apache Hive ™ 数据仓库软件便于查询和管理驻留在分布式存储中的大型数据集。Hive 提供了一种机制，可以将结构投影到这些数据上，并使用一种类似 SQL 的语言 HiveQL 来查询数据。同时，这种语言还允许传统的 map/reduce 程序员在 HiveQL 中表达这种逻辑不方便或效率低下时，插入他们自定义的 mapper 和 reducer。

如何使用

基本上，你可以使用

%hive
select * from my_table;

默认情况下，您还可以运行最多10个查询。更改这些设置尚未实现。

应用Zeppelin动态表单

您可以在查询中利用Zeppelin动态表单。您可以使用文本输入和选择表单参数化功能。

%hive
SELECT ${group_by}, count(*) as count
FROM retail_demo.order_lineitems_pxf
GROUP BY ${group_by=product_id,product_id|product_name|customer_id|store_id}
ORDER BY count ${order=DESC,DESC|ASC}
LIMIT ${limit=10};