Apache Zeppelin 的 Hive 解释器

重要通知

Hive 解释器已被弃用并合并到 JDBC 解释器中。您可以通过使用具有相同功能的 JDBC 解释器来使用 Hive 解释器。请参阅下面的设置和依赖项示例。

属性

属性
default.driver org.apache.hive.jdbc.HiveDriver
default.url jdbc:hive2://localhost:10000
default.user hiveUser
默认密码 hivePassword

依赖项

工件 排除
org.apache.hive:hive-jdbc:0.14.0
org.apache.hadoop:hadoop-common:2.6.0

配置

属性 默认值 描述
default.driver org.apache.hive.jdbc.HiveDriver JDBC驱动程序的类路径
default.url jdbc:hive2://localhost:10000 连接URL
default.user ( 可选 ) 连接的用户名
default.password ( 可选 ) 连接的密码
default.xxx ( 可选 ) 驱动程序使用的其他属性
zeppelin.jdbc.hive.timeout.threshold 60000 Hive作业超时的时间阈值
zeppelin.jdbc.hive.monitor.query_interval 1000 Hive语句的查询间隔
zeppelin.jdbc.hive.engines.tag.enable true 为hive引擎启动的应用程序设置应用标签

概述

Apache Hive ™ 数据仓库软件便于查询和管理驻留在分布式存储中的大型数据集。Hive 提供了一种机制,可以将结构投影到这些数据上,并使用一种类似 SQL 的语言 HiveQL 来查询数据。同时,这种语言还允许传统的 map/reduce 程序员在 HiveQL 中表达这种逻辑不方便或效率低下时,插入他们自定义的 mapper 和 reducer。

如何使用

基本上,你可以使用

%hive
select * from my_table;

默认情况下,您还可以运行最多10个查询。更改这些设置尚未实现。

应用Zeppelin动态表单

您可以在查询中利用Zeppelin动态表单。您可以使用文本输入选择表单参数化功能。

%hive
SELECT ${group_by}, count(*) as count
FROM retail_demo.order_lineitems_pxf
GROUP BY ${group_by=product_id,product_id|product_name|customer_id|store_id}
ORDER BY count ${order=DESC,DESC|ASC}
LIMIT ${limit=10};