Apache Zeppelin 的 Hive 解释器
重要通知
Hive 解释器已被弃用并合并到 JDBC 解释器中。您可以通过使用具有相同功能的 JDBC 解释器来使用 Hive 解释器。请参阅下面的设置和依赖项示例。
属性
| 属性 | 值 |
|---|---|
| default.driver | org.apache.hive.jdbc.HiveDriver |
| default.url | jdbc:hive2://localhost:10000 |
| default.user | hiveUser |
| 默认密码 | hivePassword |
依赖项
| 工件 | 排除 |
|---|---|
| org.apache.hive:hive-jdbc:0.14.0 | |
| org.apache.hadoop:hadoop-common:2.6.0 |
配置
| 属性 | 默认值 | 描述 |
|---|---|---|
| default.driver | org.apache.hive.jdbc.HiveDriver | JDBC驱动程序的类路径 |
| default.url | jdbc:hive2://localhost:10000 | 连接URL |
| default.user | ( 可选 ) 连接的用户名 | |
| default.password | ( 可选 ) 连接的密码 | |
| default.xxx | ( 可选 ) 驱动程序使用的其他属性 | |
| zeppelin.jdbc.hive.timeout.threshold | 60000 | Hive作业超时的时间阈值 |
| zeppelin.jdbc.hive.monitor.query_interval | 1000 | Hive语句的查询间隔 |
| zeppelin.jdbc.hive.engines.tag.enable | true | 为hive引擎启动的应用程序设置应用标签 |
概述
Apache Hive ™ 数据仓库软件便于查询和管理驻留在分布式存储中的大型数据集。Hive 提供了一种机制,可以将结构投影到这些数据上,并使用一种类似 SQL 的语言 HiveQL 来查询数据。同时,这种语言还允许传统的 map/reduce 程序员在 HiveQL 中表达这种逻辑不方便或效率低下时,插入他们自定义的 mapper 和 reducer。
如何使用
基本上,你可以使用
%hive
select * from my_table;
默认情况下,您还可以运行最多10个查询。更改这些设置尚未实现。
应用Zeppelin动态表单
您可以在查询中利用Zeppelin动态表单。您可以使用文本输入和选择表单参数化功能。
%hive
SELECT ${group_by}, count(*) as count
FROM retail_demo.order_lineitems_pxf
GROUP BY ${group_by=product_id,product_id|product_name|customer_id|store_id}
ORDER BY count ${order=DESC,DESC|ASC}
LIMIT ${limit=10};