与Hadoop集成
Hadoop 是 Zeppelin 的可选组件,除非你需要以下功能
- 使用hdfs存储笔记。
- 使用 hdfs 存储解释器配置
- 使用 hdfs 存储恢复数据
- 在yarn模式下启动解释器
需求
Zeppelin 0.9 不附带 hadoop 依赖项,您需要通过以下步骤自行包含 hadoop jar 包
- 已安装Hadoop客户端(支持2.x和3.x版本)。
$HADOOP_HOME/bin被放入PATH中。因为内部 Zeppelin 会运行命令hadoop classpath来获取所有 Hadoop 的 jar 包,并将它们放入 Zeppelin 的类路径中。- 在
zeppelin-env.sh中将USE_HADOOP设置为true。