与Hadoop集成

Hadoop 是 Zeppelin 的可选组件,除非你需要以下功能

  • 使用hdfs存储笔记。
  • 使用 hdfs 存储解释器配置
  • 使用 hdfs 存储恢复数据
  • 在yarn模式下启动解释器

需求

Zeppelin 0.9 不附带 hadoop 依赖项,您需要通过以下步骤自行包含 hadoop jar 包

  • 已安装Hadoop客户端(支持2.x和3.x版本)。
  • $HADOOP_HOME/bin 被放入 PATH 中。因为内部 Zeppelin 会运行命令 hadoop classpath 来获取所有 Hadoop 的 jar 包,并将它们放入 Zeppelin 的类路径中。
  • zeppelin-env.sh中将USE_HADOOP设置为true