安装
欢迎来到Apache Zeppelin!本页提供了帮助您入门的说明。
需求
Apache Zeppelin 官方支持并在以下环境中进行了测试:
| 名称 | 值 |
|---|---|
| OpenJDK 或 Oracle JDK | 1.8 (151+) (设置 JAVA_HOME) |
| 操作系统 | Mac OSX Ubuntu 18.04 Ubuntu 20.04 |
下载二进制包
在下载页面上提供了两个二进制包。这两个二进制包之间的唯一区别是是否所有解释器都包含在包文件中。
- 所有解释器包:将其解压到您选择的目录中,然后您就可以开始使用了。
- 网络安装解释器包:仅包含spark、python、markdown和shell解释器。解压并按照安装其他解释器的步骤来安装其他解释器。如果不确定,只需运行
./bin/install-interpreter.sh --all并安装所有解释器。
从源代码构建 Zeppelin
按照如何构建的说明,如果你想从源代码构建而不是使用二进制包。
启动 Apache Zeppelin
从命令行启动 Apache Zeppelin
在所有类Unix平台上:
bin/zeppelin-daemon.sh start
在Zeppelin成功启动后,使用您的网页浏览器访问http://localhost:8080。
默认情况下,Zeppelin 监听在 127.0.0.1:8080,因此当它部署在另一台远程机器上时,您无法访问它。
要访问远程的 Zeppelin,您需要在 conf/zeppelin-site.xml 中将 zeppelin.server.addr 更改为 0.0.0.0。
如果无法打开Zeppelin,请检查日志文件位于ZEPPELIN_HOME/logs/zeppelin-server-*.log。
停止Zeppelin
bin/zeppelin-daemon.sh stop
使用官方的docker镜像
确保您的本地机器上安装了docker。
使用此命令在容器中启动Apache Zeppelin。
docker run -p 8080:8080 --rm --name zeppelin apache/zeppelin:0.11.2
要持久化logs和notebook目录,请使用docker容器的volume选项。
docker run -u $(id -u) -p 8080:8080 --rm -v $PWD/logs:/logs -v $PWD/notebook:/notebook \
-e ZEPPELIN_LOG_DIR='/logs' -e ZEPPELIN_NOTEBOOK_DIR='/notebook' \
--name zeppelin apache/zeppelin:0.11.2
-u $(id -u) 是为了确保您有权限写入日志和笔记本。
对于许多解释器,它们需要其他依赖项,例如Spark解释器需要Spark二进制分发,Flink解释器需要Flink二进制分发。您也可以通过docker卷挂载它们。例如。
docker run -u $(id -u) -p 8080:8080 --rm -v /mnt/disk1/notebook:/notebook \
-v /usr/lib/spark-current:/opt/spark -v /mnt/disk1/flink-1.12.2:/opt/flink -e FLINK_HOME=/opt/flink \
-e SPARK_HOME=/opt/spark -e ZEPPELIN_NOTEBOOK_DIR='/notebook' --name zeppelin apache/zeppelin:0.11.2
如果您在浏览器中访问localhost:8080时遇到问题,请清除浏览器缓存。
使用服务管理器启动 Apache Zeppelin
注意: 以下描述是基于Ubuntu编写的。
Apache Zeppelin 可以通过使用像 upstart 这样的服务管理器,使用初始化脚本自动启动为服务。
这是一个示例的upstart脚本,保存为/etc/init/zeppelin.conf
这允许使用诸如以下命令来管理服务
sudo service zeppelin start
sudo service zeppelin stop
sudo service zeppelin restart
其他服务管理器可以使用类似的方法,将upstart参数传递给zeppelin-daemon.sh脚本。
bin/zeppelin-daemon.sh upstart
zeppelin.conf
description "zeppelin"
start on (local-filesystems and net-device-up IFACE!=lo)
stop on shutdown
# Respawn the process on unexpected termination
respawn
# respawn the job up to 7 times within a 5 second period.
# If the job exceeds these values, it will be stopped and marked as failed.
respawn limit 7 5
# zeppelin was installed in /usr/share/zeppelin in this example
chdir /usr/share/zeppelin
exec bin/zeppelin-daemon.sh upstart
下一步
恭喜,您已成功安装Apache Zeppelin!以下是一些您可能会觉得有用的步骤:
新手上路 Apache Zeppelin...
- 如需深入了解,请前往探索Zeppelin UI。
- 然后,尝试运行随您的Zeppelin发行版附带的教程笔记本。
- 并了解如何更改配置,如端口号等。
Spark, Flink, SQL, Python, R 等
- Zeppelin中的Spark支持,了解更多关于与Apache Spark深度集成的信息。
- Zeppelin中的Flink支持,了解更多关于与Apache Flink的深度集成。
- SQL support in Zeppelin 用于SQL支持
- Zeppelin中的Python支持,用于Matplotlib、Pandas、Conda/Docker集成。
- Zeppelin中的R支持
- 所有可用的解释器
多用户支持 ...
- 检查 多用户支持