故障排除 (AEN 4.2.0)#
本故障排除指南为您提供了处理AEN安装过程中可能出现问题的方法。
一般故障排除步骤¶
- Clear browser cookies. When you change the AEN configuration or upgrade AEN, cookies remaining in the browser can cause issues. Clearing cookies and logging in again can help to resolve problems.
- 确保 NGINX 和 MongoDB 正在运行.
- Make sure that AEN services are 设置为启动时启动, on all nodes.
- 确保服务正在运行 as expected. If any services are not running or are missing, 重启它们.
- 检查并移除多余进程.
- 检查节点之间的连接性.
- 检查配置文件语法.
- 检查文件所有权.
- 验证POSIX ACLs是否已启用.
浏览器错误:重定向过多¶
原因¶
浏览器cookie已过期。
解决方案¶
- Log out.
- Clear the browser’s cookies.
- Clear the browser cache.
- Log in.
错误:unix:////opt/wakari/wakari-server/etc/supervisor.sock 文件不存在¶
这是一个supervisorctl错误。
原因¶
supervisord 未在服务器上运行。
解决方案¶
确保在crontab中包含supervisord。然后手动重启supervisord。
错误:删除项目时出现“数据中心未找到”¶
原因¶
数据中心已被移除。
解决方案¶
以root身份运行:
/opt/wakari/wakari-server/bin/wk-server-admin remove-project --db-only <user> <project>
忘记管理员密码¶
使用ssh以root身份登录服务器。
运行:
/opt/wakari/wakari-server/bin/wk-server-admin reset-password -u SOME_USER -p SOME_PASSWORD
注意:将SOME_USER替换为管理员用户名,将SOME_PASSWORD替换为密码。
使用新密码以管理员用户身份登录AEN。
或者您可以添加一个管理员用户:
使用ssh以root身份登录服务器。
运行:
/opt/wakari/wakari-server/bin/wk-server-admin add-user SOME_USER --admin -p SOME_PASSWORD -e YOUR_EMAIL
注意:将SOME_USER替换为用户名,将SOME_PASSWORD替换为密码,并将YOUR_EMAIL替换为您的电子邮件地址。
使用新密码以管理员用户身份登录AEN。
日志文件被删除¶
日志文件正在被删除。
注意:每个进程和应用程序的AEN日志文件的位置在概念部分的节点章节中显示。
原因¶
AEN安装程序登录到
/tmp/wakari\_{server,gateway,compute}.log
。如果日志文件
变得太大,它们可能会被删除。
解决方案¶
为了使日志更加详细或简洁,Jupyter Notebooks 使用了 Application.log_level。
为了使日志比默认设置更简洁,但仍然保持信息性,将 Application.log_level 设置为 ERROR。
错误:此套接字已关闭¶
当你尝试启动应用程序时,会收到“此套接字已关闭”的错误消息。
解决方案¶
为了防止这个问题:
- Follow the instructions in 管理服务 to stop and restart processes.
- Do not stop or kill supervisord without first stopping wk-compute and any other processes that use it.
要解决“此套接字已关闭”错误:
通过运行
sudo kill -9
来停止wk-compute。重新启动supervisord和wk-compute进程:
sudo /etc/init.d/wakari-compute stop sudo /etc/init.d/wakari-compute start
服务错误502:无法连接到应用程序管理器¶
网关节点显示“服务错误502:无法连接到应用程序管理器。”
原因¶
计算节点没有响应,因为wk-compute进程已停止。
解决方案¶
停止然后重新启动supervisord和wk-compute进程:
sudo /etc/init.d/wakari-compute stop
sudo /etc/init.d/wakari-compute start
亚马逊网络服务(AWS)上的502通信错误¶
您收到“502 通信错误:此网关无法与 Wakari 服务器通信”的错误消息。
原因¶
AEN网关无法与AWS上的Wakari服务器通信。可能是Wakari服务器的IP地址有问题。
解决方案¶
配置您的AEN网关以使用服务器的DNS主机名。 在AWS上,这是Amazon Elastic Compute Cloud (EC2)实例的DNS主机名。
无效的用户名¶
原因¶
用户名不符合以下一个或多个规则:
- Must be at least 3 characters and no more than 25 characters.
- The first character must be a letter (A-Z) or a digit (0-9).
- Other characters can be a letter, digit, period (.), underscore (_) or hyphen (-).
- The POSIX standard specifies that these characters are the portable filename character set, and that portable usernames have the same character set.
解决方案¶
遵循上述用户名规则。
笔记本错误:无法通过LaTeX下载笔记本为PDF¶
原因¶
LaTeX 未正确安装。
CentOS/6 解决方案¶
从TUG网站安装TeXLive。 按照描述的步骤进行操作。安装可能需要一些时间。
将安装添加到文件
/etc/profile.d/latex.sh
中的PATH
。根据需要替换年份和架构,添加以下内容:PATH=/usr/local/texlive/2017/bin/x86_64-linux:$PATH
重新启动计算节点。
CentOS/7 解决方案¶
安装缺失的包,运行以下命令:
yum install texlive texlive-xetex texlive-xetexconfig texlive-xetex-def texlive-adjustbox texlive-upquote texlive-ulem