Ollama Docker 镜像部署
仅使用 CPU
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
使用 Nvidia GPU
首先需要安装 NVIDIA Container Toolkit(NVIDIA 容器工具包)。
使用 Apt 安装
-
配置软件源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
| sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
| sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
| sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update -
安装 NVIDIA Container Toolkit 软件包
sudo apt-get install -y nvidia-container-toolkit
使用 Yum 或 Dnf 安装
-
配置软件源
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \
| sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo -
安装 NVIDIA Container Toolkit 软件包
sudo yum install -y nvidia-container-toolkit
配置 Docker 使用 Nvidia 驱动
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
#### 启动容器
```shell
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
注意:
如果您在 NVIDIA JetPack 系统上运行,Ollama 无法自动检测正确的 JetPack 版本。请在容器中传递环境变量 JETSON_JETPACK=5 或 JETSON_JETPACK=6 来选择版本 5 或版本 6。
使用 AMD GPU
要在 Docker 中使用 AMD GPU 运行 Ollama,请使用 rocm 标签和以下命令:
docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm
在本地运行模型
现在您可以运行一个模型:
docker exec -it ollama ollama run llama3.2
尝试不同的模型
更多模型可以在 Ollama 模型库 中找到。