跳到主要内容

Ollama Docker 镜像部署

仅使用 CPU

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

使用 Nvidia GPU

首先需要安装 NVIDIA Container Toolkit(NVIDIA 容器工具包)

使用 Apt 安装

  1. 配置软件源

    curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
    | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
    curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
    | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
    | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    sudo apt-get update
  2. 安装 NVIDIA Container Toolkit 软件包

    sudo apt-get install -y nvidia-container-toolkit

使用 Yum 或 Dnf 安装

  1. 配置软件源

    curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \
    | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
  2. 安装 NVIDIA Container Toolkit 软件包

    sudo yum install -y nvidia-container-toolkit

配置 Docker 使用 Nvidia 驱动

sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
#### 启动容器

```shell
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

注意:
如果您在 NVIDIA JetPack 系统上运行,Ollama 无法自动检测正确的 JetPack 版本。请在容器中传递环境变量 JETSON_JETPACK=5 或 JETSON_JETPACK=6 来选择版本 5 或版本 6。

使用 AMD GPU

要在 Docker 中使用 AMD GPU 运行 Ollama,请使用 rocm 标签和以下命令:

docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm

在本地运行模型

现在您可以运行一个模型:

docker exec -it ollama ollama run llama3.2

尝试不同的模型

更多模型可以在 Ollama 模型库 中找到。

优云智算