快速安装

本页面将指导您快速安装和设置 LLAMA.CPP。

系统要求

操作系统: Linux, macOS, Windows
内存: 至少 4GB RAM（建议 8GB 或更多）
存储: 至少 1GB 可用空间
编译器: GCC 或 Clang（如果从源码构建）

安装方式

方式 1: 使用包管理器 (推荐)

macOS (Homebrew)

brew install llama.cpp

Linux (从预编译二进制文件)

# 下载最新版本
wget https://github.com/ggml-org/llama.cpp/releases/latest/download/llama.cpp-linux-x64.tar.gz

# 解压
tar -xzf llama.cpp-linux-x64.tar.gz

# 移动到系统路径
sudo mv llama.cpp-linux-x64/* /usr/local/bin/

方式 2: 从源码构建

# 克隆仓库
git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp

# 构建
make

# 或者使用 CMake
mkdir build && cd build
cmake ..
make -j4

方式 3: 使用 Docker

# 运行预构建的 Docker 容器
docker run -it --rm ghcr.io/ggml-org/llama.cpp:latest

# 或者构建自己的镜像
git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
docker build -t llama.cpp .

验证安装

运行以下命令验证安装是否成功：

llama-cli --help

如果看到帮助信息，说明安装成功！

下一步

安装完成后，您可以：

获取模型文件 - 下载或转换模型
运行第一个推理 - 尝试运行一个简单的对话
探索工具 - 了解各种命令行工具

常见问题

Q: 编译时出现错误怎么办？

A: 请确保您的系统安装了必要的开发工具：

# Ubuntu/Debian
sudo apt update && sudo apt install build-essential

# CentOS/RHEL
sudo yum groupinstall "Development Tools"

# macOS
xcode-select --install

Q: 如何启用 GPU 支持？

A: 请参考 GPU 支持文档了解如何为不同的 GPU 类型启用硬件加速。

系统要求​

安装方式​

方式 1: 使用包管理器 (推荐)​

macOS (Homebrew)​

Linux (从预编译二进制文件)​

方式 2: 从源码构建​

方式 3: 使用 Docker​

验证安装​

下一步​

常见问题​

Q: 编译时出现错误怎么办？​

Q: 如何启用 GPU 支持？​

系统要求

安装方式

方式 1: 使用包管理器 (推荐)

macOS (Homebrew)

Linux (从预编译二进制文件)

方式 2: 从源码构建

方式 3: 使用 Docker

验证安装

下一步

常见问题

Q: 编译时出现错误怎么办？

Q: 如何启用 GPU 支持？