快速安装
本页面将指导您快速安装和设置 LLAMA.CPP。
系统要求
- 操作系统: Linux, macOS, Windows
- 内存: 至少 4GB RAM(建议 8GB 或更多)
- 存储: 至少 1GB 可用空间
- 编译器: GCC 或 Clang(如果从源码构建)
安装方式
方式 1: 使用包管理器 (推荐)
macOS (Homebrew)
brew install llama.cpp
Linux (从预编译二进制文件)
# 下载最新版本
wget https://github.com/ggml-org/llama.cpp/releases/latest/download/llama.cpp-linux-x64.tar.gz
# 解压
tar -xzf llama.cpp-linux-x64.tar.gz
# 移动到系统路径
sudo mv llama.cpp-linux-x64/* /usr/local/bin/
方式 2: 从源码构建
# 克隆仓库
git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
# 构建
make
# 或者使用 CMake
mkdir build && cd build
cmake ..
make -j4
方式 3: 使用 Docker
# 运行预构建的 Docker 容器
docker run -it --rm ghcr.io/ggml-org/llama.cpp:latest
# 或者构建自己的镜像
git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
docker build -t llama.cpp .
验证安装
运行以下命令验证安装是否成功:
llama-cli --help
如果看到帮助信息,说明安装成功!
下一步
安装完成后,您可以:
常见问题
Q: 编译时出现错误怎么办?
A: 请确保您的系统安装了必要的开发工具:
# Ubuntu/Debian
sudo apt update && sudo apt install build-essential
# CentOS/RHEL
sudo yum groupinstall "Development Tools"
# macOS
xcode-select --install
Q: 如何启用 GPU 支持?
A: 请参考 GPU 支持文档 了解如何为不同的 GPU 类型启用硬件加速。