跳至内容
GPUStack
API参考文档
正在初始化搜索
GitHub
GPUStack
GitHub
概述
快速入门
Installation
Installation
安装要求
NVIDIA CUDA
NVIDIA CUDA
在线安装
隔离式安装
AMD ROCm
AMD ROCm
在线安装
隔离式安装
Apple Metal
Ascend CANN
Ascend CANN
在线安装
隔离式安装
Hygon DTK
Hygon DTK
在线安装
隔离式安装
Moore Threads MUSA
Moore Threads MUSA
在线安装
隔离式安装
CPU
CPU
在线安装
隔离式安装
安装脚本
卸载
升级
User Guide
User Guide
游乐场
Playground
聊天
镜像
音频
嵌入
重新排序
模型管理
模型目录
模型文件管理
API密钥管理
用户管理
推理后端
固定的后端版本
兼容性检查
OpenAI兼容API
图像生成API
重排序API
Using Models
Using Models
使用大型语言模型
使用视觉语言模型
使用嵌入模型
使用Reranker模型
使用图像生成模型
图像生成模型的推荐参数
编辑图片
使用音频模型
Tutorials
Tutorials
使用分布式vLLM运行DeepSeek R1 671B
跨工作节点执行分布式推理(llama-box)
在CPU上进行推理
使用工具调用的推理
在搭载骁龙X的Copilot+ PC上运行
Integrations
Integrations
OpenAI兼容API
与Dify集成
与RAGFlow集成
架构
调度器
故障排除
常见问题
API参考文档
CLI Reference
CLI Reference
开始
聊天
绘图
下载工具
API 参考文档
GPUStack提供了一个内置的Swagger UI界面。您可以通过在浏览器中访问
/docs
来查看和操作API接口。