您正在查看最新的开发者预览版文档。点击此处查看最新稳定版的文档。

vLLM

用户指南

正在初始化搜索

首页
用户指南
开发者指南
API参考文档
CLI 参考文档
社区

vLLM

首页
User Guide
User Guide
- 用户指南
- vLLM V1
- General
  General
- Inference and Serving
  Inference and Serving
- Deployment
  Deployment
- Training
  Training
  - 基于人类反馈的强化学习
  - 变换器强化学习
- Configuration
  Configuration
- Models
  Models
- Features
  Features
开发者指南
API参考文档
CLI参考文档
社区

使用vLLM¶

vLLM 支持以下使用模式：

Inference and Serving: 运行模型的单个实例。
Deployment: 为生产环境扩展模型实例。
训练: 训练或微调模型。

May 24, 2025

Made with Material for MkDocs

优云智算