您正在查看最新的开发者预览版文档。点击此处查看最新稳定版的文档。

vLLM

概述

正在初始化搜索

首页
用户指南
开发者指南
API参考文档
CLI 参考文档
社区

vLLM

首页
User Guide
User Guide
- 用户指南
- vLLM V1
- General
  General
- Inference and Serving
  Inference and Serving
- Deployment
  Deployment
- Training
  Training
  - 基于人类反馈的强化学习
  - 变换器强化学习
- Configuration
  Configuration
- Models
  Models
- Features
  Features
开发者指南
API参考文档
CLI参考文档
社区

配置选项¶

本节列出了运行vLLM时最常用的选项。

配置主要分为三个层级，按优先级从高到低依次为：

Request parameters 和 input arguments
引擎参数
环境变量

May 26, 2025

Made with Material for MkDocs

优云智算