跳至内容

兼容性矩阵

以下表格展示了互斥功能特性及在某些硬件上的支持情况。

使用的符号具有以下含义:

  • ✅ = 完全兼容
  • 🟠 = 部分兼容
  • ❌ = 不兼容
  • ❔ = 未知或待定

注意

检查带有链接的❌或🟠,查看不支持功能/硬件组合的跟踪问题。

功能 x 功能

功能 CP APC LoRA SD CUDA图 池化 编码-解码 对数概率 提示对数概率 异步输出 多步 多模态 最优选择 束搜索
CP
APC
LoRA
SD
CUDA图
pooling 🟠* 🟠*
enc-dec
logP
prmpt logP
异步输出
多步骤
mm 🟠^
best-of
beam-search

* 分块预填充和前缀缓存仅适用于最后词元池化。
^ LoRA仅适用于多模态模型的语言主干部分。

特性 x 硬件

特性 Volta Turing Ampere Ada Hopper CPU AMD TPU
CP
APC
LoRA
SD
CUDA图
pooling
编码-解码
mm
logP
提示词日志概率
异步输出
多步骤
best-of
beam-search

注意

有关AWS Neuron硬件支持的功能,请参阅通过NxD Inference后端实现的功能支持

优云智算