UpdateDeploymentConfig
以下是更新部署配置的类定义。它继承自Pydantic中定义的BaseModel。
class UpdateDeploymentConfig(BaseModel):
cooldown_time: PositiveInt | None = Field(default=None)
custom_args: list[str] | None = Field(default=None)
hf_token: str | None = Field(default=None)
min_replicas: NonNegativeInt | None = Field(default=None)
max_replicas: PositiveInt | None = Field(default=None)
scale_up_threshold: PositiveInt | None = Field(default=None)
max_total_tokens: int | None = Field(default=None)
lorax_image_tag: str | None = Field(default=None)
request_logging_enabled: bool | None = Field(default=None)
direct_ingress: bool | None = Field(default=None)
preloaded_adapters: list[str] | None = Field(default=None)
speculator: str | None = Field(default=None)
prefix_caching: bool | None = Field(default=None)
这些字段的含义与DeploymentConfig中的字段相同。
请注意,有大量(高级)配置参数是通过custom_args字段配置的。更多信息请参阅DeploymentConfig的custom_args部分。
所有这些字段的默认值都是None。在更新部署时,任何设置为None的字段将保持其当前部署值不变。非None字段将被更新为字段中指定的值。
更多信息请参阅更新部署。
NOTES
- 要将lorax版本更新至最新支持的版本,请将
lorax_image_tag设置为。 - 当更新为新的
custom_args值时,必须提供新custom_args字段的完整值。例如,如果现有值是['foo']而您希望它变为['foo', 'bar'],则必须提供['foo', 'bar']作为新值。