camel.models.reward 包#
子模块#
camel.models.reward.base_reward_model 模块#
- class camel.models.reward.base_reward_model.BaseRewardModel(model_type: ~<unknown>.ModelType | str, api_key: str | None = None, url: str | None = None)[来源]#
基类:
ABC奖励模型的抽象基类。奖励模型用于评估消息并根据不同标准返回分数。
子类应实现'evaluate'和'get_scores_types'方法。
camel.models.reward.evaluator 模块#
- class camel.models.reward.evaluator.Evaluator(reward_model: BaseRewardModel)[来源]#
基类:
objectEvaluator类用于通过奖励模型评估消息并根据分数过滤数据。
- Parameters:
reward_model (BaseRewardModel) – 用于评估消息的奖励模型。
camel.models.reward.nemotron_model 模块#
- class camel.models.reward.nemotron_model.NemotronRewardModel(model_type: ~<unknown>.ModelType | str, api_key: str | None = None, url: str | None = None)[来源]#
基础类:
BaseRewardModel基于Nemotron模型并兼容OpenAI的奖励模型。
- Parameters:
model_type (Union[ModelType, str]) - 创建后端所用的模型。
api_key (Optional[str], optional) – 用于模型服务认证的API密钥。(默认:
None)url (可选[str], optional) - 模型服务的URL地址。
注意
Nemotron模型不支持模型配置。
camel.models.reward.skywork_model 模块#
- class camel.models.reward.skywork_model.SkyworkRewardModel(model_type: ~<unknown>.ModelType | str, api_key: str | None = None, url: str | None = None, device_map: str | None = 'auto', attn_implementation: str | None = 'flash_attention_2', offload_folder: str | None = 'offload')[来源]#
基础类:
BaseRewardModel基于transformers的奖励模型,它将从huggingface下载模型。
- Parameters:
model_type (Union[ModelType, str]) - 创建后端所用的模型。
api_key (Optional[str], optional) – 未使用。(默认值:
None)url (可选[str], 可选) – 未使用。(默认值:
None)device_map (Optional[str], optional) - 选择设备映射。 (默认:
auto)attn_implementation (Optional[str], optional) - 选择注意力实现方式。(默认:
flash_attention_2)offload_folder (可选[str], 可选) – 选择卸载文件夹。 (默认:
offload)
模块内容#
- class camel.models.reward.BaseRewardModel(model_type: ~<unknown>.ModelType | str, api_key: str | None = None, url: str | None = None)[来源]#
基类:
ABC奖励模型的抽象基类。奖励模型用于评估消息并根据不同标准返回分数。
子类应实现'evaluate'和'get_scores_types'方法。
- class camel.models.reward.Evaluator(reward_model: BaseRewardModel)[来源]#
基类:
objectEvaluator类用于通过奖励模型评估消息并根据分数过滤数据。
- Parameters:
reward_model (BaseRewardModel) – 用于评估消息的奖励模型。
- class camel.models.reward.NemotronRewardModel(model_type: ~<unknown>.ModelType | str, api_key: str | None = None, url: str | None = None)[来源]#
基础类:
BaseRewardModel基于Nemotron模型并兼容OpenAI的奖励模型。
- Parameters:
model_type (Union[ModelType, str]) - 创建后端所用的模型。
api_key (Optional[str], optional) – 用于模型服务认证的API密钥。(默认:
None)url (可选[str], optional) - 模型服务的URL地址。
注意
Nemotron模型不支持模型配置。
- class camel.models.reward.SkyworkRewardModel(model_type: ~<unknown>.ModelType | str, api_key: str | None = None, url: str | None = None, device_map: str | None = 'auto', attn_implementation: str | None = 'flash_attention_2', offload_folder: str | None = 'offload')[来源]#
基础类:
BaseRewardModel基于transformers的奖励模型,它将从huggingface下载模型。
- Parameters:
model_type (Union[ModelType, str]) - 创建后端所用的模型。
api_key (Optional[str], optional) – 未使用。(默认:
None)url (可选[str], 可选) – 未使用。(默认值:
None)device_map (Optional[str], optional) – 选择设备映射。 (默认值:
auto)attn_implementation (Optional[str], optional) – 选择注意力机制的实现方式。(默认:
flash_attention_2)offload_folder (Optional[str], optional) – 选择卸载文件夹。 (默认:
offload)