Google Vertex 聊天模型节点#
使用Google Vertex AI聊天模型节点,将Google的Vertex AI聊天模型与对话智能体结合使用。
本页面将介绍Google Vertex AI聊天模型节点的参数配置,并提供更多相关资源的链接。
Credentials
您可以在此节点的此处找到认证信息。
子节点中的参数解析
在使用表达式处理多个项目时,子节点的行为与其他节点不同。
大多数节点(包括根节点)可以接收任意数量的项目作为输入,处理这些项目并输出结果。您可以使用表达式来引用输入项,节点会依次为每个项目解析该表达式。例如,给定五个name值的输入,表达式{{ $json.name }}会依次解析为每个名称。
在子节点中,表达式始终解析为第一项。例如,给定五个name值输入时,表达式{{ $json.name }}总是解析为第一个名称。
节点参数#
- 项目ID: 从您的Google Cloud账户中选择要使用的项目ID。n8n会动态加载Google Cloud账户中的项目,但您也可以手动输入。
- 模型名称: 选择用于生成补全的模型名称,例如
gemini-1.5-flash-001,gemini-1.5-pro-001等。参考 Google models 获取可用模型列表。
节点选项#
- 最大令牌数: 输入使用的最大令牌数,这将设置完成长度。
- 采样温度: 使用此选项控制采样过程的随机性。较高的温度会产生更多样化的采样结果,但会增加产生幻觉的风险。
- Top K: 输入模型用于生成下一个token的候选token数量。
- Top P: 使用此选项设置补全应采用的概率值。设置较低的值可以忽略概率较低的选项。
- 安全设置: Gemini支持可调节的安全设置。有关可用过滤器和级别的信息,请参阅Google的Gemini API安全设置。
模板和示例#
相关资源#
有关该服务的更多信息,请参阅LangChain的Google Vertex AI文档。
查看n8n的高级AI文档。
AI术语表#
- completion: 补全(completion)是指由GPT等模型生成的响应内容。
- 幻觉: AI中的幻觉是指大型语言模型(LLM)错误地感知到不存在的模式或对象。
- 向量数据库: 向量数据库存储信息的数学表示。与嵌入和检索器配合使用,可创建AI在回答问题时能够访问的数据库。
- 向量存储: 向量存储(或称向量数据库)用于存储信息的数学表示。结合嵌入模型和检索器使用,可创建供AI在回答问题时访问的数据库。