启动一个AI驱动的聊天
启动与配置的聊天助手的聊天。
知识库、无幻觉聊天和文件管理是RAGFlow的三大支柱。RAGFlow中的聊天基于特定的知识库或多个知识库。一旦您创建了知识库并完成了文件解析,您就可以开始进行AI对话。
开始一个AI聊天
您通过创建一个助手来开始AI对话。
-
点击页面顶部中间的Chat标签>创建助手以显示聊天配置对话框用于您的下一个对话。
RAGFlow 为您提供了为每次对话选择不同聊天模型的灵活性,同时允许您在系统模型设置中设置默认模型。
-
更新助手设置:
- Assistant name 是您的聊天助手的名称。每个助手对应一个具有独特知识库、提示、混合搜索配置和大模型设置组合的对话。
- 空响应:
- 如果您希望将RAGFlow的答案限制在您的知识库中,请在此处留下响应。然后,当它没有检索到答案时,它会统一响应您在此处设置的内容。
- 如果您希望RAGFlow在未从您的知识库中检索到答案时即兴发挥,请留空,这可能会导致幻觉。
- 显示引用: 这是RAGFlow的一个关键功能,默认启用。RAGFlow不像一个黑盒子那样工作。相反,它清晰地展示了其响应所基于的信息来源。
- 选择相应的知识库。您可以选择一个或多个知识库,但请确保它们使用相同的嵌入模型,否则会发生错误。
-
更新 Prompt Engine:
- 在系统中,您可以为您的LLM填写提示,您也可以在开始时保留默认提示不变。
- 相似度阈值 设置每个文本块的相似度“门槛”。默认值为0.2。相似度得分较低的文本块将被过滤掉,不会出现在最终响应中。
- 关键词相似度权重 默认设置为0.7。RAGFlow使用混合评分系统来评估不同文本块的相关性。此值设置了混合评分中关键词相似度组件的权重。
- 如果 重排序模型 为空,混合评分系统使用关键词相似度和向量相似度,向量相似度组件的默认权重为1-0.7=0.3。
- 如果 重排序模型 被选中,混合评分系统使用关键词相似度和重排序分数,重排序分数的默认权重为1-0.7=0.3。
- Top N 决定了提供给LLM的最大块数。换句话说,即使检索到更多的块,也只有前N个块作为输入提供。
- 多轮优化 利用多轮对话中的现有上下文增强用户查询。默认情况下是启用的。启用后,它将消耗额外的LLM令牌,并显著增加生成答案的时间。
- Rerank model 设置要使用的重新排序模型。默认情况下为空。
- 如果 Rerank model 为空,混合评分系统使用关键词相似度和向量相似度,向量相似度部分的默认权重为1-0.7=0.3。
- 如果选择了 Rerank model,混合评分系统使用关键词相似度和重新排序分数,重新排序分数的默认权重为1-0.7=0.3。
- 变量 指的是在系统提示中使用的变量(键)。
{knowledge}是一个保留变量。点击 添加 为系统提示添加更多变量。- 如果您不确定 变量 背后的逻辑,请保持 原样。
-
更新 模型设置:
- 在模型中:您可以选择聊天模型。尽管您已经在系统模型设置中选择了默认的聊天模型,RAGFlow允许您为对话选择替代的聊天模型。
- 自由度 指的是LLM即兴发挥的程度。从 即兴、精确 到 平衡,每个自由度级别对应着 温度、Top P、存在惩罚 和 频率惩罚 的独特组合。
- 温度: 大语言模型预测随机性的水平。值越高,大语言模型越有创造力。
- Top P 也被称为“核采样”。更多信息请参见这里。
- 最大令牌数: LLM响应的最大长度。请注意,如果此值设置过低,响应可能会被截断。
-
现在,让我们开始表演:
NOTE
- 点击答案上方的灯泡图标以查看扩展的系统提示:
气泡图标仅适用于当前对话。
- 向下滚动展开的提示以查看每个任务所消耗的时间:
更新现有聊天助手的设置
将鼠标悬停在目标聊天助手上 > 编辑 以显示聊天配置对话框:
将聊天功能集成到您的应用程序或网页中
RAGFlow 提供了 HTTP 和 Python API,以便您将 RAGFlow 的功能集成到您的应用程序中。阅读以下文档以获取更多信息:
你可以使用iframe将创建的聊天助手嵌入到第三方网页中:
-
在继续之前,您必须获取一个API密钥;否则,将出现错误消息。
-
将鼠标悬停在目标聊天助手上 > 编辑 以显示 iframe 窗口:
-
复制 iframe 并将其嵌入到网页的特定位置。