NEW暗黑模式现已上线 🌓 Label Studio 1.18.0 版本发布

如何使用我们的生成式AI模板

教程

用于根据您的需求调整基础模型的模板,包括聊天机器人模型评估、微调LLM以及视觉排序。

随着最新的1.8版本发布——我们推出了全新的生成式AI模板库——这是一套专为您设计的模板,让您可以直接在Label Studio中使用基础模型并根据需求进行调整。现在就开始微调模型吧,比如Llama 2GPT-4WhisperAlpacaPaLM 2等。

根据您的特定需求微调模型

Label Studio的生成式AI模板库包含适用于以下使用场景的模板。

  1. 监督式LLM微调: 优化您的LLM,使其能够根据用户定义的提示生成响应,用于文档分类、信息检索和客户支持服务。
  2. Human Preference Collection for RLHF: 通过从监督模型生成的响应中建立人类偏好数据,让您的LLM在您自己的用例中达到ChatGPT的质量水平。
  3. 轻松收集人类偏好数据,更好地评估和提升您的聊天机器人回复质量
  4. : 比较不同LLM的响应,并通过便捷的拖放界面进行排序。
  5. 比较不同文本到图像模型的输出结果,并通过拖放界面进行排序。

如何开始使用基础模型。

基础模型是大型生成模型,通常作为机器学习应用的根基。近年来技术进步使得使用这些模型并将其应用于不同需求变得前所未有的简单。此外,由于技术本身的发展,它们已开始被公众更广泛地接受和使用。

我们生成式AI模板库的起源,源于观察到Label Studio用户根据自身需求调整我们高度灵活的开源界面,越来越多地倾向于强化学习类应用。

探索模板

监督式LLM微调

监督式LLM微调模板旨在帮助您训练模型,使其能够根据人类输入提供更具上下文针对性的响应。这对于文档分类、信息检索和客户支持服务非常有用。

该模板收集用户的文本输入作为标注内容本身。标注完成并导出数据集后,您可以使用此模板根据收到的人工反馈来微调模型。

开始使用监督式LLM微调模板前,请先准备好您的数据集。Label Studio文档中包含了如何为这类任务构建JSON文件的相关信息。

在Label Studio中创建一个新项目,从我们的生成式AI模板选项中选择“监督式LLM微调”模板,并导入您的数据。

一旦数据导入Label Studio(通过API、云存储或JSON文件上传),标注人员就可以开始对项目进行标注。

在开始标注流程时,监督式LLM微调过程会提示标注人员填写问题的回答。这些答案随后可被导出并用于构建数据集,以进一步训练模型。


用于RLHF的人类偏好收集

使用此模板获取现有或新的LLM(达到ChatGPT质量水平),该模板收集比较数据以建立人类对监督模型生成响应的偏好。这在构建或建立RLHF工作流时特别有用。

该模板收集用户的文本输入作为标注内容本身。在标注完成并导出数据集后,您可以使用此模板基于收到的人工反馈来微调模型。

开始使用人类偏好收集模板前,请先准备好您的数据集。Label Studio文档中包含了如何为此类工作构建JSON文件结构的相关信息。

在Label Studio中创建一个新项目,从我们的生成式AI模板选项中选择“人类偏好收集”模板,并导入您的数据。

一旦数据被导入Label Studio(无论是通过API、云存储还是JSON文件上传),标注人员就可以开始对项目进行标注。

在开始标注流程时,人类偏好收集过程会先提出问题,然后展示两种不同的提示。标注者将根据当前上下文选择最能回答问题的选项。这些答案随后可导出并用于您的RLHF工作流中,通过人类反馈进一步微调模型。


Chatbot Assessment

借助此模板,您可以轻松基于内部专业知识或公司数据微调自己的聊天机器人。收集人类偏好数据以评估聊天机器人回复的质量,从而为聊天机器人创建更多特定场景的细节内容。

该模板用于收集关于内部聊天机器人性能的反馈,以提升其表现。标注完成并导出数据集后,您可以使用此模板来改进聊天机器人背后的核心模型。

开始使用聊天机器人评估模板前,首先需要准备数据集。Label Studio文档中包含了如何为这类工作构建JSON文件结构的相关信息。

在Label Studio中创建一个新项目,从我们的生成式AI模板选项中选择“聊天机器人评估”模板,并导入您的数据。

一旦数据被导入Label Studio(无论是通过API、云存储还是JSON文件上传),标注人员就可以开始对项目进行标注。

在开始标注流程时,Chatbot Assessment模板会展示与聊天机器人的交互对话,并提示标注者回答一系列问题。这些问题围绕内容适宜性、安全性以及观点或道德相关情境进行组织。标注者将根据此评估对聊天机器人的表现进行评分。这些答案随后可导出,用于进一步完善聊天机器人背后的核心模型。


LLM Ranker

通过此模板建立工作流程来评估不同大语言模型(LLM)回答的质量,帮助您找到最适合的LLM。使用便捷的拖放界面比较不同LLM的回答质量并进行排序。

该模板通过分析已解答的问题,帮助您确定最适合需求的LLM。完成标注后,您可以更清楚地了解哪种LLM最适合您的需求——无论是直接使用现成模型,还是计划进行进一步的微调。

开始使用LLM Ranker模板前,请先准备好您的数据集。Label Studio文档中包含了如何为这类任务构建JSON文件的相关信息。

在Label Studio中创建一个新项目,从我们的生成式AI模板选项中选择“LLM Ranker”模板,并导入您的数据。

一旦数据导入Label Studio(通过API、云存储或JSON文件上传),标注人员就可以开始对项目进行标注。

在开始标注流程时,LLM Ranker模板会显示提示信息和来自3个不同大语言模型的输出结果。标注员随后通过拖拽项目到"相关结果"或"偏见结果"区域来对每个模型的表现进行排序。这些回答可以进一步汇总评估,从而确定最适合您需求的大语言模型。



Visual Ranker

构建一个工作流来评估不同文本到图像模型(如Dall-E、Midjourney和Stable Diffusion等)生成响应的质量。这个预置模板让您能够比较不同生成式AI模型的输出,并通过便捷的拖放界面进行排序。

该模板通过回答相关问题,帮助您根据需求确定最佳的图像生成模型。完成标注后,您将获得更好的参考框架,从而了解哪种模型最适合您的需求——无论是直接使用现成模型,还是计划进行进一步的微调。

开始使用Visual Ranker模板前,请先准备好您的数据集。Label Studio文档中包含了如何为这类任务构建JSON文件的相关信息。

在Label Studio中创建一个新项目,从我们的生成式AI模板选项中选择“视觉排序器”模板,并导入您的数据。

一旦数据被导入Label Studio(无论是通过API、云存储还是JSON文件上传),标注人员就可以开始对项目进行标注。

在开始标注流程时,Visual Ranker模板会显示提示信息和来自3种不同图像生成模型的结果。标注人员随后通过拖拽项目到"相关结果"或"偏见结果"区域来对每个模型的性能进行排序。这些回答可以进一步汇总评估,从而确定最适合您需求的图像生成模型。


构建时始终考虑您的需求。

随着机器学习领域的不断发展,我们也在持续进步。Label Studio为您提供全新功能和机会,助您根据需求定制基础模型,甚至帮助提升数据可访问性——我们始终在此为您提供支持。

Label Studio的最新版本配备了新工具和功能,帮助您在组织内充分利用大型语言模型(LLMs)及其他基础模型。


相关内容