跳至内容

贡献一个LabelledRagDataset#

构建一个更健壮的RAG系统需要一个多样化的评估套件。这就是为什么我们在llama-hub中推出了LlamaDatasets。本页将讨论如何贡献llama-hub中提供的第一类LlamaDataset,即LabelledRagDataset

贡献一个LabelledRagDataset主要包含两个高级步骤。一般来说, 您需要先创建LabelledRagDataset,将其保存为json格式,然后将该json文件 连同源文本文件一起提交到我们的llama-datasets仓库。此外,您还需要发起一个pull request, 将数据集的必要元数据上传到我们的llama-hub仓库

为了让提交过程更加顺畅,我们准备了一个模板笔记本,您可以按照该模板从头开始创建LabelledRagDataset(或将类似结构的问答数据集转换为该格式),并执行其他必要步骤来完成提交。请参考下方链接的"LlamaDataset提交模板笔记本"。

贡献其他llama数据集#

贡献我们其他llama-datasets(例如LabelledEvaluatorDataset)的通用流程与之前描述的LabelledRagDataset相同。这些其他数据集的提交模板即将推出!

提交示例#

阅读完整的提交示例Notebook

优云智算