贡献一个LabelledRagDataset
#
构建一个更健壮的RAG系统需要一个多样化的评估套件。这就是为什么我们在llama-hub中推出了LlamaDatasets
。本页将讨论如何贡献llama-hub中提供的第一类LlamaDataset
,即LabelledRagDataset
。
贡献一个LabelledRagDataset
主要包含两个高级步骤。一般来说,
您需要先创建LabelledRagDataset
,将其保存为json格式,然后将该json文件
连同源文本文件一起提交到我们的llama-datasets仓库。此外,您还需要发起一个pull request,
将数据集的必要元数据上传到我们的llama-hub仓库。
为了让提交过程更加顺畅,我们准备了一个模板笔记本,您可以按照该模板从头开始创建LabelledRagDataset
(或将类似结构的问答数据集转换为该格式),并执行其他必要步骤来完成提交。请参考下方链接的"LlamaDataset提交模板笔记本"。
贡献其他llama数据集#
贡献我们其他llama-datasets(例如LabelledEvaluatorDataset
)的通用流程与之前描述的LabelledRagDataset
相同。这些其他数据集的提交模板即将推出!
提交示例#
阅读完整的提交示例Notebook。