跳至主要内容

Data Studio

Rivet中的Data Studio是您处理数据和图表的草稿本。通过点击Rivet顶部的"Data Studio"选项卡即可访问。

Data Studio

数据集

数据工作室中的数据被组织成"数据集"。每个数据集都是相互隔离的,可用于存储特定用途的数据。

您可以右键点击数据集进行重命名或删除操作。请注意,目前删除操作无法撤销。

数据

每个数据集中的数据都存储在表中。表的组织结构、包含哪些列以及它们的含义完全由您决定。您可以根据需要添加、删除和编辑列。

点击右侧的"添加新列"或底部的"添加新行"来新增列或行。您也可以右键点击表格中的任意单元格,在选中单元格的前后插入列,或在选中单元格的上下插入行。

要编辑单元格,请双击它。这将打开该单元格的编辑器。您可以通过点击单元格外部或按Cmd/Ctrl + Enter来关闭单元格;

ID

数据集中的每一行都有一个唯一ID。默认情况下,这些ID是随机生成的。但您可以像编辑其他单元格一样编辑这些ID。在使用"追加到数据集"等节点时,您也可以指定ID。您可以通过"获取数据集行"节点按ID检索行。

嵌入

每一行可以选择性地存储一个嵌入向量。这使得数据集可以作为一个非常简单的向量数据库使用。目前每行只能存储一个嵌入向量。然后您可以使用Dataset KNN节点来查找与给定行最接近的邻居。这对于测试RAG非常有用,而无需设置完整的数据库。

节点

图中的以下节点可以与数据集交互:

加载数据集节点

该节点将加载整个数据集并将其输出为两个输出端口 - 数据集的ID和数据集的数据(不包括ID和嵌入向量)。数据以数组的数组形式组织(string[][])。您可以使用数组节点和提取对象路径节点等节点来操作这些数据。

追加到数据集节点

该节点会向数据集追加一行数据。它接收需要追加的数据,数据应为字符串数组(string[]),但也可以是单个字符串。如果遇到混合类型的值,这些值将被强制转换为字符串。

数据集可以在编辑器中选择,或者通过输入端口传入ID。

获取所有数据集节点

该节点将列出项目中所有可用的数据集。它显示数据集的元数据,即仅包含它们的ID和名称。然后您可以将其与加载数据集节点结合使用,以获取数据集的数据。

数据集KNN节点

该节点将在数据集中查找给定行的最近邻。它接收一个向量和要查找的邻居数量作为输入,输出与给定向量最接近的行。请注意,这里输出的是完整的行数据,包括ID和嵌入向量。

创建数据集节点

该节点可在图中使用,用于创建一个新的空数据集供代理使用。它接收要赋予数据集的名称,并输出新数据集的ID。

数据集存储

数据集的数据在项目保存时会被存储在.rivet-project文件旁边的.rivet-data文件中。当加载项目时,如果存在.rivet-data文件,数据将从该文件加载。