Data Studio
Rivet中的Data Studio是您处理数据和图表的草稿本。通过点击Rivet顶部的"Data Studio"选项卡即可访问。
数据集
数据工作室中的数据被组织成"数据集"。每个数据集都是相互隔离的,可用于存储特定用途的数据。
您可以右键点击数据集进行重命名或删除操作。请注意,目前删除操作无法撤销。
数据
每个数据集中的数据都存储在表中。表的组织结构、包含哪些列以及它们的含义完全由您决定。您可以根据需要添加、删除和编辑列。
点击右侧的"添加新列"或底部的"添加新行"来新增列或行。您也可以右键点击表格中的任意单元格,在选中单元格的前后插入列,或在选中单元格的上下插入行。
要编辑单元格,请双击它。这将打开该单元格的编辑器。您可以通过点击单元格外部或按Cmd/Ctrl + Enter来关闭单元格;
ID
数据集中的每一行都有一个唯一ID。默认情况下,这些ID是随机生成的。但您可以像编辑其他单元格一样编辑这些ID。在使用"追加到数据集"等节点时,您也可以指定ID。您可以通过"获取数据集行"节点按ID检索行。
嵌入
每一行可以选择性地存储一个嵌入向量。这使得数据集可以作为一个非常简单的向量数据库使用。目前每行只能存储一个嵌入向量。然后您可以使用Dataset KNN节点来查找与给定行最接近的邻居。这对于测试RAG非常有用,而无需设置完整的数据库。
节点
图中的以下节点可以与数据集交互:
加载数据集节点
该节点将加载整个数据集并将其输出为两个输出端口 - 数据集的ID和数据集的数据(不包括ID和嵌入向量)。数据以数组的数组形式组织(string[][]
)。您可以使用数组节点和提取对象路径节点等节点来操作这些数据。
追加到数据集节点
该节点会向数据集追加一行数据。它接收需要追加的数据,数据应为字符串数组(string[]
),但也可以是单个字符串。如果遇到混合类型的值,这些值将被强制转换为字符串。
数据集可以在编辑器中选择,或者通过输入端口传入ID。
获取所有数据集节点
该节点将列出项目中所有可用的数据集。它显示数据集的元数据,即仅包含它们的ID和名称。然后您可以将其与加载数据集节点结合使用,以获取数据集的数据。
数据集KNN节点
该节点将在数据集中查找给定行的最近邻。它接收一个向量和要查找的邻居数量作为输入,输出与给定向量最接近的行。请注意,这里输出的是完整的行数据,包括ID和嵌入向量。
创建数据集节点
该节点可在图中使用,用于创建一个新的空数据集供代理使用。它接收要赋予数据集的名称,并输出新数据集的ID。
数据集存储
数据集的数据在项目保存时会被存储在.rivet-project
文件旁边的.rivet-data
文件中。当加载项目时,如果存在.rivet-data
文件,数据将从该文件加载。