带有提取实体的词汇图
上下文
向量搜索方法的最大问题,例如在基本检索器或父子检索器中,是找到回答问题所需的所有相关上下文。上下文可能分布在许多未被搜索到的块中。将块中的现实世界实体相互关联,并通过向量搜索检索这些关系,可以提供有关这些实体处理的块的额外上下文。
图形模式
元素
节点
文档节点包含文档名称及其来源。它们可能包含额外的元数据。
块节点包含块的人类可读文本及其向量嵌入。它们可能包含额外的元数据。
实体节点包含实体的名称。此外,它们可能包含实体的描述和向量嵌入(名称和描述)。它们可能包含额外的元数据。实体节点可以根据提取提示具有额外的标签。
关系
PART_OF关系不需要额外的属性。然而,它们可能包含额外的元数据。
HAS_ENTITY 关系不需要额外的属性。然而,它们可能包含额外的元数据。
这里的RELATES_TO关系是示例性的。它们可以根据提取提示具有任何类型。它们也可能有描述。它们可能包含额外的元数据。
描述
使用LLM对块执行实体和关系提取。将检索到的三元组导入到图中。
GraphRAG 模式
在Graph-Enhanced Vector Search中使用了一个带有提取实体的词汇图。