Skip to content

带有提取实体的词汇图

上下文

向量搜索方法的最大问题,例如在基本检索器父子检索器中,是找到回答问题所需的所有相关上下文。上下文可能分布在许多未被搜索到的块中。将块中的现实世界实体相互关联,并通过向量搜索检索这些关系,可以提供有关这些实体处理的块的额外上下文。

图形模式

Graph

元素

节点

Entity Node 文档节点包含文档名称及其来源。它们可能包含额外的元数据。 Entity Node 块节点包含块的人类可读文本及其向量嵌入。它们可能包含额外的元数据。 Entity Node 实体节点包含实体的名称。此外,它们可能包含实体的描述和向量嵌入(名称和描述)。它们可能包含额外的元数据。实体节点可以根据提取提示具有额外的标签。

关系

PART_OF Relationship PART_OF关系不需要额外的属性。然而,它们可能包含额外的元数据。

HAS_ENTITY Relationship HAS_ENTITY 关系不需要额外的属性。然而,它们可能包含额外的元数据。

RELATES_TO Relationship 这里的RELATES_TO关系是示例性的。它们可以根据提取提示具有任何类型。它们也可能有描述。它们可能包含额外的元数据。

描述

使用LLM对块执行实体和关系提取。将检索到的三元组导入到图中。

GraphRAG 模式

Graph-Enhanced Vector Search中使用了一个带有提取实体的词汇图。