具有层次结构的词汇图
上下文
如果给定的文档具有预定义的结构,将其持久化到块结构中是有用的。 这种模式是Lexical Graph的演变。
图形模式
元素
节点
文档节点包含文档名称及其来源。它们可能包含额外的元数据。
块节点包含块的人类可读文本及其向量嵌入。它们可能包含额外的元数据。
章节、节和子节节点分别包含章节、节和子节的名称。它们可能包含额外的元数据。这些节点是文档中可能存在的层次结构的示例。
关系
PART_OF关系不需要额外的属性。然而,它们可能包含额外的元数据。
HAS_CHAPTER、HAS_SECTION 和 HAS_SUBSECTION 关系不需要额外的属性。然而,它们可能包含额外的元数据。这些关系是文档中可能存在的层次结构的示例。
描述
在分块文档时,记录文档的层次结构。