AnchorTokenizer
- class AnchorTokenizer(selection: str | AnchorSelection | type[AnchorSelection] | None = None, selection_kwargs: Mapping[str, Any] | None = None, searcher: str | AnchorSearcher | type[AnchorSearcher] | None = None, searcher_kwargs: Mapping[str, Any] | None = None)[来源]
基础类:
Tokenizer通过将实体表示为一组锚点实体来进行实体标记化。
实体是通过最短路径距离选择的。
初始化分词器。
- Parameters:
selection (str | AnchorSelection | type[AnchorSelection] | None) – 锚节点选择策略。
selection_kwargs (Mapping[str, Any] | None) – 传递给选择策略的额外基于关键字的参数
searcher (AnchorSearcher) – 用于搜索每个实体的最近锚点的组件
searcher_kwargs (Mapping[str, Any] | None) – 传递给搜索器的额外基于关键字的参数
方法总结
__call__(mapped_triples, num_tokens, ...)对给定三元组中包含的实体进行标记化。
方法文档