speechbrain.utils.dictionaries 模块

字典实用工具,例如同义词字典。

Authors
  • Sylvain de Langen 2024

摘要

类:

SynonymDictionary

加载同义词集,并允许您查找两个词是否为同义词。

参考

class speechbrain.utils.dictionaries.SynonymDictionary[source]

基础类:object

加载同义词集,并允许您查找两个词是否为同义词。

例如,当规范化可能不适用时,这可以用于检查两个相同单词拼写的相等性。

同义词不被认为是可传递的: 如果A是B的同义词,B是C的同义词,那么A不被认为是C的同义词,除非它们被添加到同一个同义词集中。

static from_json_file(file) 同义词词典[source]

将打开的文件解析为JSON,其中顶层结构是同义词集合的列表(即彼此都是同义词的单词),例如 [ ["hello", "hi"], ["say", "speak", "talk"] ]

Parameters:

文件 (文件对象) – 支持读取的文件对象(例如,一个`打开`的文件)

Returns:

从解析的JSON文件中获取的同义词词典,包含所有添加的同义词集。

Return type:

SynonymDictionary

static from_json_path(path) 同义词词典[source]

打开一个文件并将其解析为JSON,其他语义与from_json_file()相同,后者使用已打开的文件。

Parameters:

path (str) – JSON文件的路径

Returns:

从解析的JSON文件中获取的同义词词典,所有同义词集已添加。

Return type:

SynonymDictionary

add_synonym_set(words: Iterable[str]) None[source]

添加一组彼此都是同义词的单词。

Parameters:

单词 (可迭代[str]) – 应该定义为彼此同义词的单词列表

__call__(a: str, b: str) bool[source]

检查两个单词的相等性或同义词相等性。

Parameters:
  • a (str) – 要比较的第一个词。可能不在已知词典中。

  • b (str) – 要比较的第二个单词。可能不在已知词典中。 参数的顺序无关紧要。

Returns:

是否应将ab视为同义词。不具有传递性,请参阅主类文档。

Return type:

bool

get_synonyms_for(word: str) set[source]

返回给定单词的同义词集合。

Parameters:

单词 (str) – 要查找同义词的单词。可能不在已知的词典中。

Returns:

这个词的已知同义词集合。不要改变(或事先复制)。如果这个词没有已知的同义词,可能为空。

Return type:

setstr