speechbrain.utils.dictionaries 模块
字典实用工具,例如同义词字典。
- Authors
Sylvain de Langen 2024
摘要
类:
加载同义词集,并允许您查找两个词是否为同义词。 |
参考
- class speechbrain.utils.dictionaries.SynonymDictionary[source]
基础类:
object加载同义词集,并允许您查找两个词是否为同义词。
例如,当规范化可能不适用时,这可以用于检查两个相同单词拼写的相等性。
同义词不被认为是可传递的: 如果A是B的同义词,B是C的同义词,那么A不被认为是C的同义词,除非它们被添加到同一个同义词集中。
- static from_json_file(file) 同义词词典[source]
将打开的文件解析为JSON,其中顶层结构是同义词集合的列表(即彼此都是同义词的单词),例如
[ ["hello", "hi"], ["say", "speak", "talk"] ]。- Parameters:
文件 (文件对象) – 支持读取的文件对象(例如,一个`打开`的文件)
- Returns:
从解析的JSON文件中获取的同义词词典,包含所有添加的同义词集。
- Return type:
- static from_json_path(path) 同义词词典[source]
打开一个文件并将其解析为JSON,其他语义与
from_json_file()相同,后者使用已打开的文件。- Parameters:
path (str) – JSON文件的路径
- Returns:
从解析的JSON文件中获取的同义词词典,所有同义词集已添加。
- Return type:
- add_synonym_set(words: Iterable[str]) None[source]
添加一组彼此都是同义词的单词。
- Parameters:
单词 (可迭代[str]) – 应该定义为彼此同义词的单词列表