词法形态学
存储语言可能的形态学分析,并通过哈希值进行索引。为了节省每个词符的空间,词符仅知道其形态学分析的哈希值,因此形态属性的查询被委托给此类。参见MorphAnalysis了解存储单个形态学分析的容器。
Morphology.__init__ 方法
创建一个Morphology对象。
| 名称 | 描述 |
|---|---|
strings | The string store. StringStore |
Morphology.add 方法
如果形态分析尚未存在,则将其插入到形态表中。 形态分析可以以字符串形式或以标签映射字典格式提供,格式遵循通用依存关系FEATS规范。返回新分析的哈希值。
| 名称 | 描述 |
|---|---|
features | The morphological features. Union[Dict, str] |
Morphology.get 方法
获取形态分析哈希值的 FEATS 字符串。
| 名称 | 描述 |
|---|---|
morph | The hash of the morphological analysis. int |
Morphology.feats_to_dict staticmethod
将字符串FEATS表示转换为特征和值的字典,格式与标签映射相同。
| 名称 | 描述 |
|---|---|
feats | The morphological features in Universal Dependencies FEATS format. str |
| 返回值 | 形态特征以字典形式返回。 Dict[str, str] |
Morphology.dict_to_feats staticmethod
将特征和值的字典转换为字符串 FEATS 表示形式。
| 名称 | 描述 |
|---|---|
feats_dict | The morphological features as a dictionary. Dict[str, str] |
| 返回值 | 以通用依存FEATS格式返回的形态特征。str |
属性
| 名称 | 描述 |
|---|---|
FEATURE_SEP | The FEATS feature separator. Default is |. str |
FIELD_SEP | The FEATS field separator. Default is =. str |
VALUE_SEP | The FEATS value separator. Default is ,. str |
MorphAnalysis class
存储单一形态分析。
MorphAnalysis.__init__ 方法
从通用依存关系FEATS字符串或形态特征字典初始化一个MorphAnalysis对象。
| 名称 | 描述 |
|---|---|
vocab | The vocab. Vocab |
features | The morphological features. Union[Dict[str, str], str] |
MorphAnalysis.__contains__ 方法
某个特征/值对是否在分析中。
| 名称 | 描述 |
|---|---|
feature | A feature/value pair. str |
| 返回值 | 判断特征/值对是否包含在分析中。bool |
MorphAnalysis.__iter__ 方法
遍历分析中的特征/值对。
| 名称 | 描述 |
|---|---|
| YIELDS | 分析中的一个特征/值对。str |
MorphAnalysis.__len__ 方法
返回分析中的特征数量。
| 名称 | 描述 |
|---|---|
| 返回值 | 分析中的特征数量。int |
MorphAnalysis.__str__ 方法
返回通用依存关系FEATS字符串格式的形态分析结果。
| 名称 | 描述 |
|---|---|
| 返回值 | 以通用依存FEATS格式进行的分析。str |
MorphAnalysis.get 方法
通过字段检索特征的值。
| 名称 | 描述 |
|---|---|
field | The field to retrieve. str |
default v3.5.3 | The value to return if the field is not present. If unset or None, the default return value is []. Optional[List[str]] |
| 返回值 | 一个包含各个特征的列表。List[str] |
MorphAnalysis.to_dict 方法
生成分析的字典表示,格式与标签映射相同。
| 名称 | 描述 |
|---|---|
| 返回值 | 分析结果的字典表示。Dict[str, str] |
MorphAnalysis.from_id 类方法
根据给定的哈希ID创建形态分析。
| 名称 | 描述 |
|---|---|
vocab | The vocab. Vocab |
key | The hash of the features string. int |