speechbrain.lobes.models.flair.sequencetagger 模块

使用Flair进行序列标记的模型和工具

作者 * Sylvain de Langen 2024

摘要

类:

FlairSequenceTagger

使用flair工具包的序列标注器,例如用于词性(POS)提取。

参考

class speechbrain.lobes.models.flair.sequencetagger.FlairSequenceTagger(model: flair.models.SequenceTagger)[source]

基础类:object

使用flair工具包的序列标注器,例如用于词性(POS)提取。

Parameters:

model (SequenceTagger) – Flair序列标注模型。如果您没有初始化的模型,请使用 from_hf() 代替。

static from_hf(source, save_path='./model_checkpoints', filename='pytorch_model.bin') FlairSequenceTagger[source]

根据speechbrain.utils.fetching.fetch()语义获取并加载一个flair PyTorch模型。该模型将被保存到save_path中的一个唯一子目录中。

Parameters:
  • source (str) – 模型的位置(例如,一个目录或HF仓库)。

  • save_path (str, optional) – 模型的保存位置(即下载或符号链接位置的根目录)。

  • filename (str, optional) – 模型的文件名。默认是此类模型的常用文件名。

Return type:

FlairSequenceTagger

__call__(inputs: List[str] | List[List[str]]) List[List[str]][source]

标记一批句子。

Parameters:

inputs (list of sentences (str or list of tokens)) – 要标记的句子,以批量列表的形式(列表中的字符串)或字符串形式。 在标记列表的情况下,标记不需要已经为这个特定的序列标记器进行标记化。

Returns:

对于每个句子,提取的标签序列为`str`s。

Return type:

listliststr