Transformer文本编码器

class TransformerTextEncoder(pretrained_model_name_or_path: str = 'bert-base-cased', max_length: int = 512)[source]

基础类:TextEncoder

分词器和模型的组合。

使用transformers.AutoModel初始化编码器。

Parameters:
Raises:

ImportError – 如果无法导入 transformers

方法总结

forward_normalized(texts)

编码一批文本。

方法文档

forward_normalized(texts: Sequence[str]) Tensor[来源]

编码一批文本。

Parameters:

文本 (Sequence[str]) – 长度: b 文本

Returns:

形状: (b, dim) 文本的编码

Return type:

Tensor