RoBERTa的模型、分词器和预处理层,详见"RoBERTa: A Robustly Optimized BERT Pretraining Approach"。
有关可用预设的完整列表,请参见 模型页面.