英文

PhoBERT:预训练的越南语语言模型

预训练的PhoBERT模型是用于越南语的最先进的语言模型(即"Phở"是越南的一种流行食物):

  • 两个PhoBERT版本分别是"base"和"large",是首个面向越南语的大规模单语言模型的公开版本。PhoBERT预训练方法基于优化的预训练步骤,以获得更稳健的性能。
  • PhoBERT在部分词性标注、依存句法分析、命名实体识别和自然语言推理等四个下游越南语NLP任务中表现优于先前的单语言和多语言方法,取得了新的最先进性能。

PhoBERT的总体架构和实验结果可在我们的EMNLP-2020找到。

请在使用PhoBERT帮助生成发表结果或将其纳入其他软件时引用我们的论文。

若需获取更多信息或提交请求,请访问。