更新,15.10.2021: 请查看我们的新的零样本分类器,它们更加轻量级,并且甚至胜过这个模型: zero-shot SELECTRA small 和 zero-shot SELECTRA medium .
这个模型是在 spanish BERT model 的基础上使用西班牙语部分的XNLI数据集进行微调得到的。有关训练的详细信息,请参阅 training script 。
您可以使用Hugging Face的 zero-shot-classification pipeline 来使用此模型:
from transformers import pipeline
classifier = pipeline("zero-shot-classification", 
                       model="Recognai/bert-base-spanish-wwm-cased-xnli")
classifier(
    "El autor se perfila, a los 50 años de su muerte, como uno de los grandes de su siglo",
    candidate_labels=["cultura", "sociedad", "economia", "salud", "deportes"],
    hypothesis_template="Este ejemplo es {}."
)
"""output
{'sequence': 'El autor se perfila, a los 50 años de su muerte, como uno de los grandes de su siglo',
 'labels': ['cultura', 'sociedad', 'economia', 'salud', 'deportes'],
 'scores': [0.38897448778152466,
  0.22997373342514038,
  0.1658431738615036,
  0.1205764189362526,
  0.09463217109441757]}
"""
 测试集的准确率:
| XNLI-es | |
|---|---|
| bert-base-spanish-wwm-cased-xnli | 79.9% |