模型:
HooshvareLab/bert-fa-base-uncased-sentiment-deepsentipers-binary
波斯语理解的基于Transformer的模型
我们通过对新的波斯语语料库进行词汇重构和微调ParsBERT v1.1,以便为在其他领域使用ParsBERT提供一些功能!请在 ParsBERT 存储库中关注有关先前和当前模型的最新信息。
其目的是基于情感倾向对文本(如评论)进行分类。我们为此任务测试了三个众所周知的数据集:Digikala用户评论,SnappFood用户评论和DeepSentiPers的二进制形式和多形式。
它是SentiPers的平衡和增强版本,包含12138条有关数字产品的用户意见,标有五个不同的类别;两个积极类别(即快乐和高兴),两个消极类别(即愤怒和生气)以及一个中立类别。因此,该数据集可用于多类和二进制分类。在二进制分类的情况下,从数据集中删除了中立类别及其对应的句子。
二进制:
多类:
| Label | # |
|---|---|
| Furious | 236 |
| Angry | 1357 |
| Neutral | 2874 |
| Happy | 2848 |
| Delighted | 2516 |
下载您可以从以下网址下载数据集:
下表总结了ParsBERT与其他模型和架构相比获得的F1分数。
| Dataset | ParsBERT v2 | ParsBERT v1 | mBERT | DeepSentiPers |
|---|---|---|---|---|
| SentiPers (Multi Class) | 71.31* | 71.11 | - | 69.33 |
| SentiPers (Binary Class) | 92.42* | 92.13 | - | 91.98 |
| Task | Notebook |
|---|---|
| Sentiment Analysis | 1234321
请按照以下方式在出版物中引用:
@article{ParsBERT,
title={ParsBERT: Transformer-based Model for Persian Language Understanding},
author={Mehrdad Farahani, Mohammad Gharachorloo, Marzieh Farahani, Mohammad Manthouri},
journal={ArXiv},
year={2020},
volume={abs/2005.12515}
}
在 ParsBERT Issues 存储库上发布Github问题。