模型:
SaiedAlshahrani/arwiki_mlm
这个模型是在一个未知的数据集上对 进行微调的版本。它在评估集上取得了如下结果:
需要更多信息
需要更多信息
需要更多信息
在训练过程中使用了以下超参数:
| Epoch | Step | Training Loss | 
|---|---|---|
| 1 | 3000 | 5.681200 | 
| 2 | 6000 | 3.777100 | 
| 3 | 9000 | 3.246300 | 
| 4 | 12000 | 3.012100 | 
| 5 | 15000 | 2.888400 | 
| Train Runtime | Train Samples Per Second | Train Steps Per Second | Total Flos | Train Loss | Epoch | 
|---|---|---|---|---|---|
| 17048.756800 | 248.355000 | 0.970000 | 140390797515571200.000000 | 3.639375 | 5.000000 |