英文

Whisper Large Norwegian Bokmål

这个模型是在多个数据集上进行训练的 openai/whisper-large-v2 的优化版本。

它目前正在大规模训练中。目前在评估集上的结果如下:

  • 损失:0.2477
  • WER:10.718635559082031

模型描述

模型是在大约5000个小时的语音语料库上进行训练的。数据来源包括挪威广播公司NRK的字幕、挪威议会的演讲记录以及挪威语言技术的语音录音。

拟用途与限制

当该模型完成后,任何人都可以免费使用它。

训练超参数

在训练过程中使用了以下超参数:

  • 学习率:3e-06
  • 训练批大小:64
  • 梯度累积步数:2
  • 评估批大小:32
  • 种子:42
  • 优化器:Adam,参数为betas=(0.9,0.999),epsilon=1e-08
  • lr_scheduler_type:以warmup为常数
  • lr_scheduler_warmup_steps:1000
  • 训练步数:50,000(当前 @1,000)
  • 混合精度训练:fp16
  • deepspeed:true

实时训练结果

请参见 Tensorboad Metrics