模型:
pere/norwegian-gpt2-social
这是一个实验性的挪威GPT-2模型,训练使用了一个大约37GB大小的主要是社交语料库。
使用了以下子语料库:
wikipedia_download_nb.jsonl wikipedia_download_nn.jsonl newspapers_online_nb.jsonl newspapers_online_nn.jsonl twitter_2016_2018_no.jsonl twitter_news_2016_2018_no.jsonl open_subtitles_no.jsonl facebook_no.jsonl reddit_no.jsonl vgdebatt_no.jsonl