ltg/norbert2 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

模型:

ltg/norbert2

任务:

类库:

PyTorch TensorFlow Safetensors Transformers

语言:

其他:

bert norwegian AutoTrain Compatible

许可:

模型介绍文件清单

快速开始

发布 2.0 版本 (2022年2月7日)

在挪威语的大型语料库 (C4 + NCC, 约150亿个单词标记) 上进行训练。具有50000个词汇，并使用了整词蒙版进行训练。

在这里下载模型:

区分大小写挪威语BERT基础2.0版 (NorBERT 2): 221.zip

有关NorBERT训练语料库、训练过程和评估基准的更多信息: http://norlm.nlpl.eu/

相关代码: https://github.com/ltgoslo/NorBERT

详细内容请参阅此论文:

Andrey Kutuzov, Jeremy Barnes, Erik Velldal, Lilja Øvrelid, Stephan Oepen. Large-Scale Contextualised Language Modelling for Norwegian , NoDaLiDa'21 (2021)

NorBERT是NorLM项目的一部分，该项目是挪威奥斯陆大学的 Language Technology Group (LTG) 协调的 EOSC-Nordic (欧洲开放科学云) 的联合倡议。

这些计算是在挪威高性能计算和数据存储的国家基础设施UNINETT Sigma2上完成的。

NorBERT-3

在2023年，我们发布了NorBERT-3的新系列挪威语言模型。一般而言，我们现在推荐使用这些模型:

NorBERT 3 xs (15M 参数)
NorBERT 3 small (40M 参数)
NorBERT 3 base (123M 参数)
NorBERT 3 large (323M 参数)

NorBERT-3在这篇论文中有详细描述: NorBench – A Benchmark for Norwegian Language Models (Samuel et al., NoDaLiDa 2023)

作者:

Language Technology Group (University of Oslo)

数据集大小:

1.4 GB

相关推荐