欧盟推出多语言AI模型Teuken-7B 支持24种官方语言

2024年11月29日 由 daydream 发表 60 0

近日,一款名为Teuken-7B的语言模型已在Hugging Face平台上线,该模型出自欧盟的OpenGPT-X研究项目,并以开源形式提供。这款模型的独特之处在于其对欧洲联盟24种官方语言的支持,而不仅仅是英语。Teuken-7B的设计初衷即为平衡多语言处理能力,大约50%的训练数据来源于非英语的欧洲语言。


微信截图_20241129112943


此模型的推出,标志着自然语言处理技术在多语言支持方面迈出了重要一步。在此之前,大多数人工智能语言模型主要集中在英语上,而对于其他欧洲语言的支持相对有限。Teuken-7B通过采用更加多元化的训练数据集,旨在改善这一状况,确保模型在处理不同语言时能够保持一致性和可靠性。


为了评估此类多语言大模型(LLM)的性能,项目团队还构建了“欧洲LLM排行榜”。这一排行榜旨在全面衡量各类模型在欧洲各语言上的表现,突破了以往仅限于英语测试的局限。这不仅为研究人员提供了有价值的参考工具,也促进了跨语言模型开发的技术进步。


Teuken-7B及其配套的评估体系的出现,体现了在构建和优化多语言人工智能系统方面的新趋势。随着这类模型的应用范围不断扩大,未来用户将能享受到更为丰富和精准的多语言服务。此外,这一进展也意味着对于语言多样性的尊重和支持,有助于打破信息和技术的壁垒,促进全球交流与合作。

文章来源:https://the-decoder.com/eu-project-releases-7b-model-that-speaks-24-european-languages/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消