阿里云通义千问再推重磅开源模型:320亿参数Qwen1.5-32B

2024年04月08日 由 neo 发表 159 0

最新消息显示,阿里云旗下的通义千问宣布了开源其320亿参数模型Qwen1.5-32B的重大举措。这款模型在性能、效率和内存占用方面均达到了卓越的平衡,为企业和开发者带来了更高性价比的模型选择。值得关注的是,通义千问目前已累计开源了7款大语言模型,并在全球范围内收获了超过300万的下载量,这一数字充分证明了其广泛的影响力和受欢迎程度。


66124d291fe6e

在此之前,通义千问已经成功开源了包括5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型,并且这些模型都已升级至1.5版本。其中,小尺寸的模型因其便捷性在端侧部署中得到了广泛应用,而720亿参数模型则以其业界领先的性能,多次荣登HuggingFace等权威模型榜单。

而此次开源的320亿参数模型Qwen1.5-32B,进一步在性能、效率和内存占用之间实现了更为理想的平衡。相较于14B模型,32B在智能体场景下展现出了更为强大的能力;而与72B相比,32B的推理成本更低,为企业和开发者提供了更为经济实惠的解决方案。通义千问团队期待这款32B开源模型能为下游应用提供更优质的解决方案。

在基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中均取得了优异成绩,其性能接近通义千问720亿参数模型,并远超其他300亿级参数模型。这一成绩再次证明了通义千问在大语言模型领域的强大实力。

66124d2e8b1bb

在Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测中得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小,这一表现进一步凸显了其在对话领域的出色能力。

66124d322d43f

此外,在多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言进行测评。Qwen1.5-32B的多语言能力仅略逊于通义千问720亿参数模型,充分展现了其强大的跨语言处理能力。

66124d3633dfb

通义千问此次开源320亿参数模型Qwen1.5-32B,不仅进一步丰富了其开源模型库,也为企业和开发者提供了更多选择。同时,这也表明通义千问在大语言模型领域的技术实力得到了进一步提升,为未来的发展奠定了坚实基础。

文章来源:https://www.leiphone.com/category/industrynews/ZF6wxlum2yVXJXzo.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消