阿里云通义千问再推重磅开源模型：320亿参数Qwen1.5-32B

2024年04月08日由 neo 发表 847 0

最新消息显示，阿里云旗下的通义千问宣布了开源其320亿参数模型Qwen1.5-32B的重大举措。这款模型在性能、效率和内存占用方面均达到了卓越的平衡，为企业和开发者带来了更高性价比的模型选择。值得关注的是，通义千问目前已累计开源了7款大语言模型，并在全球范围内收获了超过300万的下载量，这一数字充分证明了其广泛的影响力和受欢迎程度。

66124d291fe6e

在此之前，通义千问已经成功开源了包括5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型，并且这些模型都已升级至1.5版本。其中，小尺寸的模型因其便捷性在端侧部署中得到了广泛应用，而720亿参数模型则以其业界领先的性能，多次荣登HuggingFace等权威模型榜单。

而此次开源的320亿参数模型Qwen1.5-32B，进一步在性能、效率和内存占用之间实现了更为理想的平衡。相较于14B模型，32B在智能体场景下展现出了更为强大的能力；而与72B相比，32B的推理成本更低，为企业和开发者提供了更为经济实惠的解决方案。通义千问团队期待这款32B开源模型能为下游应用提供更优质的解决方案。

在基础能力方面，通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中均取得了优异成绩，其性能接近通义千问720亿参数模型，并远超其他300亿级参数模型。这一成绩再次证明了通义千问在大语言模型领域的强大实力。

66124d2e8b1bb

在Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测中得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小，这一表现进一步凸显了其在对话领域的出色能力。

66124d322d43f

此外，在多语言能力方面，通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言进行测评。Qwen1.5-32B的多语言能力仅略逊于通义千问720亿参数模型，充分展现了其强大的跨语言处理能力。

66124d3633dfb

通义千问此次开源320亿参数模型Qwen1.5-32B，不仅进一步丰富了其开源模型库，也为企业和开发者提供了更多选择。同时，这也表明通义千问在大语言模型领域的技术实力得到了进一步提升，为未来的发展奠定了坚实基础。

文章来源：https://www.leiphone.com/category/industrynews/ZF6wxlum2yVXJXzo.html

标签：

阿里云通义千问

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Cohere发布Command R+：企业级AI模型新突破

下一篇谷歌推出革命性视觉语言模型ScreenAI

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术