阿里云发布通义千问2.5：中文大模型性能领跑，全面超越GPT-4 Turbo

2024年05月09日由 neo 发表 833 0

在人工智能领域，阿里云再次展现了其强大的研发实力。近日，阿里云正式发布了通义千问2.5版本，这款中文大模型在性能上全面超越了GPT-4 Turbo，被业界誉为地表最强中文大模型。

s_a02f902c615e48b2800568626b637332

据了解，通义千问2.5的最新版本在多个基准测评中均取得了显著成绩。其最新开源的1100亿参数模型在MMLU、TheoremQA、GPQA等测试中均超越了Meta的Llama-3-70B模型，成为开源领域的新标杆。这一成绩不仅证明了通义千问2.5在模型参数和性能上的卓越，也体现了阿里云在人工智能领域的技术领先地位。

与通义千问2.1版本相比，通义千问2.5在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言，这些能力分别提升了9%、16%、19%和10%，其中中文能力更是持续领先业界。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4 Turbo持平，成为该基准首次有国产大模型取得如此出色成绩。

阿里云此次不仅发布了通义千问2.5版本，还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在多个基准测评中均超越了Meta的Llama-3-70B模型，并在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上荣登榜首。这一成就再次巩固了通义开源系列在业界的领先地位。

d84380a8fb0a46b2814b4574ac297470

除了模型性能的卓越外，通义的多模态模型和专有能力模型也展现出了业界顶尖的影响力。其中，通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V，目前已在多家企业落地应用，为各行各业带来了实质性的帮助。此外，通义千问代码大模型CodeQwen1.5-7B也是业界领先的模型之一，在HuggingFace代码模型榜单Big Code上位居前列，同时还是国内用户规模第一的智能编码助手通义灵码的底座。

阿里云方面表示，通义千问2.5的发布是阿里云在人工智能领域持续创新的重要成果之一。未来，阿里云将继续加大在人工智能领域的投入和研发力度，推出更多高性能、高可靠性的模型和产品，为企业和开发者提供更加优质、高效的人工智能服务。

文章来源：https://news.mydrivers.com/1/978/978802.htm

标签：

通义千问

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇智谱AI研发高质量文生视频模型，对标OpenAI Sora，预计年内发布

下一篇普林斯顿大学与Meta AI联合推出Lory模型，重塑自回归语言模型预训练

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术