谷歌最快且最便宜的型号Gemini 3.1 Flash-Lite变得更智能,但价格也涨了三倍

2026年03月04日 由 alex 发表 3863 0

Google Deepmind 发布了 Gemini 3.1 Flash-Lite 预览版,这是 Gemini 3 系列中最快且最实惠的型号。


根据Artificial Analysis的数据,该模型在智力指数上得分34分,比其前代Gemini 2.5 Flash-Lite高出12分。尽管性能有了大幅提升,但它依然保持了与前一版本相同的速度,每秒产出超过360个令牌,平均响应时间为5.1秒。


在多模态任务中,它击败了Claude Opus 4.6和Kimi K2.5等顶级机型,在MMMU-Pro基准测试中达到了78%。人工分析指出,工具使用几乎没有改善。上下文窗口保持在一百万个令牌。


flashlite_benchmark_AA


在 Arena.ai 排行榜上,该榜单根据盲比中的人类偏好排名模型,Gemini 3.1 Flash-Lite 的 Elo 分数为 1432。在推理和多模态理解方面,它优于同级别的其他模型,在GPQA Diamond(科学知识)上获得86.9%,在MMMU Pro(多模态理解与推理)上获得76.8%。这些数字超过了更大尺寸的上一代Gemini车型,包括2.5 Flash。


谷歌表示,该型号的首次响应令牌发送速度是Gemini 2.5 Flash的2.5倍,输出速度也比Gemini 2.5 Flash快45%(不是2.5 Flash-Lite;Flash 是更大的型号)。据谷歌介绍,开发者可以调节模型“思考”的程度,因此它既适用于简单的高量工作如翻译,也适用于构建用户界面等较重的工作。


速度和质量的提升是有代价的。输出定价已超过三倍:Gemini 3.1 Flash-Lite 每百万输入代币收费为 0.25 美元(较 2.5 版本的 0.10 美元上涨),每百万个输出代币收费为 1.50 美元(较 0.40 美元上涨)。


屏幕截图_4-3-2026_104320_the-decoder.com


该模型可在 Google AI Studio 和 Vertex AI 中进行测试。完整的基准测试结果已发布在Artificial Analysis和 Arena.ai 排行榜上。

文章来源:https://the-decoder.com/googles-fastest-and-cheapest-model-gemini-3-1-flash-lite-got-smarter-but-also-tripled-the-price/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消