Google Deepmind 发布了 Gemini 3.1 Flash-Lite 预览版,这是 Gemini 3 系列中最快且最实惠的型号。
根据Artificial Analysis的数据,该模型在智力指数上得分34分,比其前代Gemini 2.5 Flash-Lite高出12分。尽管性能有了大幅提升,但它依然保持了与前一版本相同的速度,每秒产出超过360个令牌,平均响应时间为5.1秒。
在多模态任务中,它击败了Claude Opus 4.6和Kimi K2.5等顶级机型,在MMMU-Pro基准测试中达到了78%。人工分析指出,工具使用几乎没有改善。上下文窗口保持在一百万个令牌。

在 Arena.ai 排行榜上,该榜单根据盲比中的人类偏好排名模型,Gemini 3.1 Flash-Lite 的 Elo 分数为 1432。在推理和多模态理解方面,它优于同级别的其他模型,在GPQA Diamond(科学知识)上获得86.9%,在MMMU Pro(多模态理解与推理)上获得76.8%。这些数字超过了更大尺寸的上一代Gemini车型,包括2.5 Flash。
谷歌表示,该型号的首次响应令牌发送速度是Gemini 2.5 Flash的2.5倍,输出速度也比Gemini 2.5 Flash快45%(不是2.5 Flash-Lite;Flash 是更大的型号)。据谷歌介绍,开发者可以调节模型“思考”的程度,因此它既适用于简单的高量工作如翻译,也适用于构建用户界面等较重的工作。
速度和质量的提升是有代价的。输出定价已超过三倍:Gemini 3.1 Flash-Lite 每百万输入代币收费为 0.25 美元(较 2.5 版本的 0.10 美元上涨),每百万个输出代币收费为 1.50 美元(较 0.40 美元上涨)。

该模型可在 Google AI Studio 和 Vertex AI 中进行测试。完整的基准测试结果已发布在Artificial Analysis和 Arena.ai 排行榜上。
