谷歌最快且最便宜的型号Gemini 3.1 Flash-Lite变得更智能，但价格也涨了三倍

2026年03月04日由 alex 发表 4299 0

Google Deepmind 发布了 Gemini 3.1 Flash-Lite 预览版，这是 Gemini 3 系列中最快且最实惠的型号。

根据Artificial Analysis的数据，该模型在智力指数上得分34分，比其前代Gemini 2.5 Flash-Lite高出12分。尽管性能有了大幅提升，但它依然保持了与前一版本相同的速度，每秒产出超过360个令牌，平均响应时间为5.1秒。

在多模态任务中，它击败了Claude Opus 4.6和Kimi K2.5等顶级机型，在MMMU-Pro基准测试中达到了78%。人工分析指出，工具使用几乎没有改善。上下文窗口保持在一百万个令牌。

flashlite_benchmark_AA

在 Arena.ai 排行榜上，该榜单根据盲比中的人类偏好排名模型，Gemini 3.1 Flash-Lite 的 Elo 分数为 1432。在推理和多模态理解方面，它优于同级别的其他模型，在GPQA Diamond（科学知识）上获得86.9%，在MMMU Pro（多模态理解与推理）上获得76.8%。这些数字超过了更大尺寸的上一代Gemini车型，包括2.5 Flash。

谷歌表示，该型号的首次响应令牌发送速度是Gemini 2.5 Flash的2.5倍，输出速度也比Gemini 2.5 Flash快45%（不是2.5 Flash-Lite;Flash 是更大的型号）。据谷歌介绍，开发者可以调节模型“思考”的程度，因此它既适用于简单的高量工作如翻译，也适用于构建用户界面等较重的工作。

速度和质量的提升是有代价的。输出定价已超过三倍：Gemini 3.1 Flash-Lite 每百万输入代币收费为 0.25 美元（较 2.5 版本的 0.10 美元上涨），每百万个输出代币收费为 1.50 美元（较 0.40 美元上涨）。

屏幕截图_4-3-2026_104320_the-decoder.com

该模型可在 Google AI Studio 和 Vertex AI 中进行测试。完整的基准测试结果已发布在Artificial Analysis和 Arena.ai 排行榜上。

文章来源：https://the-decoder.com/googles-fastest-and-cheapest-model-gemini-3-1-flash-lite-got-smarter-but-also-tripled-the-price/

标签：

谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI 发布 GPT-5.3 Instant，使日常对话更顺畅，搜索更畅快

下一篇 Meta 测试人工智能购物搜索，以与 ChatGPT 和 Gemini 竞争

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术