谷歌推出Gemini 3 Flash，成为Gemini应用的默认模型

2025年12月18日由佚名发表 411 0

谷歌今天发布了其快速且经济实惠的Gemini 3 Flash模型，该模型基于上个月发布的Gemini 3，旨在抢占OpenAI的市场份额。公司还将其设为Gemini应用和搜索中AI模式的默认模型。

新款Flash模型是在谷歌宣布Gemini 2.5 Flash模式六个月后推出的，提供了显著的改进。在基准测试中，Gemini 3 Flash模型在许多方面大幅超越其前身，并在某些指标上与其他前沿模型如Gemini 3 Pro和GPT 5.2的表现相当。

例如，它在人类最后考试基准测试中得分33.7%，该测试旨在评估不同领域的专业知识。相比之下，Gemini 3 Pro得分37.5%，Gemini 2.5 Flash得分11%，新发布的GPT-5.2得分34.5%。

在多模态和推理基准测试MMMU-Pro中，新模型以81.2%的得分超过所有竞争对手。

消费者推广

谷歌正在全球范围内将Gemini 3 Flash设为Gemini应用的默认模型，取代Gemini 2.5 Flash。用户仍然可以从模型选择器中选择Pro模型来处理数学和编码问题。

公司表示，新模型擅长识别多模态内容并基于此提供答案。例如，您可以上传您的pickleball短视频并请求建议；您可以尝试画一幅草图，让模型猜测您在画什么；或者您可以上传音频录音以获取分析或生成测验。

公司还表示，该模型更好地理解用户查询的意图，并能生成带有图像和表格等元素的更具视觉效果的答案。

您还可以使用新模型在Gemini应用中使用提示创建应用原型。Gemini 3 Pro现在在美国可供所有人使用进行搜索，更多美国用户也可以在搜索中访问Nano Banana Pro图像模型。

企业和开发者可用性

谷歌指出，JetBrains、Figma、Cursor、Harvey和Latitude等公司已经在使用Gemini 3 Flash模型，该模型可通过Vertex AI和Gemini Enterprise获得。

对于开发者，公司通过API和Antigravity提供预览模型，这是谷歌上个月发布的新编码工具。

公司表示，Gemini 3 Pro在SWE-bench验证编码基准测试中得分78%，仅次于GPT-5.2。它补充说，该模型非常适合视频分析、数据提取和视觉问答，并且由于其速度，适合快速和可重复的工作流程。

模型定价为每百万输入标记$0.50和每百万输出标记$3.00。这比Gemini Flash 2.5的每百万输入标记$0.30和每百万输出标记$2.50略贵。但谷歌声称新模型的表现优于Gemini 2.5 Pro模型，同时速度快三倍。而且，对于思维任务，它平均使用的标记比2.5 Pro少30%。这意味着总体上，您可能会在某些任务上节省标记数量。

“我们确实将Flash定位为更多的工作马模型。因此，如果您查看，例如，这张表格顶部的输入和输出价格，Flash在输入和输出价格方面是一个更便宜的选择。因此，它实际上允许许多公司进行批量任务，”Gemini模型的产品高级总监Tulsee Doshi在一次简报中告诉TechCrunch。

自从发布Gemini 3以来，谷歌每天通过其API处理超过1万亿个标记，正值其与OpenAI的激烈发布和性能竞争之际。

本月早些时候，Sam Altman据报道向OpenAI团队发送了一份“红色代码”内部备忘录，因为ChatGPT的流量下降而谷歌在消费者中的市场份额上升。此后，OpenAI已发布了GPT-5.2和一个新的图像生成模型。OpenAI还吹嘘其企业使用量的增长，并表示ChatGPT消息量自2024年11月以来增长了8倍。

虽然谷歌没有直接回应与OpenAI的竞争，但它表示新模型的发布正在挑战所有公司保持活跃。

“关于整个行业正在发生的事情是，这些模型都在继续变得出色，相互挑战，推动前沿。我认为同样出色的是，随着公司发布这些模型，”Doshi说。

“我们也在引入新的基准测试和评估这些模型的新方法。这也在鼓励我们。”

文章来源：https://techcrunch.com/2025/12/17/google-launches-gemini-3-flash-makes-it-the-default-model-in-the-gemini-app/

标签：

谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI的新ChatGPT图像模型在复杂提示上与谷歌的Nano Banana Pro相当

下一篇 OpenAI推出新款GPT Image 1.5模型，优化用于图像编辑

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术