谷歌推出Gemini 3 Flash,成为Gemini应用的默认模型

2025年12月18日 由 佚名 发表 30 0


谷歌今天发布了其快速且经济实惠的Gemini 3 Flash模型,该模型基于上个月发布的Gemini 3,旨在抢占OpenAI的市场份额。公司还将其设为Gemini应用和搜索中AI模式的默认模型。


新款Flash模型是在谷歌宣布Gemini 2.5 Flash模式六个月后推出的,提供了显著的改进。在基准测试中,Gemini 3 Flash模型在许多方面大幅超越其前身,并在某些指标上与其他前沿模型如Gemini 3 Pro和GPT 5.2的表现相当。


例如,它在人类最后考试基准测试中得分33.7%,该测试旨在评估不同领域的专业知识。相比之下,Gemini 3 Pro得分37.5%,Gemini 2.5 Flash得分11%,新发布的GPT-5.2得分34.5%。


在多模态和推理基准测试MMMU-Pro中,新模型以81.2%的得分超过所有竞争对手。


消费者推广


谷歌正在全球范围内将Gemini 3 Flash设为Gemini应用的默认模型,取代Gemini 2.5 Flash。用户仍然可以从模型选择器中选择Pro模型来处理数学和编码问题。


公司表示,新模型擅长识别多模态内容并基于此提供答案。例如,您可以上传您的pickleball短视频并请求建议;您可以尝试画一幅草图,让模型猜测您在画什么;或者您可以上传音频录音以获取分析或生成测验。


公司还表示,该模型更好地理解用户查询的意图,并能生成带有图像和表格等元素的更具视觉效果的答案。


您还可以使用新模型在Gemini应用中使用提示创建应用原型。Gemini 3 Pro现在在美国可供所有人使用进行搜索,更多美国用户也可以在搜索中访问Nano Banana Pro图像模型。



企业和开发者可用性


谷歌指出,JetBrains、Figma、Cursor、Harvey和Latitude等公司已经在使用Gemini 3 Flash模型,该模型可通过Vertex AI和Gemini Enterprise获得。


对于开发者,公司通过API和Antigravity提供预览模型,这是谷歌上个月发布的新编码工具。


公司表示,Gemini 3 Pro在SWE-bench验证编码基准测试中得分78%,仅次于GPT-5.2。它补充说,该模型非常适合视频分析、数据提取和视觉问答,并且由于其速度,适合快速和可重复的工作流程。



模型定价为每百万输入标记$0.50和每百万输出标记$3.00。这比Gemini Flash 2.5的每百万输入标记$0.30和每百万输出标记$2.50略贵。但谷歌声称新模型的表现优于Gemini 2.5 Pro模型,同时速度快三倍。而且,对于思维任务,它平均使用的标记比2.5 Pro少30%。这意味着总体上,您可能会在某些任务上节省标记数量。



“我们确实将Flash定位为更多的工作马模型。因此,如果您查看,例如,这张表格顶部的输入和输出价格,Flash在输入和输出价格方面是一个更便宜的选择。因此,它实际上允许许多公司进行批量任务,”Gemini模型的产品高级总监Tulsee Doshi在一次简报中告诉TechCrunch。


自从发布Gemini 3以来,谷歌每天通过其API处理超过1万亿个标记,正值其与OpenAI的激烈发布和性能竞争之际。


本月早些时候,Sam Altman据报道向OpenAI团队发送了一份“红色代码”内部备忘录,因为ChatGPT的流量下降而谷歌在消费者中的市场份额上升。此后,OpenAI已发布了GPT-5.2和一个新的图像生成模型。OpenAI还吹嘘其企业使用量的增长,并表示ChatGPT消息量自2024年11月以来增长了8倍。


虽然谷歌没有直接回应与OpenAI的竞争,但它表示新模型的发布正在挑战所有公司保持活跃。


“关于整个行业正在发生的事情是,这些模型都在继续变得出色,相互挑战,推动前沿。我认为同样出色的是,随着公司发布这些模型,”Doshi说。


“我们也在引入新的基准测试和评估这些模型的新方法。这也在鼓励我们。”


文章来源:https://techcrunch.com/2025/12/17/google-launches-gemini-3-flash-makes-it-the-default-model-in-the-gemini-app/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消