
谷歌于周三推出了Gemini 3 Flash,旨在吸引希望使用Gemini 3且不产生高昂成本的企业。新模型展示了谷歌利用其在企业客户中的现有人气,同时也是像谷歌这样的模型制造商提供与其前沿模型相当、价格更低的模型的又一例证。
Gemini 3 Flash 加入了备受期待的系列,该系列由上个月推出的 Gemini 3 Pro 和 Gemini 3 Deep Think。Flash采用与Gemini 3 Pro相同的推理方式,但用于完成日常任务时使用的代币更少。谷歌表示,它还能根据所处的使用场景调整思维方式。
而且价格更便宜。对于付费用户,Gemini 3 Flash 每百万个令牌(文本、图像和视频)费用为 0.50 美元,音频输入每百万个令牌收费 1 美元。产出为每百万代币3美元。相比之下,Gemini 3 Pro 的输入费用在每百万个代币中 2 至 4 美元之间。产出价格在每百万代币12至18美元之间。
该型号将取代Gemini 2.5 Flash在Gemini应用中,实现了与Pro相同的编码水平且延迟低,云服务提供商表示。与Gemini 3系列的其他型号一样,Flash适合工具使用和多模态功能。该模型的一些应用场景包括视频分析和数据提取。
“自发布以来,Gemini 3已成为寻求多模态体验的开发者心中最重要的产品,”Informa TechTarget旗下Omdia的分析师Lian Jye Su表示。“我们看到谷歌在提供最先进的多模态人工智能体验方面能力大为提升。”
分析师称,Gemini 3 Flash展示了谷歌在确定最适合其用例的模型时,努力满足其需求,综合考虑准确性、响应质量、成本和速度等因素。
Gartner分析师Arun Chandrasekaran表示,虽然某些用例可能需要Gemini Pro型号,但大多数情况下可以依赖Flash模型。
“你又不是用更低的价格买到劣质型号,”钱德拉塞卡兰说。“只是也许有些复杂的推理场景你会用Pro型号,但在很多其他任务上,Flash能在性能、速度和成本之间提供完美的平衡。”
他补充说,这与模型提供者更广泛的策略一致,即“将大量细节从用户手中抽象出来”。
换句话说,模型制作者希望达到一个阶段,用户无法确定哪种模型会回答他们的问题,除非他们做出明确选择,Chandrasekaran说。
“这也是[模型制造商]降低自身成本的一种方式,”他说。“如果他们能用更低成本的模式提供更多回应,当然会这么做。”
虽然为企业提供更低成本的模式是一个选择,但谷歌在让用户在 Pro 和 Flash 之间做出选择将面临挑战。
“你最好有很好的谈资和游泳通道,”钱德拉塞卡兰说。“这永远是挑战,毕竟这些模型在某种程度上存在微不足道的差异。”
