谷歌发布两款全新生成式人工智能模型。Nano Banana 2 Lite 可在 4 秒内生成图像,成本极低。Gemini Omni Flash 首次支持开发者通过 API 接口,利用文字指令完成视频生成与编辑。
Nano Banana 2 Lite:4 秒出图
谷歌表示,Nano Banana 2 Lite 专为快速创意构思与高吞吐量开发流水线打造。1000 像素分辨率下,文生图仅需 4 秒,单张图片成本仅 0.034 美元。该图像模型在 API 中的标识名称为 gemini-3.1-flash-lite-image。

这款模型主打速度,同时能够精准遵循提示词、稳定还原人物形象,还能在生成图中输出清晰文字。除面向开发者平台外,谷歌还会将该模型逐步落地到旗下各类消费产品,包括谷歌搜索的 AI 模式、Gemini 应用、NotebookLM、谷歌相册、Stitch、Google Flow 以及谷歌广告。

至此,Nano Banana 系列已有三款正式商用模型。谷歌将 Nano Banana 2(Gemini 3.1 Flash Image)定位为综合全能款,兼顾画质与成本;Nano Banana Pro(Gemini 3.1 Pro Image)面向复杂专业场景,拥有顶尖可控性与高阶逻辑推理能力。

开发者可根据速度、画质、低成本等不同需求灵活选型。谷歌认为初代 Nano Banana(Gemini 2.5 Flash Image)已逐步过时。谷歌内部目前仍主要使用 Nano Banana Pro,其图像质量与指令服从度优于 Nano Banana 2,也强于 OpenAI 的 GPT-Image-2。
Gemini Omni Flash:视频生成正式接入 API
Gemini Omni Flash 曾在谷歌开发者大会首次亮相,如今正式面向开发者开放,可在 Gemini 应用程序接口与谷歌 AI 工作室中调用。该模型融合了 Gemini 多模态推理能力,支持视频生成与视频编辑。视频输出定价为每秒 0.10 美元,与 Veo 3.1 Fast 持平。
该模型的核心优势:可使用自然语言交互式剪辑视频;支持文字、图片、视频多种素材混合输入;依托 Gemini 海量知识库完成内容创作,文字与画面特效可以和视频动作精准同步。
现阶段 Gemini Omni Flash 仅支持生成 10 秒短视频。API 暂不支持音频素材引用与镜头画面延展。接口最多可上传 3 秒视频素材,但模型暂时无法正常解析。另外,在切换场景、变动镜头时,人物形象还难以保持高度统一。
谷歌建议:两款模型联动使用
谷歌认为二者搭配能发挥最大价值。开发者先用 Nano Banana 2 Lite 快速生成参考图,再把图片导入 Gemini Omni Flash,一键将静态图片制作成动画视频。目前谷歌默认的 AI 交互 API 会保留会话历史与上下文,支持连续三次视频修改。
谷歌上线三款演示应用,直观展示双模型联动效果:时空穿梭:上传自拍,把人物合成到知名景点并生成动态视频;空间改造:根据房间照片生成室内设计方案,并制作成动态短片;全域产品工作室:把商品静态图片转化为电商带货视频。
谷歌称,两款模型生成的 AI 内容都会自动打上 SynthID 水印。用户可在 Gemini 客户端、Chrome 浏览器内置 Gemini 工具或是谷歌搜索中核验水印。目前 Nano Banana 2 Lite 与 Gemini Omni Flash 已全面上线谷歌 AI 工作室、Gemini API 以及 Gemini 企业智能体平台。
