谷歌推出 Nano Banana 2 Lite 极速 AI 图像模型,并开放支持视频创作的 Gemini Omni Flash 接口

2026年07月01日 由 alex 发表 3653 0

谷歌发布两款全新生成式人工智能模型。Nano Banana 2 Lite 可在 4 秒内生成图像,成本极低。Gemini Omni Flash 首次支持开发者通过 API 接口,利用文字指令完成视频生成与编辑。


Nano Banana 2 Lite:4 秒出图


谷歌表示,Nano Banana 2 Lite 专为快速创意构思与高吞吐量开发流水线打造。1000 像素分辨率下,文生图仅需 4 秒,单张图片成本仅 0.034 美元。该图像模型在 API 中的标识名称为 gemini-3.1-flash-lite-image。



屏幕截图2026-07-01093925


这款模型主打速度,同时能够精准遵循提示词、稳定还原人物形象,还能在生成图中输出清晰文字。除面向开发者平台外,谷歌还会将该模型逐步落地到旗下各类消费产品,包括谷歌搜索的 AI 模式、Gemini 应用、NotebookLM、谷歌相册、Stitch、Google Flow 以及谷歌广告。


nb2-lite__benchmark_blog


至此,Nano Banana 系列已有三款正式商用模型。谷歌将 Nano Banana 2(Gemini 3.1 Flash Image)定位为综合全能款,兼顾画质与成本;Nano Banana Pro(Gemini 3.1 Pro Image)面向复杂专业场景,拥有顶尖可控性与高阶逻辑推理能力。


屏幕截图2026-07-01093950


开发者可根据速度、画质、低成本等不同需求灵活选型。谷歌认为初代 Nano Banana(Gemini 2.5 Flash Image)已逐步过时。谷歌内部目前仍主要使用 Nano Banana Pro,其图像质量与指令服从度优于 Nano Banana 2,也强于 OpenAI 的 GPT-Image-2。


Gemini Omni Flash:视频生成正式接入 API


Gemini Omni Flash 曾在谷歌开发者大会首次亮相,如今正式面向开发者开放,可在 Gemini 应用程序接口与谷歌 AI 工作室中调用。该模型融合了 Gemini 多模态推理能力,支持视频生成与视频编辑。视频输出定价为每秒 0.10 美元,与 Veo 3.1 Fast 持平。


该模型的核心优势:可使用自然语言交互式剪辑视频;支持文字、图片、视频多种素材混合输入;依托 Gemini 海量知识库完成内容创作,文字与画面特效可以和视频动作精准同步。



现阶段 Gemini Omni Flash 仅支持生成 10 秒短视频。API 暂不支持音频素材引用与镜头画面延展。接口最多可上传 3 秒视频素材,但模型暂时无法正常解析。另外,在切换场景、变动镜头时,人物形象还难以保持高度统一。


谷歌建议:两款模型联动使用


谷歌认为二者搭配能发挥最大价值。开发者先用 Nano Banana 2 Lite 快速生成参考图,再把图片导入 Gemini Omni Flash,一键将静态图片制作成动画视频。目前谷歌默认的 AI 交互 API 会保留会话历史与上下文,支持连续三次视频修改。


谷歌上线三款演示应用,直观展示双模型联动效果:时空穿梭:上传自拍,把人物合成到知名景点并生成动态视频;空间改造:根据房间照片生成室内设计方案,并制作成动态短片;全域产品工作室:把商品静态图片转化为电商带货视频。


谷歌称,两款模型生成的 AI 内容都会自动打上 SynthID 水印。用户可在 Gemini 客户端、Chrome 浏览器内置 Gemini 工具或是谷歌搜索中核验水印。目前 Nano Banana 2 Lite 与 Gemini Omni Flash 已全面上线谷歌 AI 工作室、Gemini API 以及 Gemini 企业智能体平台。

文章来源:https://the-decoder.com/google-launches-nano-banana-2-lite-for-fast-ai-images-and-gemini-omni-flash-for-video-via-api/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消