谷歌推出 Nano Banana 2 Lite 极速 AI 图像模型，并开放支持视频创作的 Gemini Omni Flash 接口

2026年07月01日由 alex 发表 3653 0

谷歌发布两款全新生成式人工智能模型。Nano Banana 2 Lite 可在 4 秒内生成图像，成本极低。Gemini Omni Flash 首次支持开发者通过 API 接口，利用文字指令完成视频生成与编辑。

Nano Banana 2 Lite：4 秒出图

谷歌表示，Nano Banana 2 Lite 专为快速创意构思与高吞吐量开发流水线打造。1000 像素分辨率下，文生图仅需 4 秒，单张图片成本仅 0.034 美元。该图像模型在 API 中的标识名称为 gemini-3.1-flash-lite-image。

屏幕截图2026-07-01093925

这款模型主打速度，同时能够精准遵循提示词、稳定还原人物形象，还能在生成图中输出清晰文字。除面向开发者平台外，谷歌还会将该模型逐步落地到旗下各类消费产品，包括谷歌搜索的 AI 模式、Gemini 应用、NotebookLM、谷歌相册、Stitch、Google Flow 以及谷歌广告。

nb2-lite__benchmark_blog

至此，Nano Banana 系列已有三款正式商用模型。谷歌将 Nano Banana 2（Gemini 3.1 Flash Image）定位为综合全能款，兼顾画质与成本；Nano Banana Pro（Gemini 3.1 Pro Image）面向复杂专业场景，拥有顶尖可控性与高阶逻辑推理能力。

屏幕截图2026-07-01093950

开发者可根据速度、画质、低成本等不同需求灵活选型。谷歌认为初代 Nano Banana（Gemini 2.5 Flash Image）已逐步过时。谷歌内部目前仍主要使用 Nano Banana Pro，其图像质量与指令服从度优于 Nano Banana 2，也强于 OpenAI 的 GPT-Image-2。

Gemini Omni Flash：视频生成正式接入 API

Gemini Omni Flash 曾在谷歌开发者大会首次亮相，如今正式面向开发者开放，可在 Gemini 应用程序接口与谷歌 AI 工作室中调用。该模型融合了 Gemini 多模态推理能力，支持视频生成与视频编辑。视频输出定价为每秒 0.10 美元，与 Veo 3.1 Fast 持平。

该模型的核心优势：可使用自然语言交互式剪辑视频；支持文字、图片、视频多种素材混合输入；依托 Gemini 海量知识库完成内容创作，文字与画面特效可以和视频动作精准同步。

现阶段 Gemini Omni Flash 仅支持生成 10 秒短视频。API 暂不支持音频素材引用与镜头画面延展。接口最多可上传 3 秒视频素材，但模型暂时无法正常解析。另外，在切换场景、变动镜头时，人物形象还难以保持高度统一。

谷歌建议：两款模型联动使用

谷歌认为二者搭配能发挥最大价值。开发者先用 Nano Banana 2 Lite 快速生成参考图，再把图片导入 Gemini Omni Flash，一键将静态图片制作成动画视频。目前谷歌默认的 AI 交互 API 会保留会话历史与上下文，支持连续三次视频修改。

谷歌上线三款演示应用，直观展示双模型联动效果：时空穿梭：上传自拍，把人物合成到知名景点并生成动态视频；空间改造：根据房间照片生成室内设计方案，并制作成动态短片；全域产品工作室：把商品静态图片转化为电商带货视频。

谷歌称，两款模型生成的 AI 内容都会自动打上 SynthID 水印。用户可在 Gemini 客户端、Chrome 浏览器内置 Gemini 工具或是谷歌搜索中核验水印。目前 Nano Banana 2 Lite 与 Gemini Omni Flash 已全面上线谷歌 AI 工作室、Gemini API 以及 Gemini 企业智能体平台。

文章来源：https://the-decoder.com/google-launches-nano-banana-2-lite-for-fast-ai-images-and-gemini-omni-flash-for-video-via-api/

标签：

谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Anthropic 全新 Claude Sonnet 5 大幅缩小与高价 Opus 系列模型的性能差距

下一篇 X推出托管MCP服务器，简化Claude、Cursor等AI助手的集成

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术