谷歌更新Gemini,推出强大新AI图像模型,具备照片编辑功能

2025年08月27日 由 佚名 发表 172 0


谷歌有限责任公司今天宣布,它正在更新其Gemini应用和聊天机器人,引入一个强大的新人工智能图像模型,为用户提供精细的照片编辑功能。


这个新模型名为Gemini 2.5 Flash Image,今天在Gemini应用上首次亮相。用户可以用自然语言编辑他们的照片。公司声称新模型提供了最先进的图像生成和编辑功能,保持原始构图、物体和人物不变,同时根据用户的需求添加、改变或删除内容。


谷歌DeepMind,公司旗下的AI研究部门,以神秘而滑稽的名字“Nano Banana”在LMArena上测试了这个新模型。这个公共网站通过众包方式收集关于AI模型质量的匿名反馈。起初,这个新模型是什么尚不清楚,尤其是考虑到它奇怪的名字,但用户很快就推测出它一定来自谷歌。


在早期预览中,这个模型在网站上表现优于其他所有照片编辑模型,获得了“世界顶级编辑模型”的称号。尽管它并非没有缺陷,但该模型在一致性、质量和遵循指令方面表现出色。


现在,DeepMind透露,这个模型实际上是Gemini 2.5 Flash Image,并为新的Gemini图像编辑体验提供支持。



“我们正在大力推动视觉质量的进步,以及模型遵循指令的能力,”谷歌DeepMind视觉生成模型的产品负责人Nicole Brichtova在接受TechCrunch采访时说道。


图像编辑和AI模型的一个问题一直是模型往往会对图像进行细微或大的修改,即使用户要求它们进行小改动。例如,用户可能拍摄了一张自己的照片,并要求模型添加眼镜。模型可能会在他们的脸上添加眼镜,但可能会显著改变他们的面部特征,调整他们的发型,或者背景中的一个物体可能会从一个东西变成另一个。


为了测试新模型,谷歌建议人们用自己的照片试一试。他们可以用它来给自己换上新装或改变位置。该模型还能够将来自两张不同照片的主体融合到一个全新的场景中——例如,拍一张你和你的猫的照片,并让它把你们放在沙发上。


根据谷歌的说法,这个新模型允许用户进行多次编辑:只需拍一张照片并要求进行一次更改,然后再进行后续更改。这允许对照片或图像进行自然的迭代修改。由于提示可以对位置或主体提出具体要求,模型只会改变它们而不会改变其他内容。


开发者还可以通过Gemini API、Google AI Studio和Vertex AI访问这一功能。




文章来源:https://siliconangle.com/2025/08/26/google-updates-gemini-powerful-new-ai-image-model-photo-editing-capabilities/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消