OpenAI推出新款GPT Image 1.5模型,优化用于图像编辑

2025年12月18日 由 佚名 发表 27 0


OpenAI集团PBC今天发布了GPT Image 1.5,这是一款专为图像生成任务优化的新型人工智能模型。


该算法在Google LLC推出其新产品几周后开始发布。推出了自己的新图像生成器。该模型被称为Nano Banana Pro,比其前代产品更擅长渲染文本和执行后续提示的指令。GPT Image 1.5在这些领域也进行了改进,并增加了多项优化。


开发者可以通过应用程序接口访问GPT Image 1.5。API的定价比OpenAI之前的图像生成模型低20%。非技术用户则可以通过ChatGPT的图像生成功能与该算法互动。


根据OpenAI的说法,由于模型的切换,ChatGPT生成图像的速度比以前快四倍。这表明GPT Image 1.5比其前代产品在硬件效率上更具优势。减少模型的硬件需求不仅能提高处理速度,还能降低成本:AI完成任务所需的时间越短,消耗的电力就越少。


当AI模型编辑图像时,有时会修改用户未要求更改的细节。这在消费者使用场景中可能不是问题,但在商业项目中可能会带来挑战。使用ChatGPT调整产品图像大小的品牌不希望聊天机器人移除其标志。


OpenAI表示,GPT Image 1.5在保留重要图像细节的同时进行更改方面比其前代产品更出色。它在执行复杂的多步骤编辑方面也更为熟练。例如,用户可以要求模型将来自三个不同绘图的对象放在单个图像中,然后更改对象的插图风格。


文本渲染是Nano Banana Pro的主要卖点之一,也是OpenAI研究人员在训练GPT Image 1.5时的重点。ChatGPT的开发者表示,该模型在渲染小而密集的文本方面比其前代产品更出色。这使其更适合生成信息图表等任务。


OpenAI在博客文章中披露GPT Image 1.5也有某些限制。根据公司说法,该模型对某些绘画风格的支持有限,有时在生成需要科学知识的图像时会出错。然而,在这方面,它比前代产品表现显著更好。


该模型可以通过ChatGPT中的新界面部分访问。该部分包括预配置的图像滤镜和提示建议,OpenAI计划定期更新。


GPT Image 1.5在公司将ChatGPT升级到GPT-5.2后几天内推出,这是其最新的基础模型。OpenAI表示,后者模型在科学任务方面比早期算法更出色。在一次内部测试中,GPT-5.2在包含大学水平数学问题的AI基准测试中创下纪录。


OpenAI今天发布了自己的AI基准测试FrontierScience。它旨在衡量基础模型执行科学任务的表现。该基准测试包括700多个涵盖物理、化学和生物学的文本问题。


文章来源:https://siliconangle.com/2025/12/16/openai-launches-new-gpt-image-1-5-model-optimized-image-editing/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消