
OpenAI 正在推出其基于人工智能的图像生成器最新版本,具备新的“思考能力”,使其能够通过网络搜索,帮助从单一提示生成多张图片。周二,OpenAI 宣布 ChatGPT Images 2.0 现在可以创建更“复杂”的图像,提升了其遵循指令、保存你选择细节和生成文本的能力。
它由OpenAI全新的GPT Image 2模型驱动,ChatGPT Plus、Pro、Business和Enterprise订阅用户可获得新的思维能力。当选择思考模型时,聊天机器人的图片生成器可以从网络中提取信息,基于你上传的文件创建视觉解释,并在生成前“推理图像结构”。

ChatGPT Images 2.0 还能在“思考”功能下同时创建最多八张图片,同时保持每个场景中的相同字符、对象和风格。OpenAI表示,这将使生成诸如漫画页、一系列社交图形或房屋每个房间的设计方案变得更容易。
所有 ChatGPT 用户都可以利用更新,让 ChatGPT Images 2.0“更好地捕捉照片的标志性特征”,此外还包括像素艺术、漫画、电影静止图及其他类型的图片。它现在可以生成高达2K分辨率和更多宽高比的图像,从更宽的格式(如3:1)到更高的宽高(如1:3)不等。它不仅更擅长生成英语和其他拉丁字母语言;OpenAI表示,Images 2.0在生成包含日语、韩语、中文、印地语和孟加拉语文本的图像方面取得了“显著进展”。



OpenAI去年首次发布ChatGPT图片,并于去年12月发布了最后一次重大更新,增加了更快的图像生成和更强的照片编辑功能。此后,随着谷歌的Nano Banana Pro和Microsoft的MAI-Image-2等工具的到来,竞争愈发激烈。
ChatGPT 图片 2.0 从今天起对所有 ChatGPT 和 Codex 用户开放。
