
OpenAI 正将 ChatGPT 的默认模型更换为 GPT-5.5 Instant版。本次更新减少了模型幻觉问题,同时让回复内容更加精炼。此外,全新功能记忆来源可向用户展示,是哪些存储上下文生成了当前回复。
GPT-5.5 Instant取代了GPT-5.3 Instant,也可以通过API作为“聊天最新”提供。在OpenAI内部测试中,GPT-5.5 Instant在医学、法律和金融高风险提示上的幻觉声明比前代减少了52.5%。OpenAI称,在用户此前标记存在事实错误的棘手对话中,不准确的说法下降了37.3%。
OpenAI以代数问题为例。一名用户上传了一张手写方程的照片,显示计算错误。GPT-5.3 Instant最初同意该解,但后来发现x=3不行,却错误地认为没有真正的解。GPT-5.5 Instant 起初也同意用户的数学计算,但随后发现用户对方程的重排和修正后的二次方程的解法错误。
基准测试成绩也印证了版本实力提升。在AIME 2025这门竞争性数学考试中,准确率从65.4%跃升至81.2%。GPQA(测试博士级科学推理)从78.5%上升至85.6%。作为科学图表解读和推理的基准指标CharXiv,从75.0%提升到了81.6%。
MMMU-Pro衡量模型在文本和图像中处理专家级问题的能力,从69.2%上升到76.0%。OmniDocBench(一项从复杂文档中提取结构化数据的测试)错误率从14.6%降至12.5%。

更精致的答案和更智能的个性化
OpenAI还专注于删减冗余。答案更简短而不失内容; 官方表示,该模型能减少用户追问后续问题的次数,自动剔除多余表情符号,省去繁杂的格式排版。OpenAI写道:“它可以提供相同的信息,且通常比以往模型更具实用性,同时减少冗长和格式化,避免回复过长。”
当这些功能开启时,该模型还能更好地利用过去聊天记录、上传文件和连接的Gmail账户的上下文。据报道,GPT-5.5 Instant在判断额外个性化是否真正有助于回答方面更有优势,并且更快地搜索了之前的对话。
OpenAI 正将记忆来源功能全面落地到所有 ChatGPT 模型中。当回复依托已存储的上下文生成时,用户如今可以查看具体引用了哪些信息,包括保存的笔记与历史聊天记录。相关条目可标注为相关 / 无关,也支持编辑或删除操作。
OpenAI 表示,记忆来源并不会始终展示生成回复背后的所有参考依据。例如,模型检索到的部分历史对话,并不会全部作为来源显示。公司计划随着时间推移,使视野更加完整。分享聊天会话时,记忆来源信息不会一并同步,临时聊天既不读取内存也不更新内存。
跨计划错开部署
OpenAI 表示,GPT-5.5 Instant版现已向所有 ChatGPT 用户即刻推送上线。付费用户仍可在模型设置中继续使用 GPT-5.3 Instant版,该版本将在三个月后正式停用。
基于历史对话、上传文件以及谷歌邮箱(Gmail)的增强个性化功能,率先面向网页端 Plus 和 Pro 会员开放,移动端版本即将上线。免费版、Go 版、商业版及企业版用户预计将在未来几周内陆续获得该功能权限。记忆来源功能将首先在网页端面向所有个人用户套餐推送,随后登陆移动端。部分个性化功能并非在所有地区都可用。
OpenAI最近推出了GPT-5.5 Thinking作为更高级别的模型,而GPT-5.5 Instant则是ChatGPT的日常默认。Thinking版本更强大:据称在网络安全任务上可与Claude Mythos媲美,并取代了专门的Codex编码模型。
