ChatGPT更新推出了GPT-5.5 Instant,成为ChatGPT的新默认模型

2026年05月06日 由 alex 发表 726 0

gpt_55_instant-scaled


OpenAI 正在用 GPT-5.5 Instant替代 ChatGPT 的默认模型。此次更新减少了幻觉并收紧了回复,同时新增了名为“内存源”的功能,显示用户是哪些上下文塑造了给定的回复。


GPT-5.5 Instant取代了GPT-5.3 Instant,也可以通过API作为“聊天最新”提供。在OpenAI内部测试中,GPT-5.5 Instant在医学、法律和金融高风险提示上的幻觉声明比前代减少了52.5%。OpenAI称,在用户此前标记存在事实错误的棘手对话中,不准确的说法下降了37.3%。



OpenAI以代数问题为例。一名用户上传了一张手写方程的照片,显示计算错误。GPT-5.3 Instant最初同意该解,但后来发现x=3不行,却错误地认为没有真正的解。GPT-5.5 Instant 起初也同意用户的数学计算,但随后发现用户对方程的重排和修正后的二次方程的解法错误。


基准分数也讲述了类似的故事。在AIME 2025这门竞争性数学考试中,准确率从65.4%跃升至81.2%。GPQA(测试博士级科学推理)从78.5%上升至85.6%。作为科学图表解读和推理的基准指标CharXiv,从75.0%提升到了81.6%。


MMMU-Pro衡量模型在文本和图像中处理专家级问题的能力,从69.2%上升到76.0%。OmniDocBench(一项从复杂文档中提取结构化数据的测试)错误率从14.6%降至12.5%。


屏幕截图2026-05-06091917


更精致的答案和更智能的个性化

OpenAI还专注于删减冗余。答案更简短而不失内容;公司表示,该模特要求的后续问题更少,去除多余的表情符号,并跳过繁重的格式化。OpenAI写道:“它可以提供相同的信息,且通常比以往模型更具实用性,同时减少冗长和格式化,避免回复过长。”


当这些功能开启时,该模型还能更好地利用过去聊天记录、上传文件和连接的Gmail账户的上下文。据报道,GPT-5.5 Instant在判断额外个性化是否真正有助于回答方面更有优势,并且更快地搜索了之前的对话。


OpenAI 也在所有 ChatGPT 模型中推广内存源。当回复基于存储的上下文时,用户现在可以看到使用了哪些信息,无论是保存的笔记还是过去的聊天记录。条目可以标记为相关或无关,编辑或删除。



但OpenAI表示,内存源并不总能显示响应背后的每一个因素。例如,只有部分聊天记录会被模型搜索作为来源。公司计划随着时间推移,使视野更加完整。聊天共享时不会传递内存源,临时聊天既不读取内存也不更新内存。


跨计划错开部署

OpenAI 表示 GPT-5.5 Instant版将立即向所有 ChatGPT 用户推送。付费用户仍可通过模型设置访问GPT-5.3 Instant,期限还要三个月,之后才会被淘汰。


基于过去聊天记录、文件和Gmail的增强个性化功能将率先在网页端为Plus和Pro用户推出,移动端也很快推出。预计免费、Go、商务和企业套餐将在未来几周内获得访问权限。内存源将首先推广至所有消费者网络套餐,移动端将随后推出。部分个性化功能可能并非所有地区都可用。


OpenAI最近推出了GPT-5.5 Thinking作为更高级别的模型,而GPT-5.5 Instant则是ChatGPT的日常默认。Thinking版本更强大:据称在网络安全任务上可与Claude Mythos媲美,并取代了专门的Codex编码模型。

文章来源:https://the-decoder.com/chatgpt-update-rolls-out-gpt-5-5-instant-with-fewer-hallucinations-and-more-personalized-answers/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消