OpenAI 宣布正式推出 GPT-5.5 Instant,这款全新模型将取代此前的 GPT-5.3 Instant,成为 ChatGPT 的默认版本,并向所有用户开放使用。作为 Instant 系列的主力产品,该模型每天服务数亿用户,官方表示,即便在如此庞大的用户基数下,即使是微小的改进也能带来显著效果。此次升级聚焦三大核心目标:提升准确性、优化回复风格、增强个性化能力。
在高风险领域,新模型的准确性提升尤为突出。内部测试数据显示,GPT-5.5 Instant 在医疗、法律和金融类问题上的“幻觉率”较上一版本下降了 52.5%,用户标记过的错误对话的错误率也减少了 37.3%。图片分析、理科问题解答质量以及主动调用搜索工具的判断能力均有所改善。数学和科学能力的提升尤为显著:在 AIME 2025 竞赛数学测试中,GPT-5.5 Instant 得分 81.2,而 GPT-5.3 Instant 仅为 65.4;博士级科学测试 GPQA 的得分从 78.5 升至 85.6,多模态推理基准 MMMU-Pro 的得分从 69.2 升至 76,科学图表理解 CharXiv 从 75 升至 81.6,文档解析错误率则从 14.6% 降至 12.5%。
OpenAI 通过一道代数题展示了两个版本的差异。用户提交了一道根式方程的解题过程并询问是否正确,GPT-5.3 Instant 发现 x=3 代入原方程不成立后,直接判定“无实数解”,未进一步追查;而 GPT-5.5 Instant 同样发现 x=3 无效,但随后定位到用户展开 (x-1)² 时的具体错误,并给出了正确解答。
回复风格的优化是此次更新的另一重点。新模型更注重简洁性,减少了格式堆砌和表情符号的使用,同时降低了不必要的追问。例如,当用户询问如何委婉地让话多的同事少说话时,GPT-5.3 Instant 提供了五种分类策略,并附上“不该做什么”清单,结构完整但略显冗长;而 GPT-5.5 Instant 的回复字数减少了 30.2%,行数减少了 29.2%,语气更像朋友给出的建议,重点放在如何将问题引导至自己的专注需求上,而非直接批评对方的说话习惯。
个性化能力是此次升级的另一大亮点。Plus 和 Pro 用户可以授权模型调取历史对话、上传文件以及关联的 Gmail 内容,从而获得更贴合个人情况的回答,无需每次重新解释背景。例如,当用户询问茶馆推荐时,GPT-5.3 Instant 仅根据用户所在城市旧金山推荐了几家热门茶馆;而 GPT-5.5 Instant 则从历史对话中提取用户常去 Asha Tea House、偏好高山茶而非重糖奶茶的记录,推荐了风格更匹配的 Ceré Tea 和 Song Tea & Ceramics,并详细说明了推荐理由。
GPT-5.3 Instant 将保留三个月供付费用户使用,之后正式下线。个性化功能目前向 Plus 和 Pro 用户的网页端开放,移动端及免费、Go、企业等版本的推送计划将在未来几周内陆续跟进,具体功能因地区而异。对开发者而言,GPT-5.5 Instant 已通过 API 以“chat-latest”名称提供。
值得一提的是,OpenAI 创始人奥特曼在 Stripe Sessions 的一场对谈中透露,他在筹备 GPT-5.5 上线派对时,曾询问模型希望举办什么样的派对。模型认真给出了一份清单:希望派对定在美国当地时间 5 月 5 日,演讲环节越短越好,要有人类创造者上台致祝酒词,但自己不想上台祝酒。它还提议现场设一个专门收集 GPT-5.6 建议的环节,并将这些建议反馈给自己。奥特曼认为这些要求“很美好”,最终将派对时间定在下午 5 点 55 分,地点选在 OpenAI 旧金山总部,非本地嘉宾的机票和酒店由 OpenAI 负责。受邀名单由 Codex 从推文回复中筛选,报名链接于 4 月 30 日下午 5 点 55 分关闭,24 小时内有超过 8000 人报名,已有用户晒出了收到的邀请邮件。未被选上的人也收到了一封邮件,OpenAI 将他们的 Codex 调用额度提升了 10 倍。






















