GPT-5.5 Instant上线：更懂你更智能，奥特曼邀马斯克共赴AI派对

发布时间：2026-05-06 09:20 来源：快讯作者：孙雅

OpenAI 宣布正式推出 GPT-5.5 Instant，这款全新模型将取代此前的 GPT-5.3 Instant，成为 ChatGPT 的默认版本，并向所有用户开放使用。作为 Instant 系列的主力产品，该模型每天服务数亿用户，官方表示，即便在如此庞大的用户基数下，即使是微小的改进也能带来显著效果。此次升级聚焦三大核心目标：提升准确性、优化回复风格、增强个性化能力。

在高风险领域，新模型的准确性提升尤为突出。内部测试数据显示，GPT-5.5 Instant 在医疗、法律和金融类问题上的“幻觉率”较上一版本下降了 52.5%，用户标记过的错误对话的错误率也减少了 37.3%。图片分析、理科问题解答质量以及主动调用搜索工具的判断能力均有所改善。数学和科学能力的提升尤为显著：在 AIME 2025 竞赛数学测试中，GPT-5.5 Instant 得分 81.2，而 GPT-5.3 Instant 仅为 65.4；博士级科学测试 GPQA 的得分从 78.5 升至 85.6，多模态推理基准 MMMU-Pro 的得分从 69.2 升至 76，科学图表理解 CharXiv 从 75 升至 81.6，文档解析错误率则从 14.6% 降至 12.5%。

OpenAI 通过一道代数题展示了两个版本的差异。用户提交了一道根式方程的解题过程并询问是否正确，GPT-5.3 Instant 发现 x=3 代入原方程不成立后，直接判定“无实数解”，未进一步追查；而 GPT-5.5 Instant 同样发现 x=3 无效，但随后定位到用户展开 (x-1)² 时的具体错误，并给出了正确解答。

回复风格的优化是此次更新的另一重点。新模型更注重简洁性，减少了格式堆砌和表情符号的使用，同时降低了不必要的追问。例如，当用户询问如何委婉地让话多的同事少说话时，GPT-5.3 Instant 提供了五种分类策略，并附上“不该做什么”清单，结构完整但略显冗长；而 GPT-5.5 Instant 的回复字数减少了 30.2%，行数减少了 29.2%，语气更像朋友给出的建议，重点放在如何将问题引导至自己的专注需求上，而非直接批评对方的说话习惯。

个性化能力是此次升级的另一大亮点。Plus 和 Pro 用户可以授权模型调取历史对话、上传文件以及关联的 Gmail 内容，从而获得更贴合个人情况的回答，无需每次重新解释背景。例如，当用户询问茶馆推荐时，GPT-5.3 Instant 仅根据用户所在城市旧金山推荐了几家热门茶馆；而 GPT-5.5 Instant 则从历史对话中提取用户常去 Asha Tea House、偏好高山茶而非重糖奶茶的记录，推荐了风格更匹配的 Ceré Tea 和 Song Tea & Ceramics，并详细说明了推荐理由。

GPT-5.3 Instant 将保留三个月供付费用户使用，之后正式下线。个性化功能目前向 Plus 和 Pro 用户的网页端开放，移动端及免费、Go、企业等版本的推送计划将在未来几周内陆续跟进，具体功能因地区而异。对开发者而言，GPT-5.5 Instant 已通过 API 以“chat-latest”名称提供。

值得一提的是，OpenAI 创始人奥特曼在 Stripe Sessions 的一场对谈中透露，他在筹备 GPT-5.5 上线派对时，曾询问模型希望举办什么样的派对。模型认真给出了一份清单：希望派对定在美国当地时间 5 月 5 日，演讲环节越短越好，要有人类创造者上台致祝酒词，但自己不想上台祝酒。它还提议现场设一个专门收集 GPT-5.6 建议的环节，并将这些建议反馈给自己。奥特曼认为这些要求“很美好”，最终将派对时间定在下午 5 点 55 分，地点选在 OpenAI 旧金山总部，非本地嘉宾的机票和酒店由 OpenAI 负责。受邀名单由 Codex 从推文回复中筛选，报名链接于 4 月 30 日下午 5 点 55 分关闭，24 小时内有超过 8000 人报名，已有用户晒出了收到的邀请邮件。未被选上的人也收到了一封邮件，OpenAI 将他们的 Codex 调用额度提升了 10 倍。

更多>同类内容