2026年4月,OpenAI正式发布了新一代旗舰模型GPT-5.5,距离上一版GPT-5.4仅过去了7周。这并非一次常规的迭代升级,而是自GPT-4.5时代以来,OpenAI首次将彻底推倒重训的全新基座推向台前。

从零重训:全新基座的突破
GPT-5.5抛弃了渐进式微调路线,选择了”从零重训”方案。在代码能力方面,GPT-5.5在Expert-SWE指标上达到73.1%——这意味着在面对需要横跨数百个文件的企业级项目时,AI已具备近四分之三的自主完工率。在长上下文处理上,512K至1M的极限区间准确率达到74.0%,而GPT-5.4仅为36.6%。

Verifier循环:自我修正的革命
GPT-5.5最引人注目的创新当属Verifier循环机制。它能够根据报错信息反向定位问题,自动重写代码片段,实现真正的自我纠错。在OSWorld基准测试中,GPT-5.5斩获75.0%,首次超越了人类专家的72.4%。
幻觉率大幅降低
内部评估显示,在医学、法律和金融等领域,GPT-5.5 Instant的幻觉率比上一代减少了52.5%,回答字数减少了30.2%,更加简洁精准。这标志着AI从”可玩的玩具”向”可用的生产力工具”迈出了关键一步。