【新智元导读】OpenAI的封闭模型在IOI 2025竞赛夺金的同时,英伟达团队交出了一份同样令人振奋的答卷——他们利用完全开源的大模型和全新的GenCluster策略,在IOI 2025竞赛中跑出了媲美金牌选手的成绩!开源模型首次达到了IOI金牌水准。这究竟是怎样实现的?
IOI(国际信息学奥林匹克)是全球中学生算法编程竞赛的最高殿堂,每年只有不到10%选手能拿到金牌。
比赛要求选手在两天内各5小时独立解决3道高难度算法题,全程断网、不能借助外部资料,每题最多允许50次提交尝试。
要拿金牌,既要有过硬的算法思维,又得策略得当、在有限提交内调优代码。
如此严苛的赛制也成为AI编程能力的试金石。
去年OpenAI曾用专门微调的o1-ioi模型搭配复杂的推理策略参赛,但只拿到213分(排名约49%,未达到铜牌线)。
而今年OpenAI改用通用大模型组合,通过海量生成+自我验证的方法一举达成533.29分,排名逼近人类前五、稳拿金牌。
这一飞跃展示了大规模测试时计算 (TTC,test-time compute,指在模型训练完成之后,实际用来做推理/生成/回答时所使用的计算资源)的威力,也意味着AI已逼近顶尖人类水平。
然而,这些惊人成绩大多来自封闭模型,而且具体技巧往往秘而不宣。
相比之下,开源模型虽在Codeforces等公开榜单上进步明显,但总体上仍落后于私有模型的表现。