字节模型拿下IMO银牌字节数学模型能复现全过程字节的数学推理模型SeedPro

量子位看科技 2025-07-23 11:42:47

字节模型拿下IMO银牌字节数学模型能复现全过程

字节的数学推理模型Seed Prover，杀进国际数学奥林匹克（IMO 2025），拿下了银牌。

赛后它还顺手把第1题补了，等于解完了6道题中的前5题。

其中第3题和第4题，模型各花了3天，写出几千行形式化代码，真的是一行一行“死磕”的那种。

背后靠的是引理（Lemma）链（引理是比定理更次要的结果）。

通俗讲，这就是把一道大题拆成几十个小结论，每个结论都能自动验证，像搭积木一样，一层一层往上垒，直到最终通关。

而且这不是靠堆算力硬解的，Seed Prover的“重量级模式”，能自己构造新猜想、反复试错、建出一个引理池，再用里面的关键引理反向喂给自己继续推理。

相比之下，尽管DeepMind在本届IMO中解出5题拿下金牌，OpenAI实验性模型也实现类似水平，但Seed Prover的优势是“可验证”——每一行代码都能形式化复现，不存在跳步。

目前它在多个公开数学测试上都吊打SOTA（最先进模型），Putnam赛题得分翻了5倍，MiniF2F测试基本满分，就连大学组合数学题也能搞定。

Seed Prover已开源部分题目的形式化代码：

- 第 1 题证明：

- 第 2 题证明：

- 第 3 题证明：

- 第 4 题证明：

- 第 5 题证明：

0 阅读：1

猜你喜欢

我推翻了数学大厦

我推翻了数学大厦

【1评论】【2点赞】

数学福建北京

这就是学霸做题的感觉吗现在的我，强的可怕

这就是学霸做题的感觉吗现在的我，强的可怕

【2点赞】

学霸英语

我上学的时候怎么没有这样的数学题？

我上学的时候怎么没有这样的数学题？

【2评论】【2点赞】

数学

数学，能抄的都是高手，不要说什么学渣[赞]

数学，能抄的都是高手，不要说什么学渣[赞]

数学学霸

初三儿子遇到一道数学竞赛题，把985毕业的宝妈难住了！在长方形ABCD里，E点在

初三儿子遇到一道数学竞赛题，把985毕业的宝妈难住了！在长方形ABCD里，E点在

【3评论】【1点赞】

数学

烦死了，都进厂了还要做题！

烦死了，都进厂了还要做题！

【16评论】【8点赞】

广州一女教授在985任教3年，每次课上都没几个人听，最终因考核不过惨遭辞退。万万

广州一女教授在985任教3年，每次课上都没几个人听，最终因考核不过惨遭辞退。万万

【1评论】【2点赞】

数学广州市中山大学北大大学

最有机会获得顶级数学大奖菲尔兹奖的3大中国数学家：1、王虹：三维挂骨猜想一旦被

最有机会获得顶级数学大奖菲尔兹奖的3大中国数学家：1、王虹：三维挂骨猜想一旦被

【65评论】【30点赞】

菲尔兹奖数学

量子位看科技

感谢大家的关注

作者最新文章

1

中科院阿里手术刀式去噪预训练数据细化新范式在噪声污染严重影响预训练数据的质量时，

2

OpenAI抢发IMO金牌引争议IMO怒斥OpenAI自封夺金OpenAI声称新

3

一文介绍八种主流开源模型架构开源模型架构设计一览从GPT到MoE，知名科技博主S

4

刘强东连投3家具身智能京东美团战火烧到科技领域王兴之后，刘强东也在具身智能领域发

5

美团提出多模态推理新范式RL与SFT结合提升大模型推理能力多模态推理，也可以讲究

6

机器人像人一样做决策机器人自主思考决策框架浙大与vivo团队推出了机器人自主决策

7

独立思考提示词第一性原理提示词分享一个用第一性原理，训练自己独立思考的提示词。提

8

Qwen成绩高是提前看过题Qwen2.5数据污染数学能力，全靠记忆？一篇来自复旦

9

Meta超级智能实验室44人名单超级智能实验室近一半成员为华人传疯了！Meta超

10

AI智能体三大关键AI智能体三大隐患过去一年，工程师Utkarsh Kanwat

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

2025下半年新机打架谁是你的菜？

2

论手感的话，个人感觉还得是钛金属，大家觉得呢？[思考]

3

25年公认最强拍照手机，有你在用的吗。

4

华为这手机价格，让我选择不会了。想买个p80pro的本来，可是看到p7

5

荣耀再一次掀桌子，大家都别玩了荣耀X70只要1399顶配版是12G+512G

6

用过荣耀Magic7Pro的人才会懂，6.8英寸OLED等深微曲屏，月影灰配色

7

余总亲自官宣pura80标准版售价，12+256版本4699元，12+512版

8

中美芯片大战，日本人突然发现了一个重大的秘密！美国靠着尖端芯片死磕中国，而中国呢

9

苹果17Pro这么强，现在买16Pro是不是傻...iPhone17Pr

10

老外的续航测试，一加13s获得第一

科技最新文章

1

用过荣耀Magic7Pro的人才会懂，6.8英寸OLED等深微曲屏，月影灰配色

2

很多人选择等华为Mate80系列，并不是什么配置升级，单纯就是受不了Mate

3

余总亲自官宣pura80标准版售价，12+256版本4699元，12+512版

4

余承东还宣布7月31日开启HarmonyOS5.1升级机型有：Ma

5

美团王兴一夜一夜的难眠！他怎么也没想到，刘强东的京东居然不是跑外卖的，这

6

被很多网友吹上天的荣耀X70，12G+512G的版本已经上手几天，说一些心里话，

7

荣耀X70这是提前预定了下一个1000万台销量吗？已经连续三天了，位居全品牌、全

8

黄仁勋估计做梦都要笑醒了，以为H20芯片在中国市场要大赚特赚，结果国安部

9

华为WatchGT6系列入网，预计秋季发布，支持星闪，有大升级！[努力

10

下次换新手机我还是买苹果。不买华为了……为啥呢？两者手机平板都买了。