DeepSeek创始人梁文峰说:“我们经常说中国AI和美国有一两年差距,但真实的

罗普娱记 2025-10-15 11:32:15

DeepSeek创始人梁文峰说:“我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。” 梁文峰自己就是做AI研究的,他说的原创,指的是从最基础的技术开始自己研发,比如AI的核心芯片、底层算法框架这些能定规矩的东西;而模仿就是拿别人已经做好的技术,稍微改改就拿去做应用,比如在别人的芯片上跑程序,用别人的框架做个小功能。 现在中国AI专利数量看着很吓人,有38万多件,占了全球70%,是美国的6倍,生成式AI专利每年还以50%的速度增长,腾讯、百度这些公司都排在专利申请人前十里。 但这些专利大多集中在应用层面,真正核心的技术还是在美国手里。美国虽然专利数量只有6万多件,但AI芯片几乎被他们垄断,英伟达一家就占了中国AI芯片市场83.2%的份额,从之前的A800、H800到后来的L40S推理芯片,都是他们说了算。 底层算法框架也一样,PyTorch这种开源框架说限制中国访问训练模块就限制,GitHub的代码库还搞地域封锁,Apache软件基金会甚至不让华为参与顶级项目,这就是因为我们自己没做出能替代的原创框架。 模仿带来的问题已经越来越明显了。美国搞“小院高墙”战略,把生成式AI、脑机接口这些前沿技术都纳入管控,还通过法律逼台积电、三星这些企业不给中国做先进芯片。 阿斯麦的DUV光刻机2025年对华交付量大幅下降,导致我们的芯片产能上不去,AI硬件供应就卡了脖子。关键材料也被管制,中国企业要么买不到,要么得花高价,生产成本一下就上去了。 更麻烦的是人才交流也受影响,美国国家科学基金会收紧了中美联合AI研究的资助,科研人员没法一起搞研究,新想法自然就少了。这些都说明,靠模仿的话,别人一旦卡脖子,我们的AI产业就动不了。 而且模仿只能跟着别人的节奏走,永远做不了主导。美国做AI是建生态,英伟达花15年攒出CUDA生态,有400万开发者、5.6万开源项目,就算别的芯片性能跟上了,也兼容不了主流模型。 亚马逊一边造Trainium芯片,一边搭Bedrock平台,再用5亿台Echo设备当入口,从云服务到购物形成闭环。 中国的百模大战看着热闹,备案的大模型有302个,但大多是在Transformer架构上做优化,阿里的模型数学推理拿满分,DeepSeek的模型把API成本砍了一半,这些进步都不错,可终究是在别人画的圈子里做事。 原创的重要性在DeepSeek自己的实践里体现得很清楚。他们没像其他公司那样沿用Llama结构做应用,而是直接研究新的模型结构,因为要做通用人工智能就得打基础。 之前发布的R1模型,用1/20的成本就训出了能比肩GPT-4o的开源模型,还把对人工标注数据的依赖降了90%,别人用100万条数据,他们10万条无标注数据就搞定,成本一下降了很多。这说明原创能打破别人的算力垄断,不用再受芯片供应的限制。 中科院的“吉儿”机器人也是个例子,把AI和生物科技结合起来搞智能育种,让大豆杂交授粉成本从一亩3000块降到1000块以下,效率还提高5倍,这就是原创带来的新价值。 美国的技术封锁其实从侧面证明了原创的关键。他们不仅卡芯片,还在技术标准上设障碍,MLPerf的基准测试就让中国芯片厂商参与成本大增,本质上是想让我们永远用他们的标准。 全球产业链已经开始按技术分成两派,一边是掌握原创技术的,一边是靠模仿的,要是不做原创,我们就只能待在下游,赚点辛苦钱。 美国做核心芯片的公司卖一块能赚100块,中国用芯片做应用的可能只赚10块,还得看别人脸色,这就是差距。 梁文峰说DeepSeek做研究成本高,因为要做各种实验,需要更多算力,对人员要求也高,从最早1张卡到后来一万张卡,还得自建机房。 但这种投入是必须的,只做复刻的话,在公开论文基础上微调一下成本低,可永远突破不了。OpenAI早期投资人投钱也不是为了马上赚钱,就是想做基础研究,中国现在也需要这种态度。 过去互联网时代,我们靠应用做得好,但AI不一样,它是底层技术革命。梁文峰说我们习惯了搭便车,躺在家里等更好的硬件软件,可现在别人不让搭了。 3万多家中国智能工厂的研发数据、百度自动驾驶的载客数据、农业的育种数据,这些都是宝贵的资源,以前总用别人的模型跑数据,现在得用自己的数据训自己的模型,这才是原创的起点。 所以梁文峰说有些探索逃不掉,就是因为中国AI已经到了必须原创的阶段。美国已经在构建技术封锁联盟,从设备、材料到人才全面打击,如果还不做原创探索,只会越来越被动。 只有走到技术前沿去推动生态发展,才能从追随者变成开创者,这路虽然难,但必须走,不然永远只能跟在别人后面。

0 阅读:0

猜你喜欢

罗普娱记

罗普娱记

感谢大家的关注