这个好玩:Google举办了国际象棋的AI世界赛,选了8个最顶级的模型对弈,从8

简夕科技 2025-08-05 21:43:17

这个好玩:Google举办了国际象棋的AI世界赛,选了8个最顶级的模型对弈,从8强赛到半决赛再到总决赛,全程在YouTube直播,分组情况如图。 Google也解释了这次比赛的现实意义: 随着大部分旗舰模型在基准测试里的得分接近满分,基准测试本身的意义已经没有那么大了,而且保不齐是否存在数据污染的情况——模型在训练过程中已经记住了那些基准测试题目。 所以Google开发了Kaggle游戏竞技场,作为一个新的AI测试平台,这次的国际象棋只是开胃菜,以后还会引入更多的能够产生明确胜负结果的战略游戏,用来衡量在发布时分数永远都是第一名的各家模型到底谁吹牛逼的成分更多。 而且游戏本来就是AI早期训练的重要环境,OpenAI在发布ChatGPT之前就花了很多时间教模型去玩Dota 2,还参加过电竞比赛,而Google更进一步的认为游戏也有资格担当一个理想的能力测试平台,因为结果可衡量、过程可视化、推理可验证、以及零和博弈的特点,都可以呈现出新的基准价值,并让人类窥见AI的思考方式。 为了实现公平和透明,Kaggle游戏竞技场的系统全程开源,可被彻底检查,以后的游戏对局会把频次拉到海量级别,确保结果具有统计学上的正态性。

0 阅读:3
简夕科技

简夕科技

感谢大家的关注