蔚来也做了有问必答,关于 NWM,虽然只有三个问题,但是值得了解一下。
1.蔚来的世界模型和端到端架构的区别是什么?
相比于写规则,端到端架构进步多了,依托海量数据的训练,它覆盖的场景和性能都强了不少。
但想要真正「像人一样」,只靠端到端还不够,因为人的大脑一个很重要的能力:时空认知能力,可以拆分成时间、空间认识能力,能够判断三维空间+时间里的各种可能性。
所以蔚来的世界模型,相比传统端到端,在三个方面进行了加强:
-空间理解能力更强:可以更加泛化地抽取信息;
-时间理解更准:可以自建模长时序环境;
-数据使用更省力:可以通过自监督来学习,减少了很多人力。
2.蔚来世界模型是否还需要群体智能?
结论是:需要,其本质是模型对数据有庞大的需求。
「Banyan 榕」系统中有一颗Orin X 芯片专用于群体智能,主要是在新版本开发后先到分发到部分车上去验证、对比,这样可以精准找到新版本的不足,针对性地修改,这样进化速度就快多了。
现在数据需求规模更大,群体智能变得不可或缺,神玑 NX9031中也专门留了这部分功能。
数据需求更大使得数据不够用怎么办?蔚来还有「生成式仿真」,可以利用真实世界的数据、信息来重建一个虚拟世界,模型可以在虚拟世界里进行训练。
3.为什么蔚来世界模型在复杂场景中表现出色?
回到第一个回答中,蔚来的世界模型有着很强的时空认知能力,擅长空间想象和时间推演,而复杂场景恰是最考验这方面能力的。
很好的一个科普。
蔚来世界模型nwm