[RO]《DataRetrievalwithImportanceWeig

爱生活爱珂珂 2025-09-07 06:35:06

[RO]《Data Retrieval with Importance Weights for Few-Shot Imitation Learning》A Xie, R Chand, D Sadigh, J Hejna [Stanford University] (2025)

重要权重引导的数据检索革新少样本模仿学习，显著提升机器人任务迁移性能。

• 现有检索方法基于目标示范数据的最近邻L2距离进行样本选择，等价于高方差的高斯核密度估计（KDE）极限，忽视了先验数据分布，导致采样偏差和噪声敏感。

• 提出Importance Weighted Retrieval (IWR)，利用双核密度估计分别拟合目标和先验数据分布，通过计算两者的概率密度比（重要性权重）来加权检索，平滑估计并校正偏差。

• IWR兼容多种潜在空间表示（如VAE编码的状态-动作对），仅需替换原有最近邻检索步骤，计算开销极低。

• 在模拟环境（Robomimic Square、LIBERO）及真实机器人Bridge任务上，IWR相较传统方法平均成功率提升5.8%至30%，尤其长时序任务表现更优。

• 实验显示IWR能避免检索无关或有害样本，平衡时序分布，提升数据多样性和相关性，缓解任务初期样本偏移问题。

• 通过重要性权重归一化，IWR显著降低了估计方差，带来更稳定的策略训练效果。

• 目前IWR对潜在空间的平滑性有依赖，对非平滑编码（如BYOL）效果有限，且高维KDE计算复杂，未来可探索更高效的密度比估计方法。

心得：

1. 从概率视角出发，检索不仅是最近邻搜索，而是目标与先验分布密度比的估计，精准把握数据“相关性”本质。

2. 利用全局核密度估计代替局部极值，显著降低噪声带来的高方差，体现数据选择中平滑性的重要性。

3. 结合先验分布调整采样权重，实际任务中能有效减少无关样本干扰，提升少样本模仿学习的泛化能力。

论文🔗arxiv.org/abs/2509.01657

详见🔗 rahulschand.github.io/iwr/

机器人学习少样本学习模仿学习重要性采样核密度估计数据检索

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

晚安～ [月亮] 晚安

2

《爱可可微博热门分享(9.7)》

3

BlazingMQ：Bloomberg 8 年实战验证的高性能开源分布式消息队列

4

如何从零开始构建高效 AI Agent？这份10步路线图覆盖从设计角色到性能评估

5

Autoencoder 的理解远不止于“编码-解码”架构图，掌握其背后的几何与表

6

(免费)线性代数核心教材《Linear Algebra》Jim Hefferon

7

Node-RED：面向事件驱动应用的低代码编程平台，极大降低复杂系统开发门槛。•

8

[人人能懂] 超越规模竞赛的五种智慧策略（扫码收听）

9

[RO]《Manipulation as in Simulation: Enab

10

[LG]《GradES: Significantly Faster Traini

热门分类

科技TOP

1

光刻机禁售，我忍了。芯片技术封锁，我也忍了。但全国首台国产电子束光刻机在杭州

2

太tm解气了，当华为pura80ultra更新后，麒麟9020出现的那一刻，心

3

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

4

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

5

华为的前三号员工1.任正非（工号001）华为创始人，1987年集资2.1万

6

追觅官宣造车追觅：要造最快的车！这么卷的汽车市场还有选手入场，给追觅点赞[爱你

7

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

8

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

9

实锤了！中国不买美国芯片，H20就暂停生产了，现在黄仁勋更加睡不着觉了，由于这次

10

买手机不要着急，买新不买旧。9月10月份将有大量新机发布，配置提升，续航也提升

科技最新文章

1

能够和小米16相抗衡的国产旗舰，估计也就只有华为Mate80了。小米16已

2

即将上市的四大机器，这里面我还是会选择oppo，因为已经习惯了ColorOS系统

3

马斯克全球封杀李雪晨！这李雪晨本来只是马斯克底下子公司的骨干开发人员，这下出

4

看博主新评科技拆解荣耀X70，有个细节挺直观——电池能量密度做到了748Wh/L

5

每台4亿美元，重达180吨，全球最先进的光刻机终于揭开神秘面纱！在荷兰费尔德

6

目前已知的信息：全新外观设计ProMax电池容量超过5000mAh全系A19全

7

断供16nm！中芯连夜改机良率飙到91%？光刻机被卡脖子，工程师把198

8

荷兰开始慌了ASML总裁的一句话，撕开了全球科技竞争的遮羞布：“不怕中国从

9

OPPOA6Pro确实解决了一个最重要的痛点问题，就是这种A系列的平民机型，

10

这下总算是放心了，荣耀也算是看明白了，Magic8Pro的居中模组设计不会变，