换数据顺序模型更聪明微软教大模型按顺序学
模型训练重点在于数据的数量与质量?其实还有一个关键因素——
数据的出场顺序。
对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
该方法用优化训练数据的组织方式来让语言模型学得更好,还不用增加数据量或扩大模型规模。
换数据顺序模型更聪明微软教大模型按顺序学
模型训练重点在于数据的数量与质量?其实还有一个关键因素——
数据的出场顺序。
对此,微软亚洲研究院提出了一种全新的文本数据组织范式DELT(Data Efficacy in LM Training),通过引入数据排序策略,充分挖掘训练数据潜力,在不同模型尺寸与规模下都达到了良好性能。
该方法用优化训练数据的组织方式来让语言模型学得更好,还不用增加数据量或扩大模型规模。
猜你喜欢
【24评论】【17点赞】
【3评论】【2点赞】
【283评论】【71点赞】
【2评论】【1点赞】
作者最新文章
热门分类
科技TOP
科技最新文章