麻省理工学院研究人员推出ML算法周期表
麻省理工学院研究人员与谷歌和微软合作,推出了一个突破性的“机器学习(ML)周期表”。该框架名为I-CON(信息对比学习),揭示了20多种经典算法之间的联系,提供了一个统一的数学结构,重新定义了人工智能模型的分析、改进和开发方式。

I-CON提供了一种系统化的方法来整合不同机器学习方法的元素,使科学家能够增强现有的人工智能系统或设计全新的系统。通过利用其系统方法,研究人员可以推动机器学习的创新和效率。
机器学习包括各种强大的算法,但它们通常是碎片化的,因此很难识别连接并优化其性能。研究人员声称,使用I-CON,他们可以合并来自不同算法的组件,以创建更有效的模型。
在一个实例中,他们结合了两种单独的机器学习算法的元素,开发了一种新的图像分类方法,与最先进的现有模型相比,准确率提高了8%。代表着该领域的重大进步。
I-CON的核心表明,尽管存在差异,但许多机器学习算法都朝着识别数据点之间的模式和关系这一目标努力。这种观点使研究人员能够将这些技术视为统一数学框架的变体,而不是单独的方法。
I-CON根据ML方法与数据的关系系统地排列了ML方法。这类似于门捷列夫元素周期表中元素的化学性质。
就像元素周期表中包含未被发现元素的空白框一样,I-CON为理论上应该存在的新算法提供了空白空间。这为研究人员提供了一个结构化的指南,用于探索尚未发现或正式化的机器学习技术。
通过将算法系统地分组到相关的族中,I-CON有助于揭示分类、聚类和降维等方法之间的联系。通过其可视化映射,研究人员可以识别隐藏的模式,探索新的算法组合,并更清楚地了解复杂的机器学习环境。

研究人员在arXiv上发表的论文中写道:“我们将我们的方法与几种最先进的聚类方法进行了比较,包括TEMI、SCAN、IIC和对比聚类。”“这些方法依赖于增广和学习表示,但通常需要额外的正则化项或损失调整,例如控制聚类大小或减少亲和损失的权重。”
“相比之下,我们基于I-CON的损耗函数是自平衡的,不需要这种手动调谐,使其成为一种更清晰、更具理论基础的方法。这使我们能够在三个不同大小的主干之间实现更高的精度和更稳定的收敛。”
研究人员强调,I-CON不仅有助于ML分类。它为从事不同类型问题的人工智能研究人员提供了一个强大的工具。其清晰的结构有助于科学家以逻辑的方式探索新的算法思想,从而更容易避免重复过去的错误,同时找到新的更好的解决方案。
有趣的是,研究人员一开始并不打算为机器学习创建元素周期表。在研究聚类时,麻省理工学院研究生Shaden Alshamari注意到了与另一种机器学习技术对比学习的相似之处。随着她进一步探索,她意识到这两种算法都可以用相同的数学方程来解释。一旦Shaden发现了这一点,团队的其他成员也加入进来,测试框架的统一能力。
Shaden补充道:“这不仅仅是一个隐喻。我们开始将机器学习视为一个具有结构的系统,这是一个可以探索的空间,而不仅仅是猜测的方式。”
这项研究部分由美国空军人工智能加速器、国家科学基金会人工智能与基础交互研究所和Quanta计算机资助。

正如元素周期表通过预测未被发现的元素来改变化学一样,I-CON也有可能重塑机器学习。通过提供一种更有组织的算法开发方法,研究人员可以更精确地进行创新,而不是仅仅依靠试错或偶然发现。在人工智能世界之外,I-CON提醒我们,映射关系可能是揭示隐藏模式的关键,并为科学发现提供了一种令人耳目一新的方法。