AI“元素周期表”:让机器学习更高效更环保!

打造AI“元素周期表”:让机器学习更高效更环保!


人工智能如今已能自如处理文本、图像、音频和视频等多种信息,但开发人员面临一个棘手难题:如何为特定任务选择最优算法?在快速发展的多模式AI领域,这种选择往往复杂耗时,如同大海捞针。

埃默里大学的物理学家们给出了一个解决方案。他们创建了一个统一的数学框架,揭示出许多成功AI方法都遵循同一个核心原理——压缩多种数据,同时保留最具预测价值的内容。这项研究成果已发表在《机器学习研究杂志》(The Journal of Machine Learning Research)上。

“我们发现,当今最成功的人工智能方法都可以归结为一个简单想法,”研究资深作者、物理学教授伊利亚·内曼曼解释道,“这给了我们一张AI方法的‘元素周期表’。不同方法根据其损失函数保留或丢弃的信息,被归类到不同单元格中。”损失函数是衡量AI模型预测准确度的数学工具,模型通过不断自我调整来降低误差。

研究团队开发的“变分多模态信息瓶颈框架”,就像一个可调节的“控制旋钮”,帮助研究者决定哪些信息该保留、哪些可以舍弃。论文第一作者、物理学博士埃斯拉姆·阿卜杜勒利姆表示:“我们的目标是帮助人们设计适合特定问题的AI模型,同时清晰理解模型的每个部分如何工作、为何工作。”

这个框架不仅能帮助开发新算法,还能预测算法成功率、估算所需训练数据量,甚至预判可能出错的环节。内曼曼强调:“更重要的是,它可能引导我们设计出更准确、高效、值得信赖的新AI方法。”

研究过程充满物理学家特有的探索精神。团队成员从手算方程起步,在白板上反复推演,经历了无数次试错。当他们在两个测试数据集上验证模型时,系统自动发现了数据间共享的重要特征——这一刻让所有人为之振奋。

由于框架能帮助消除不必要的功能,AI系统的计算需求也随之降低。“所需数据越少,计算需求就越小,对环境影响也越小,”内曼曼说,“这甚至可能为解决目前因数据不足而无法攻克的科学难题打开大门。”

目前,团队正将这一框架应用于生物学领域,试图识别与认知功能相关的模式。阿卜杜勒利姆充满期待:“我想了解大脑如何同时压缩和处理多个信息来源。也许我们能找到机器学习模型与人类大脑之间的相似之处。”
#







分类