- +1
AI盯上奥数!谷歌DeepMind:能以人类金牌水平解决几何题
·从2000年至2022年奥数比赛中抽取的30道几何题中,AlphaGeometry解决了25道。从历史上看,在相同时间内,人类金牌得主平均解决了25.9道。
·“解决奥数级别的几何问题是发展深度数学推理、迈向更先进和通用人工智能系统的一个重要里程碑。”
AlphaGeometry团队成员:(左起)Yuhuai Wu、Trieu H. Trinh、Quoc V. Le和Thang Luong。
当地时间1月17日,人工智能开发机构谷歌DeepMind推出了名为AlphaGeometry(阿尔法几何)的AI系统,称该系统可以以国际数学奥林匹克竞赛金牌得主的平均水平解决几何问题。
有关该研究的论文表示,这“代表了人类水平自动化推理的一个显著里程碑”。科学家认为,证明数学定理的方法有一天可能会在通用人工智能系统中发挥作用。
此外,AlphaGeometry是一个“神经符号”系统。它将“擅长直觉”的神经网络语言模型(如ChatGPT)与“擅长推理”的符号引擎(如逻辑计算器)结合,可能会再次引发长期以来的争论,即人工智能系统应建立在符号操作基础上还是看起来更像人脑的神经网络上。
为什么要关注几何?
有关这一研究的论文17日发表在《自然》杂志上。AlphaGeometry的代码也在当天开源。
根据谷歌DeepMind人工智能科学家Trieu Trinh的展示,从2000年至2022年奥数比赛中抽取的30道几何题中,AlphaGeometry解决了25道题。从历史上看,在相同时间内,人类金牌得主平均解决了25.9道题。Trinh还将问题交给了20世纪70年代开发的一个系统,该系统被认为是最强的几何定理证明器:只解决了10道题。
AlphaGeometry最复杂的合成证明的长度令人印象深刻,为247个步骤。最简单的证明只有一步。
加州大学洛杉矶分校数学家陶哲轩 (Terence Tao)是有史以来最年轻的奥数金牌获得者,获奖时只有12岁。他认为AlphaGeometry是“出色的工作”,并且取得了“令人惊讶的强劲结果”。
Trinh与另一位谷歌DeepMind的人工智能科学家Thang Luong在一篇博客文章中写道:“解决奥数级别的几何问题是发展深度数学推理、迈向更先进和通用人工智能系统的一个重要里程碑。”“(我们)希望……AlphaGeometry有助于在数学、科学和人工智能领域开辟新的可能性。”
为什么要关注几何?谷歌DeepMind表示,证明数学定理,或者从逻辑上解释为什么一个定理(例如毕达哥拉斯定理)是正确的,需要推理和从一系列可能的解决方案中进行选择的能力。这种解决问题的方法有一天可能会在通用人工智能系统中发挥作用。
“证明某个特定猜想的真假,可以扩展即使是当今最先进人工智能系统的能力。”谷歌DeepMind在新闻稿中写道 。
Trinh表示,他将尝试将该系统推广到数学领域及其他领域,考虑所有类型推理的“共同的基本原则”。
不过,人工智能研究机构xAI的联合创始人、曾在谷歌工作的克里斯蒂安·塞格迪(Christian Szegedy)对《纽约时报》表示,“这是一个非常有趣的概念证明”,但它“留下了很多悬而未决的问题”,并且“不容易推广到其他领域和其他数学领域”。
陶哲轩认为,微调人工智能系统来解决奥数问题可能不会提高其深度研究的技能,但在这种情况下,旅程可能比目的地更有价值。
神经网络与符号系统的结合
训练人工智能系统来解决几何问题面临着独特的挑战。由于将证明转换为机器可以理解的格式十分复杂,因此缺乏可用的几何训练数据。当今许多尖端的生成式人工智能模型虽然在识别数据模式和关系方面表现出色,但缺乏通过定理进行逻辑推理的能力。
谷歌DeepMind的解决方法有两重。在设计AlphaGeometry时,实验室将“神经语言”模型(在架构上类似于ChatGPT)与“符号演绎引擎”配对,该引擎利用规则(如数学规则)来推断问题的解决方案。符号引擎可能不灵活且缓慢,尤其是在处理大型或复杂的数据集时。但谷歌DeepMind通过让神经模型“引导”推演引擎找到给定几何问题的可能答案,从而缓解了这些问题。
谷歌DeepMind还创建了自己的合成数据来代替训练数据,生成1亿个“合成定理”和不同复杂性的证明。然后,实验室利用合成数据从头开始训练AlphaGeometry,并针对奥数几何问题对其进行评估。奥数几何问题基于需要添加“结构”才能解决的图表,例如点、线或圆。应用于这些问题时,AlphaGeometry的神经模型会预测哪些结构可能对添加有用,AlphaGeometry的符号引擎使用这些预测来对图表进行推论,以识别类似的解决方案。
AlphaGeometry生成的一些合成证明数据的视觉表示。
“有了这么多关于这些构造如何产生证明的例子,AlphaGeometry的语言模型能够在遇到奥数几何问题时为新构造提出很好的建议。”Trinh和 Luong写道,“一个系统提供快速、‘直观’的想法,而另一个系统则提供更加深思熟虑、理性的决策。”
更通俗点解释,一旦AlphaGeometry遇到一个问题,符号引擎就开始尝试解决;如果遇到困难,神经网络会提出增强证明论证的方法,继续循环直到解决方案实现或时间耗尽。用数学术语来说,这种增强过程被称为“辅助构造”,添加一条线、平分一个角、画一个圆——这就是数学家修补问题并寻找答案的方式。在这个系统中,神经网络学会了以类似人类的方式进行辅助构建。Trinh将其比作将橡皮筋缠绕在难打开的罐子盖上,以帮助手更好地抓握。
这项研究可能会再次引发神经网络和符号系统孰优孰劣的争论。符号系统通过定义专用于特定工作的符号操作规则集(例如在文字处理软件中编辑一行字)来解决任务,而神经网络则尝试通过统计近似值和从示例中学习来解决任务。
神经网络的支持者认为,智能行为(从语音识别到图像生成)只能从大量数据和计算中产生。神经网络是OpenAI的DALL·E 3和GPT-4等强大人工智能系统的基石。
但是,符号人工智能的支持者称,神经网络并不是最终解决方案。符号人工智能可能更适合有效地编码世界知识,通过复杂的场景进行推理,并“解释”如何得出答案。
作为类似于DeepMind开发的AlphaFold 2和AlphaGo的混合符号神经网络系统,AlphaGeometry或许证明了符号操作和神经网络这两种方法的结合是寻找通用人工智能的最佳路径。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司