• 3
  • +1

破解微分方程世纪难题:机器学习如何突破传统数值方法瓶颈

2025-03-21 16:42
江苏
来源:澎湃新闻·澎湃号·湃客
字号

原创 编辑社论 集智俱乐部

导语

机器学习是求解偏微分方程的一种有前途的方法,也是当前一个十分活跃的研究领域。然而,现有研究真能很好地证明机器学习在求解偏微分方程问题上的良好性能吗?《自然·机器智能》杂志采访了多位该领域的著名专家学者,他们各自发表了自己的观点。

研究领域:偏微分方程、机器学习、数值方法、基准数据集、评估框架

编辑社论 | 作者

徐子龙

| 译者

宋鹏举

| 审校

论文题目:寻找偏微分方程问题的机器学习解决方案

论文地址:https://www.nature.com/articles/s42256-025-00989-w

在科学与工程领域中,偏微分方程(Partial differential equations,PDEs)被广泛用于描述从流体力学到量子力学等复杂系统的行为。这些方程构成了理解和模拟自然现象的基础框架。然而,传统的数值方法求解这些方程往往需要巨大的计算资源和时间。近年来,机器学习模型作为一种新兴工具,显示出了求解偏微分方程的巨大潜力,为科学家和工程师提供了新的视角和可能性。

尽管如此,通过与多位领域内专家的交流发现,关于机器学习模型在实际应用中的优势以及如何准确评估其性能,仍存在诸多疑问。专家们指出,虽然机器学习在某些情况下展示了显著的速度提升,但其泛化能力、稳定性和对不同问题类型的适应性还需要进一步研究。因此,明确机器学习模型在解决偏微分方程方面的具体应用场景及其局限性,对于推动这一领域的健康发展至关重要。

当前核心任务

偏微分方程能够对时空物理系统的行为进行建模,用简洁的符号形式来描述自然物理学定律。对于复杂问题,这些方程通常难以求得解析解,通常需要采用计算密集型的数值近似方法来求解。然而,近年来机器学习(Machine learning, ML)方法的发展带来了新的数据驱动解决方案,为解决偏微分方程提供了全新的视角。这种新方法在流体动力学、热传递和波传播等工程领域展现出了变革性的应用潜力 [1]。

尽管机器学习在求解偏微分方程方面已迅速成为一个高度活跃的研究领域,但在学术研究之外的实际应用仍面临诸多挑战。目前,该领域的核心任务之一是达成关于合适基准数据集和评价指标的共识。具体而言,虽然机器学习模型在某些特定应用场景中展示了显著的速度和效率优势,但其泛化能力、稳定性和适应性仍需进一步验证。此外,如何准确评估这些模型的性能,确保它们在实际工程问题中的可靠性和有效性,也是亟待解决的问题。

图1 偏微分方程可以用于描述流体动力学

最新进展

作为近期研究领域的重大成果,在2024年度的神经信息处理系统大会(NeurIPS 2024)上,研究人员提出了一个名为“The Well”的大规模数据集 [2]。该数据集包含了从声波到活性物质和天体物理现象等不同尺度时空物理系统的数值模拟。这一资源旨在为科学和工程领域中的偏微分方程机器学习求解器提供更复杂、更具挑战性的基准问题。

哈佛大学教授 Petros Koumoutsakos 对此评价道:“这项工作是‘走在正确方向上的一步’,它提供了一个方便且丰富的模拟数据存储库。” 他强调了该数据集在推动机器学习方法应用于实际物理系统中的重要性。通过整合多种类型的模拟数据,“The Well”不仅为研究人员提供了测试和验证其模型的新平台,还促进了跨学科的合作与知识共享。Koumoutsakos 教授的研究兴趣十分广泛,主要研究方向是计算和人工智能在理解、预测和优化工程、纳米技术和医学中的流体流动方面的基础和应用,还涉及数据科学、活性物质、仿生机器人以及能源、环境和可持续性等多个领域。

总而言之,“The Well”似乎是为满足当前对更复杂、更具挑战性的基准问题的需求而做出的严肃尝试,这些问题可用于测试科学和工程领域中偏微分方程的机器学习求解器。

图2 Petros Koumoutsakos,哈佛大学工程与应用科学学院教授,慕尼黑工业大学的特聘兼职教授,美国国家工程院(NAE)外籍院士。曾获欧洲研究理事会高级研究员奖和 ACM 超级计算戈登-贝尔超级计算奖。,曾在加州理工学院并行计算中心、斯坦福大学湍流研究中心和美国国家航空航天局艾姆斯分局从事博士后研究,还曾在加州理工学院、东京大学、麻省理工学院、哈佛大学拉德克利夫高等研究院担任客座研究员。

当前存在的问题及解决思路

此前,时任普林斯顿大学研究人员的 Nick McGreivy 和普林斯顿等离子物理学实验室的首席研究物理学家 Ammar Hakim 在该杂志发表了一篇分析文章 [3]。通过调研82篇相关文献,他们探讨了流体动力学中基于机器学习的偏微分方程求解器的研究进展。在这篇文章中,作者提出了两个令人担忧的问题。

首先,他们发现与标准数值方法的比较往往不公平。具体来说,这种不公平性体现在两个方面:一是所使用的基线方法并非针对特定问题的最先进方法;二是将较低精确度的机器学习模型的运行时间与更精确但运行时间较长的标准数值方法进行对比。这样的比较方式可能导致对机器学习模型性能的误解。

其次,作者还发现了存在系统性少报道消极结果的现象。许多研究倾向于强调积极成果,而忽视或淡化负面结果和局限性。这种做法可能会导致对该领域实际进展的过度乐观估计。

总体而言,McGreivy 和 Hakim 的结论指出,目前对于机器学习模型在求解流体相关的偏微分方程问题上的能力存在过度乐观的看法。他们的研究揭示了现有研究中的潜在偏差,并呼吁更加严谨和透明的评估方法。

McGreivy 教授目前的研究方向涵盖机器学习、科学计算、等离子体物理、核聚变能和核政策等领域。他在普林斯顿大学时主要研究机器学习和自动微分在核聚变能和等离子体物理问题中的应用。

图3 Nick McGreivy,普林斯顿大学教授 ,毕业于宾夕法尼亚大学,获得物理学学士学位和计算机科学辅修学位。

Johannes Brandstetter 是约翰·开普勒林茨大学(Johannes Kepler University Linz)的助理教授,同时也是林茨新成立的人工智能研究机构 NXAI 的首席研究员。他在欧洲核子研究中心学习期间主要研究高能物理学。当他在“基于边界图神经网络三维模拟”(Boundary graph neural networks for 3D simulations)研究课题中工作时,第一次接触到基于深度学习的模拟。后来他在阿姆斯特丹机器学习实验室工作的几年里,完全转向了偏微分方程的神经网络建模的研究,目前主要研究方向为机器学习、几何深度学习、偏微分方程等。

在本期的《新闻与观点》(News & Views)文章中,Brandstetter对分析报告中提出的问题进行了评论,并提出了两个基础性问题。

首先,为什么对于领域而言,让机器学习模型和数值方法之间做公平比较是如此有挑战性的?Brandstetter 指出,这种困难源于多种因素,包括不同应用场景下用户对速度、准确性、不确定性量化、泛化能力和实际实现的不同需求。具体来说,不同的应用可能对这些指标有不同的优先级,而现有的基准测试往往未能全面涵盖所有这些需求,导致目前的性能比较是不够公平和全面的。

其次,另一个关键问题:机器学习模型是否真正具备优势?尽管机器学习在某些特定任务中展示了显著的速度提升,但其在其他方面的表现(如准确性、泛化能力等)仍需进一步验证。

Brandstetter 认为,为了推动该领域的发展,需要设计更加综合的基准挑战,以评估机器学习模型在解决偏微分方程中的实际性能。他建议借鉴蛋白质结构预测领域的“关键评估”(Critical Assessment of protein Structure Prediction, CASP)模式,创建类似的标准测试框架。这样的基准挑战应结合多种用户需求,如速度、准确性、不确定性的量化、泛化性和实际实现,从而提供更为全面和客观的评估标准。

图4 Johannes Brandstetter,约翰·开普勒林茨大学助理教授、林茨NXAI实验室首席研究员 Johannes Brandstetter,博士毕业于欧洲核子研究中心,曾任职于阿姆斯特丹机器学习实验室。

我们跟 Brandstetter 和 McGreivy 深入地讨论了他们关于该领域进展的观点。McGreivy 同意我们需要类似CASP的基准问题,他表示“在此之前,基于机器学习的流体相关偏微分方程求解器仍然是寻找问题的解决方案”。

他强调了一个有价值的基准问题的三个一般关键特性:

(1)应该是当前方法不可解的;

(2)应该是可验证的,以保证答案是正确的;

(3)应该是对科学知识或者真实世界工业应用有贡献的。

然而,McGreivy 表示,因为当前只能用高保真建模,例如直接数值模拟方法来提供真实解,因此偏微分方程求解器的基准问题无法同时满足计算上不可解且可验证的要求。这给研究者提出有影响力的挑战性问题造成困难。

图5 物理信息神经网络(physics-informed neural network, PINN)

未来发展方向

Brandstetter 深信我们需要改变研究视角,研究人员应当寻找现有数值方法无法解决的问题。因此,他正在探索比以往解决的系统规模大一个数量级的复杂偏微分方程问题。他认为,只有这种复杂度才能真正发挥深度学习的优势。

“我们不应该忘记,数值方法本身也只是近似工具。如果一个问题通过这些近似方法能够几乎完美且高效地解决,那么几乎没有理由去取代它们。” Brandstetter 补充道。具体来说,Brandstetter 认为当前的研究应该专注于那些现有数值方法难以处理的高度复杂的偏微分方程问题。他希望通过挑战这些问题,能够揭示出深度学习在解决复杂物理系统中的真正潜力。

现在的当务之急是设计出有价值且具有挑战性的基准问题,使得机器学习方法能够在其中表现出色,并成为首选解决方案。这样的努力将极大地受益于与领域专家的紧密合作。正如 Koumoutsakos 告诉我们的,“选择信息丰富的基准问题需要丰富的领域知识,而不仅仅是求解方程和收集数据”。具体来说,设计有用的基准问题不仅涉及技术层面的挑战,还需要深入理解特定领域的实际需求和背景知识。只有通过这种跨学科的合作,才能确保所设计的基准问题既能反映真实世界的复杂性,又能有效评估机器学习模型的性能。

参考文献

1. Brunton, S. L. & Kutz, J. N. Nat. Comput. Sci. 4, 483–494 (2024).

2. Ohana, R. et al. In 38th Conf. Neural Information Processing Systems (NeurIPS 2024) Track on Datasets and Benchmarks (2024).

3. McGreivy, N. & Hakim, A. Nat. Mach. Intell. 6, 1256–1269 (2024).

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    0
    收藏
    我要举报
    评论(3)
    发表
    热评论
    这导航绑定真是害!
    3天前 ∙ 江苏
    回复
    举报
      新评论
      这导航绑定真是害!
      3天前 ∙ 江苏
      回复
      举报
        加载中
        • 投资中国深耕中国
        • 解读|王毅三天密集会见日方官员
        • 国足多人伤停低调备战澳大利亚
        • 雪龙集团:公司股票价格短期涨幅较大,可能存在非理性炒作风险
        • 舒泰神:2024年净利润亏损1.45亿元
        • 人体红细胞中,携带氧气的主要物质
        • 光合作用的产物是氧气和什么?

        扫码下载澎湃新闻客户端

        沪ICP备14003370号

        沪公网安备31010602000299号

        互联网新闻信息服务许可证:31120170006

        增值电信业务经营许可证:沪B2-2017116

        © 2014-2025 上海东方报业有限公司

        反馈