澎湃Logo
下载客户端

登录

  • +1

鄂维南院士:机器学习解维数灾难,传统科学领域是AI主战场

澎湃新闻记者 贺梨萍
2021-07-08 20:44
来源:澎湃新闻
科学湃 >
字号

“我认为重要的不是Gordon-Bell Prize(戈登贝尔奖),而是说我们第一次看到把机器学习、科学计算和高性能计算这三大最主要的工具结合在一起,我们有多么大的空间可以实现。”7月8日,2021世界人工智能大会全体会议“科学前沿”举行,中国科学院院士、普林斯顿大学数学系和应用数学研究所教授、北京大数据研究院院长鄂维南在演讲中如是表示。

戈登贝尔奖素有超算界诺贝尔奖的美誉,去年的11 月 19 日,美国计算机协会ACM公布2020年戈登贝尔奖的颁奖结果,鄂维南在内的一个中美研究小组获得该奖项。他们通过机器学习将分子动力学极限从基线提升到了1亿原子的惊人数量,同时仍保证了从头算的高精度,效率是之前人类基线水平的1000 倍。

鄂维南1982年毕业于中国科技大学数学系,1985年于中国科学院计算中心获硕士学位,1989年于美国加州大学洛杉矶分校(UCLA)获博士学位。2009年入选首届美国数学学会会士、2011年当选为中国科学院院士、2012年入选首届美国工业与应用数学学会会士。

他于2003年获国际工业与应用数学协会科拉兹奖。2009年获美国工业与应用数学学会克来曼奖。2014年获美国工业与应用数学学会卡门奖。2019年荣获由美国工业与应用数学学会(简称SIAM)和苏黎世联邦理工学院(ETH Zürich)联合授予的Peter Henrici奖。2020年获得国际高性能计算应用领域最高奖——戈登•贝尔奖(ACM Gordon Bell Prize)。

中国科学院院士、普林斯顿大学数学系和应用数学研究所教授、北京大数据研究院院长鄂维南。

很多实际问题没有得到解决:维数灾难

鄂维南此次演讲的题目是“AI for Science”,“ 我们研究科学有两大基本目的,第一大目的就是寻求基本规律,比方说行星运动的三大定律、量子力学基本方程;第二大目的就是要解决实际问题,比方航空航天、生物制药等。”他认为,从寻求基本规律,尤其是基本原理这个角度来说,当90年前量子力学建立以后,这个任务基本上完成了,当然并不是彻底完成。

而人类真正的进步,鄂维南认为是从上世纪50年代开始有了电子计算机开始,在这个基础上发展了一系列的数值方法,包括差分方法、有限元方法等,人们才第一次大规模地实现了用基本原理解决实际问题。“在这之前,虽然有基本原理,虽然有确定的方程,但是用它来解决实际问题是非常困难的,几乎做不到。”

这些方法有个共同的出发点,即可以用多项式来逼近一般的函数,由此带来的影响是巨大的。尤其在工科领域,用计算方法来解决问题已经成了一个很重要的工具,可以说是现代工业和技术赖以生存的基础。

但鄂维南强调,我们仍然有很多问题没有得到解决,“比方说材料的性质与设计,分子、药物的分子与设计,这些远远没有得到解决,基于基本原理的控制方法也没得到解决。”造成的结果则是,“做理论的人、做实验的人和做实际场景这三个团体差得非常远,理论化学、实验室的化学和实际工业应用的化学,这些场景差距很远。”

这些问题困难在哪里?鄂维南总结它们都有一个共同的根源,就是所谓的“维数灾难”,也就是它依赖的变量太多了。“维数灾难是什么意思?就是随着变量的个数或者维数的增加,计算复杂度是指数增加的。从数学上来讲,它也有一个基本的困难,也就是多项式在高维不是一个有效的工具。”

鄂维南提出,能解开这一困局的或许正是深度学习。他以深度学习中最简单的图像识别举例,“给了你一个图像,你必须告诉我这个图像的内容,那么从图像到内容,这就是个函数,这个函数有多少个维度,也就是它有多少个自由度?”他在演讲中指出,“每一个图像都可以看成是3072维空间的一个函数。那么这样的高维函数以前我们是根本没办法处理的。”

鄂维南提到的第二个例子则是公众已熟知的AlphaGo,“围棋的最佳策略实际上是一个Bellman方程的解,所以说AlphaGo做的事情实际上在试图解一个Bellman方程。”

“这两个例子,图像识别是在逼近一个高维函数,AlphaGo是在解一个超大空间的Bellman方程。我也可以给大家举很多例子,这些例子都有一个共同的特点,他们在处理一个高非常高维空间的数学问题。”何以做到这些?鄂维南表示,因为神经网络可以帮助我们来有效地表示或者是逼近高维空间的函数,多项式不行,而深度神经网络是一个有效的替代品。“所以说在最基本的层面,我们有了一个全新的非常有效的工具,它带来的影响是巨大的。”

他总结称,从科学的角度来说,机器学习在科学和科学计算领域的应用,可以带来新的计算方法,新的科学模型,新的实验方法,新的产业业态。

传统的科学领域才是人工智能更大的主战场

让他斩获戈登贝尔奖的分子动力学领域的应用就是一个例子。分子动力学(MD)是一种计算机模拟方法,可以用来分析原子和分子在一段固定的时间内如何移动与交互,其实际应用包括大分子的研究,如用于药物研发的蛋白质等。

“它解的方程就是牛顿方程,困难在什么地方?困难在于描述原子和原子之间相互作用的势能函数。”鄂维南提到,传统的办法,一个是猜,“如果能猜得出来当然是非常好,但是猜出来可能性有多大?所以这个方法非常的不可靠。”第二个方法则是1985年发展的第一性原理方法,也就是通过量子力学模型,每一步在线地把原子和原子间的相互作用力算出来,“它非常的可靠,但是它只能处理很小的体系,1000个原子就到顶了。”

鄂维南等人利用机器学习、科学计算和高性能计算这三大最主要的工具结合起来实现的突破,让他认为,“这样一个空间不仅仅是我这里面举的分子动力学这个例子,对我前面讲的很多,从量子力学到密度泛函到分子动力学等等,这样的空间都是存在的,所以带来的影响是非常巨大的。”

鄂维南在演讲的最后还表示,其个人认为,现在做科研,做理论的也好,做实验的也好,它基本上是一个‘小农经济’的模式。整个过程需要好多年,是效率非常低下的模式。以后的模式是什么?“就是‘安卓模式’,我们有一个统一的大平台,这个大平台是我们大家一起贡献的,那么这个平台就提供了我们最基础的模型,比方说分子动力学模型,你需要什么体系,只要在这个平台上做简单的应用开发就可以了。”

他最后强调,“我个人认为,传统的科学领域,就是化学、材料、电子工程、化学工程、机械工程生物等,才是人工智能更大的主战场。它给我们带来的不仅仅是科学研究范式的改变,也是传统行业的转型升级。”

    责任编辑:李跃群
    校对:丁晓
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈