- +1
DeepMind破解蛋白质折叠难题引争议,正准备论文回应
当地时间11月30日,英国DeepMind团队宣布在蛋白质结构问题上取得重大进展,其第二代“阿尔法折叠”(AlphaFold)方法精准预测蛋白质的三维结构,摘得国际蛋白质结构预测竞赛(CASP)冠军。
这一进展被舆论视为继AlphaGo以3:0战胜世界围棋冠军后,人工智能的再度发威。有网友担忧“结构生物学家是否会因此失业”,也有人认为,在代码正式公开之前,所谓的重大进展可能只是炒作。
众所周知,在人体内有成千上万种不同的蛋白质,而蛋白质的作用很大程度上取决于其独特的3D结构。弄清楚蛋白质折叠成什么形状被称为“蛋白质折叠问题”。这在过去的50年中,一直是生物学的重大挑战。
此间,生物学家主要利用X射线晶体学或冷冻电镜(cryo-EM)等实验技术来破译蛋白质的三维结构。但这类方法耗时长、成本高。目前,科学界已经在生命体内发现了2亿多个蛋白质,但只有约17万蛋白质的结构经实验破解,并被上传至公开的蛋白质数据银行(Protein Data Bank)。
DeepMind团队的AlphaFold(“阿尔法折叠”)程序在此次竞赛中战胜其余100多个团队。《自然》新闻评论称“它将改变一切”,“将极大地加快了解细胞组成部分的工作,并使更快、更先进的药物发现成为可能。”
DeepMind团队对比赛结果感到兴奋,他们在博客中将AlphaFold称为应对生物学50年重大挑战的“解决方案”,并对“AlphaFold对生物学研究和更广阔世界的影响持乐观态度” 。
事实上,这不是DeepMind对蛋白质折叠问题的第一次挑战。
早在2018年,DeepMind第一代人工智能程序AlphaFold便参与了国际蛋白质结构预测竞赛(CASP)。首次参加国际比赛的AlphaFold在“预测蛋白质三维结构”的任务中排名第一。当时,第二名的准确率与AlphaFold相差甚远。2020年1月,DeepMind团队将相关研究发表在学术期刊《Nature》并公开了代码。
第二代AlphaFold强势归来,创建了基于注意机制的神经网络,经过端到端训练的优化整体构建结构,使用序列、结构和宏基因组等信息细化结构。此次比赛中,第二代AlphaFold方法的中位分数为92.4(满分100分),预测最具挑战性的蛋白质的平均得分为87,比次优预测高出25分。
对于第二代AlphaFold的比赛结果,中国人民大学数学科学研究院教授、清华大学北京结构生物学高精尖中心合作研究员龚新奇对结构生物学家颜宁等人创办的科学自媒体“返朴”表示,在欣喜的同时,蛋白质结构预测领域的同行对AlphaFold2有一些保留意见。
“工程化明显,依赖于强大的GPU计算资源和代码优化团队;谷歌公司几乎可以收集全球所有网络信息,虽然看起来AlphaFold2的自动化程度很高,但他们在人工操作中使用了哪些信息值得关注;预测对了结构,但不等于明白了蛋白质折叠过程和原理。”
美国普林斯顿大学雪莉·蒂尔曼终身讲席教授,美国科学院外籍院士颜宁则评价称,“这次人工智能赢得CASP的新闻亮点有两个,一是AI,二是准确度高。这确实是突破,但是有了两年前的新闻(注:2018年,DeepMind开发的第一代AlphaFold首次参加CASP并且拔得头筹)做铺垫,现在这次委实是意料之中。”
对于所谓“结构生物学家都要失业了”的调侃,她表示,结构生物学的主语是生物学,是理解生命、是做出生物学发现。“结构本身只是手段,它们是为了回答问题、做出发现。”
AlphaGo之父、DeepMind联合创始人兼CEO 戴密斯·哈萨比斯(Demis Hassabis)对媒体表示,DeepMind计划让AlphaFold变得有用,以便其他科学家可以使用它。此前,DeepMind公布了第一版AlphaFold的大量细节,以供科学家复制该方法。
DeepMind目前尚未发表第二代AlphaFold的相关论文,但在博客中表示,正在准备有关该系统的论文,以适时提交给同行评审期刊。
在论文正式发表之前,“阿尔法折叠”是“重大进展”还是一场“炒作”的争议恐将持续一段时间。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司