自 1950 年代发现 DNA 以来,生物学家一直试图将遗传密码的长度与一系列细胞部分和过程联系起来——例如,为现在著名的 mRNA 疫苗提供动力的特定抗体的 mRNA 转录。尽管自发现 DNA 以来在测序和理解基因组方面取得了进展,但仍然存在一个重要的缺失环节。生物学家缺乏一种仅使用其 DNA 或 RNA 源代码来准确有效地预测未知蛋白质 3D 形状的方法。在生物学中,结构决定功能。蛋白质在细胞中的作用取决于它的形状。具有中空中间的圆柱形是良好的膜受体,而 U 形成酶在其峡湾状的空腔中催化化学反应。
但 70 多年来,科学家们一直坚持使用缓慢的方法,这些方法会使计算机紧张,并在很大程度上依靠自己的猜测来梳理蛋白质的结构。尽管知道构成每种蛋白质的组成部分的每种氨基酸的 DNA 代码段是什么,但生物学家仍缺乏可重复的、可推广的公式来解决这个所谓的“蛋白质折叠问题”。他们需要系统地了解任何一串氨基酸,一旦连接起来,将如何折叠成 3 维持形状,以解开浩瀚的蛋白质世界。
资料来源:DeepMind
2020 年,谷歌的 AI 团队 DeepMind 宣布其算法AlphaFold已经解决了蛋白质折叠问题。起初,大多数人都对这一惊人的突破感到兴奋,科学家们随时准备测试一种新工具,也让一些人感到有趣。毕竟,这不是几年前AlphaGo在中国战略游戏围棋中击败世界冠军的同一家公司吗?掌握一个比国际象棋更复杂的游戏,虽然难度很大,但与蛋白质折叠的问题相比,感觉微不足道。但是 AlphaFold 通过一年一度的竞赛证明了它的科学勇气,在该竞赛中,生物学家团队仅根据蛋白质的遗传密码猜测蛋白质的结构。该算法远远超过了它的人类竞争对手,发布了预测最终形状的分数在一埃内,单个原子的宽度。不久之后,AlphaFold 通过正确预测SARS-CoV-2“刺突”蛋白的形状,通过了第一次真实世界的测试,该蛋白是疫苗靶向的病毒明显的膜受体。
来源:自然
AlphaFold 的成功很快就变得不可忽视,科学家们开始在他们的实验室中试用该算法。到 2021 年,《科学》杂志将 AlphaFold 的开源版本加冕为“年度最佳方法”。生物化学家和《科学》杂志的主编 H. Holden Thorp在 一篇社论中写道:“就科学成就和未来研究的支持而言,蛋白质折叠方面的突破是有史以来最伟大的突破之一。” 如今,AlphaFold 的预测非常准确,以至于蛋白质折叠问题被认为已解决经过 70 多年的探索。虽然蛋白质折叠问题可能是迄今为止人工智能在科学领域最引人注目的成就,但人工智能正在许多科学领域悄然发现。