颠覆生物学!AlphaFold成功预测蛋白质结构
蛋白质是由氨基酸链组成的、具有自身独特 3D 结构的大型复杂分子,其对人们理解生命形成的机制至关重要。蛋白质折叠成何种形状与其功能密切相关,而预测蛋白质结构对于理解其功能和工作原理至关重要。在过去 50 年里,蛋白质折叠问题一直是生物学领域的重大挑战。
2020年11月30日,谷歌旗下AI技术公司 DeepMind 提出的深度学习算法AlphaFold破解了历时五十年之久的蛋白质分子折叠问题。科学家们表示,Alphafold 的突破性研究成果将帮助人们弄清引发某些疾病的机制,并为设计药物、农作物增产,以及可降解塑料的超级酶研发铺平道路。
AlphaFold 处理蛋白质折叠问题
探究结构无序材料中不同的无序相(“多晶型物”)如何共存以及如何从一个相转变为另一个相的过程是非晶材料研究的一个基本科学问题。以非晶硅为代表的非晶材料目前已被广泛研究,它在自然条件下具备四配位的共价网络,而在高压条件下可形成更高配位的金属相。
由于对非晶相的仿真模拟要求更大计算系统、较长的模拟时间和可转移的原子相互作用模型(即对所有相关结构和键合环境均有效的模型)这给现有的计算机模拟带来了巨大挑战。即使是目前最先进的实验和计算手段由于其固有的局限性也无法对非晶硅结构相变过程的具体机制进行详细的阐释。
AI 再次攻陷材料领域——助力非晶结构材料研究
刚刚,牛津大学Volker L. Deringer教授团队开发了一种利用在精确的量子力学计算上训练的原子机器学习方法。使用更广泛的、基于机器学习模型的、具有量子精确的高斯近似势能(GAP)分子动力学模拟(GAP-MD),作者对包含100,000个硅原子(十纳米长度尺度)系统的液体-非晶态和非晶态-非晶态转变过程进行了研究,并同时预测了其结构、稳定性和电子性质。该方法成功地描述和解释了与实验观察一致的非晶硅的全部相变过程,直至达到既定的极限(即结晶)。这项里程碑式的成果以封面的形式刊登在Nature上。
这是继 DeepMind 团队利用AlphaFold解决50 年来生物学史上蛋白质折叠问题等重大挑战之后,AI超强的运算实力在另一个领域的再次印证!纳米尺度规模下非晶材料的结构相变研究标志着人们对无序材料的仿真模拟已迈出了质的步伐:可在具有实验挑战性的条件下从简单的结构模型到对材料系统的真实性预测和完全原子描述。
图1. 该方法与现有方法的比较
作者的仿真揭示了持续加压过程中非晶硅多态性的三步转变。首先,作者发现多态性在低密度和高密度非晶区域共存,而不是依次出现。然后,作者观察到结构坍塌成明显的超高密度的非晶相(VHDA)。最后,作者的仿真表明了该VHDA相的瞬态性质:它迅速使微晶核化,最终导致多晶结构的形成,这与实验观察一致,但在较早的仿真中未见。基于电子态密度的机器学习模型证实了VHDA形成和随后的结晶过程中金属性的开始。这些结果揭示了更广泛范围内硅的液态和非晶态转变过程,为极富挑战性实验条件下的材料预测建模开辟了新途径。
图2. 高压下电子指纹和结构相变
除了硅这一特定材料外,原子机器学习方法还具备引领新的科学发现的能力。由于该方法能够获得有关结构、稳定性和性质等量子精确级别的预测,可被用来揭示迄今未知的诸多现象:单个原子的结构和电子指纹、以及多态性、多晶性和其他形式的纳米级异质性等。 |