AlphaFold重磅升级:揭秘蛋白质“牵手”之谜!
近日,涵盖地球上几乎所有已知蛋白质的AlphaFold数据库,迎来了一次里程碑式的升级。这个由人工智能驱动的“生命百科全书”首次纳入对蛋白质复合物的预测,新增了170万个由相同分子组成的“同源二聚体”结构,将我们对生命运作的理解从“零件”层面推进到了“机器”层面。
自2021年问世以来,由谷歌DeepMind开发的AlphaFold2工具及其维护的数据库,已成为生命科学领域的基石。它此前预测了约2亿个单个蛋白质(单体)的结构,为全球研究人员在分子水平上探究生命机理提供了宝贵的起点。然而,生命的复杂性远非单个蛋白质所能概括。蛋白质往往需要彼此结合,形成复合物才能执行其生物学功能。比如作为重要药物靶点的HIV-1蛋白酶,只有当两个相同的蛋白质拷贝结合成一个工作酶时,才能真正发挥作用。此前数据库中的单体结构,只讲述了故事的一半。
“我们想,‘能否将AlphaFold数据库提升到一个新的水平,从而在生命之树中包含许多复杂的预测?’”参与此次升级的韩国首尔国立大学计算生物学家Martin Steinegger表示。预测蛋白质如何相互作用是一项艰巨的挑战,其计算复杂度和难度与预测单体结构完全不同。为攻克这一难题,Steinegger实验室、欧洲生物信息学研究所、谷歌DeepMind及芯片制造商英伟达结成联盟,汇集顶尖力量,首先聚焦于人类、小鼠、酵母及结核分枝杆菌等20种研究最广泛的物种,对其蛋白质复合物进行了重点预测。
此次升级意味着科学家们现在可以更直观地观察蛋白质如何“牵手”合作,这对于理解疾病机制、加速药物研发至关重要。如果说单个蛋白质是生命的“文字”,那么蛋白质复合物就是由这些文字组成的“词语”和“句子”。
业界专家认为,AlphaFold数据库的这一步,让科学家得以从零散的字母开始,阅读生命这部宏大而精妙的天书,为揭示生命奥秘开启了全新篇章。
#