科学界|蛋白质结构预测哪家强?两大国际团队同日在顶刊开源代码

蛋白质是生命的物质基础 , 每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构 , 想要破解这种结构通常需要花很长的时间 , 甚至难以完成 。 截至目前 , 约有10万个蛋白质的结构已经用实验方法得到了解析 , 但这在已经测序的数10亿计的蛋白质中只占了很小一部分 。
但“看清”蛋白的结构和人类的很多疾病机理、药物研发等等息息相关 。 在蛋白质结构解析的几十年历史中 , X射线晶体学、核磁共振波谱学(NMR)、冷冻电镜(Cryo-SEM)技术纷纷发挥了巨大的贡献 , 但这些技术在科学界看来 , 都有着劳心劳力又价格高昂的缺点 。
如何简单地通过蛋白质的氨基酸序列来预测其形状?如何能解答这一问题 , 了解生命运作方式的将打开截然不同的一扇窗 。 这种设想提出的50多年后 , 谷歌旗下人工智能公司DeepMind在去年12月的国际蛋白质结构预测竞赛CASP上投下重磅 , 他们开发的基于神经网络的新模型AlphaFold2击败了其他选手 , 在预测准确性方面达到接近人类实验结果 , 让整个结构生物学界震惊 。
科学界|蛋白质结构预测哪家强?两大国际团队同日在顶刊开源代码
文章图片

北京时间7月15日 , DeepMind团队在顶级学术期刊《自然》(Nature)以“加快评审文章”(Accelerated Article Preview)形式在线发表了一篇题为“Highly accurate protein structure prediction with AlphaFold”的论文 , 全面详述了半年前造成轰动的这一模型 , 并首次对外分享开源代码 。 该论文于今年5月11日提交 , 7月12日被接收 。
DeepMind团队向澎湃新闻(www.thepaper.cn)采访人员提供了一份声明 , 公司创始人兼首席执行官Demis Hassabis在声明中表示 , 去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统 , 此后我们承诺会分享我们的方法 , 并为科学共同体提供广泛、免费的获取途径 。
“今天我们迈出了承诺的第一步 , 在《自然》期刊上分享AlphaFold的开源代码 , 并发表了系统的完整方法论 , 详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的 。 作为一家致力于推动科学进步的公司 , 我们期待看到我们的方法将为科学界启发出什么其他新的研究方法 , 也期待很快能和大家分享更多我们的新进展 。 ”Hassabis表示 。
科学界|蛋白质结构预测哪家强?两大国际团队同日在顶刊开源代码
文章图片

值得一提的是 , 就在同一天 , 另一顶级期刊《科学》(Science)也在线发表了另一预测蛋白质结构的研究文章 , 题为“Accurate prediction of protein structures and interactions using a three-track neural network” 。
来自华盛顿大学、哈佛大学、德克萨斯大学西南医学中心等团队的研究人员开发了新的深度学习工具RoseTTAFold , 其拥有媲美AlphaFold2的蛋白质结构预测超高准确度 , 而且更快、所需计算机处理能力更低 。 同样 , 研究团队也对外分享了开源代码 。 该论文提交于6月7日 , 7月7日被接收 。
清华大学生命科学学院院长、高精尖中心执行主任王宏伟对澎湃新闻(www.thepaper.cn)采访人员表示 , “高质量结构预测的源代码开放对整个科学界尤其是结构生物学领域的促进作用必然是巨大的 。 ”他评价道 , 对于DeepMind这样一家商业公司来说 , “团队愿意向公众分享代码 , 是一个新型科研范式的突破 , 将整体上有利于人类更好地探索未知 。 ”
预测蛋白质结构 , 接近实验室测量
50多年前 , 科学家们就设想用计算机预测蛋白质结构 。 近年来 , 共同演化、接触图预测、深度机器学习等技术的引入 , 一些实验室的算法精度有了很大程度的提高 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。