作者: Alan Dove / 文 高大海 姜天海 / 译 来源: 发布时间:2017-6-9 15:1:40
结构生物学的美好时代

 
只用了一代人的时间,研究人员就发现了DNA是编码RNA的遗传物质,RNA转而编码蛋白质,而这些蛋白质进行了生命的主要酶促反应。他们确定了蛋白质序列最终决定了它们的三维结构,这决定着它们的功能。剩下要做的就是找到一种简单的方法来测序基因组,预测它们编码的蛋白质结构,并建立精确的生命全模型。
 
半个世纪后,一些问题依然存在。其中一项最困难的挑战在于从氨基酸序列到三维蛋白质结构。虽然前者在表面上决定了后者,但科学界仍旧难以预测出肽链折叠过程的准确规则。尽管如此,计算生物学家仍在不断钻研这一问题,设计出一系列不断发展的工具,这些工具可以较为准确地预测某些种类的蛋白质结构。与此同时,X射线结晶学的经典技术已经为更多非专业人士所接收,电子显微镜领域的一系列革命性进展也揭示了人们之前难以理解的结构。
 
前进中的晶体学
 
X射线晶体学不是试图从基本原理的角度预测分子的形状,它们是从相反的方向解决问题,通过对蛋白质进行纯化和结晶,然后测量它如何衍射X射线束。该技术十分繁琐,往往需要成千上万次实验才能确定能产生可用的蛋白质晶体的条件。然而今天,生物学家可以利用机器人来完成其中的大部分工作。
 
“机器人可以建立的结晶液滴要小得多,那么筛选大量条件所需的样本量也更少。”位于马里兰州巴尔的摩约翰·霍普金斯医学院的生物物理化学教授Cynthia Wolberger说。如今,制造商所提供的机器人系统能够特别为测试结晶条件做出优化,如TTP LabTech公司的蚊子和Formulatrix公司的Rock成像仪。同时,快速的克隆和蛋白质表达平台让研究人员能够制作出一个蛋白质的多种变体,并从中找到结晶效果最好的变体。
 
晶体学家也提高了研究膜蛋白的能力,众所周知膜蛋白是很难结晶的。通过将脂类、水和蛋白质按特定比例混合,研究人员可以形成适合X射线衍射的立方液晶。该方法只需要微量的蛋白。“这是一个巨大的进步。”位于爱尔兰都柏林的三一学院生物化学和免疫学教授Martin Caffrey说。Caffrey补充说,G蛋白偶联受体和其他重要膜蛋白的研究“在这种立方相的方法出现后,真的经历了爆发式增长”。
 
一旦获得蛋白质结晶,研究人员将它送至少数几个得到政府资助的同步加速器设施中,使用X射线轰击并采集数据。这个步骤在最近几年也开始变得更加便捷。“我们很少去(同步加速器的)现场了;我们将晶体邮寄过去。”Wolberger补充道,“那里全都设置了出色的软件和机器人,你在任何地方都可以进行操作。”
 
同步加速器数据采集系统的提升也使其可以进行分析,这在几年前还是不可能的。被称为“光栅扫描”的过程让研究人员可以研究晶体及其较小的部分,从而发现样品中最好的衍射区(可能这个样品以其他方式是无法使用的)。自动化的高速数据采集同时也可以扫描更多的晶体。例如,Wolberger和她的同事们最近分析了超过1000个结晶来为一个结构收集足够的信息,这是手动曝光所无法实现的。
 
“打了就跑”
 
X射线束本身也有所改进,新系统可以产生更高水平的X射线通量,能够进行更快、分辨率更高的分析。与此同时,一种被称为“自由电子激光”的新技术引起了许多结构生物学家的注意。“它们能够产生约10~40飞秒长的X射线脉冲,这是非常短的脉冲,但每个里面都有大量的X射线。”Caffrey解释说。
 
由此产生了一种全新的结晶形式,Caffrey称为“打了就跑(hit and run)”。研究人员使用激光强大的X射线脉冲去攻击一个微小的晶体,并在晶体爆炸前收集生成的数据。同步加速器可以检测微米级的晶体,而新技术可以使晶体分析缩小至纳米级。
 
不仅是全职的晶体学家在不断推动这一技术的突破,其它领域的研究人员也开始更多地接触这一技术。对于研究相对简单的可溶分子的实验室来说尤其如此,这其中就涵盖了大部分人类基因组的蛋白质产物。“我所教授的课程是解释如何结晶蛋白,(如果)你参加了其中的某堂课,应该回去以后就可以开展结晶试验。”Caffrey说。
 
包括Hampton Research公司、MiTeGen公司和Molecular Dimensions公司在内的几家厂商也在销售现成的蛋白质结晶试剂盒,可以进一步帮助初学者入门。成功进入该领域的人可以在下一阶段获得更多的帮助。“在同步加速器工作的人非常愿意承担各种项目,并与来自非晶体实验室的人一起工作,共同解析某个结构并成为共同作者。”Caffrey说。
 
冰冷的硬数据
 
在X射线晶体学稳步发展的同时,其他主要的蛋白质结构测定技术也处在变革之中,如冷冻电子显微镜(cryo-EM)技术。在冷冻电镜中,研究人员将感兴趣的标本冻结成一块薄薄的冰,随后将它置于电子显微镜中,接着拍照,然后通过分析图像来确定目标的结构。尽管对于相对较大结构(如病毒)的研究,这一直是一项不错的策略,但有些技术问题限制了它的应用。
 
但在几年前,情况有所改变,这部分归功于与显微镜本身无关的一些进展。“迄今为止最引人注目的(发展)是新的探测器技术。”加利福尼亚大学伯克利分校生物化学和分子生物学教授Eva Nogales说。电子显微镜工作者在传统上依赖于用胶片去捕捉数据,但这种方法有很多限制。胶卷只有50帧,这在一次采样过程中设置了最大曝光的数量,而且处理、扫描和分析模拟图像可能会引发误差。
 
工程师们最终设计出了敏感的、抗辐射加固的数字传感器,即使是在高能电子显微镜下也能取代胶片。新的传感器可以直接检测电子,在提供超高分辨率的同时无需烦忧使用胶片时的各种不便。“对比非常鲜明,我们的这些图像有了更强的信号,并且由此带来了一个额外的好处:它们的读取非常、非常快。”Nogales说。
 
这项进展有助于解决另一个长期存在的问题。电子束导致冻结的样品块变形,从而造成传统相机图像的运动模糊。为了解决这一问题,此前冷冻电镜的研究人员会大量进行图像扫描,以找到少数的几张蛋白质没在移动的清晰图片。有了新的传感器,“读取速度快到你可以在曝光过程中拍下动画,随后重新调整样品以校正光束诱导的运动,这具有巨大的影响。”加利福尼亚大学生物化学和生物物理学教授David Agard说。
 
两埃及以下
 
最新一代传感器可以探测单个电子,它的研发资助来自于2008经济危机后美国政府的经济刺激计划。这让冷冻电镜可以产生高分辨率的蛋白质结构,分子量只有几百个千道尔顿,这在此前是X射线晶体学家的专属领域。电子显微镜家对他们能否进一步向晶体学推进持谨慎乐观的态度。“我们到底能不能获得有时X射线晶体学可以实现的分辨率,比方说两(埃)及以下,这我不知道。”Nogales说,“现在对于非常好的样本来说,(冷冻电镜)的纪录可以做到约2.2埃。”
 
的确,即使是专门做冷冻电镜的实验室仍然需要晶体学。“如果你可以得到晶体,在大多数情况下你可以通过晶体学快速获得结构,所以没有理由不这么做;我的实验室就这么做,这是理所当然的事。”Agard说。然而,他补充说,“未来将会有一整个领域的东西没有得到良好的结晶,这将会被冷冻电镜所取代。”
 
运行冷冻电镜系统并分析数据的软件也得到了显著提升,这让从显微镜校准到数据挖掘都变得更快、更容易。尽管大部分软件都是开源的,但硬件肯定不是。现代冷冻电镜显微镜来自一个公司——FEI公司,而其中的传感器则是由Direct Electron公司和Gatan公司提供的。无论选择哪个厂商和工具,购买一套完整的冷冻电镜系统都要花费数百万美元,每年的维护和运行成本也要几十万。“只有最富有的实验室,或者是提供资助的机构才能够做到这一点,但这对于国家能力来说并不是一件好事。”Agard说。德国、英国和中国都为冷冻电镜设施设立了国家级的经费资助,但美国国立卫生研究院仍在考虑应如何推行下去。
 
Siri,蛋白是什么样子的?
 
但无论X射线晶体学和冷冻电镜的发展如何迅猛,二者均无法满足研究人员对结构模型研究日益增长的需求。“你无法超越实验测定的结构,但挑战在于已测序的基因组数量庞大,而且揭示所有蛋白质的三维结构实际上是不可能的任务。”英国帝国理工学院整合系统生物学和生物信息学中心主任Michael Sternberg说。
 
为了应对这一挑战,Sternberg和他的同事Lawrence Kelley都将主要精力放在分子生物学家几十年来的梦想上:直接从序列信息预测蛋白质结构。该团队的最新工具Phyre2使用基于模板的建模,该方法将序列与此前解析过的蛋白质结构的全球数据库进行比对。其他几个研究小组也已经开发了类似的工具,世界各地的研究人员都可以进行在线访问。
 
这些工具所获得的结果十分引人瞩目,至少是对在数据库中有很好代表性的蛋白质家族来说。“有些蛋白质样品我们已经能够做得相当好了,而我们现在有了更多的数据,因此可以应用或开发更先进的技术,对序列和结构的关系进行建模。”芝加哥大学计算研究所高级研究员Jinbo Xu说。Xu目前是负责RaptorX的课题组长,RaptorX是预测蛋白质二、三级结构的在线门户网站。
 
除了基于模板的建模外,一些研究人员如今正在探索一种被称为“相关性预测(contact prediction)”的技术。该方法通过搜索大量的序列数据,识别在进化上保守的氨基酸的相互作用,然后利用这些相关性预测全新序列的折叠模式。Sternberg说,“对只有极少数可用晶体结构的膜结合蛋白而言,这已经被证明是非常有用的。”但他补充说,“你仍然需要大量的对齐序列”才能确保相关性预测能起作用。
 
除了改进底层算法,计算生物学家也在努力让他们的系统界面更加友好。Sternberg说,“我们基本上参照了谷歌那种简洁的页面,不让用户淹没在大量的选项中,而且只提供用户想要的。”这种方法似乎奏效了。据Sternberg估计,在去年44000个访问Phyre2的独立用户中,只有几百名用户联系过他或Kelley寻求技术支持。
 
扩展选择
 
Xu和他的同事也采纳了用户友好的模式,并获得了类似的结果。“使用这些工具的群体更为广泛,我的服务器用户也具有非常多元化的背景。”他说。没有经过结构生物学培训的研究人员可能并不了解底层算法的局限性,所以大多数主要门户网站的设计都会帮助用户解读结果。RaptorX会为每个蛋白质模型提供质量评估,评估该结构的正确率。同样的,Phyre2也会为用户提供整体信心评分,并为小至氨基酸水平的亚结构提供独立评分。
 
因为所有主要的结构预测工具都是在线免费的,科学家们也可以两头下注,将他们的目标序列发给所有网站并观察模型之间的差异。另一家网站CAMEO也会对不同的蛋白质结构服务进行测试和评估。CAMEO每周都会发送一段测试序列到所有参与的服务器,然后根据系统的速度、服务器可靠性及其他特性来计算基准。
 
根据研究人员的具体需求,不同的工具也会呈现出明显的优缺点。RaptorX更注重为特别有挑战性的蛋白质提供基于模板的建模,而其他门户网站则更适合于对特征相对明显特征的蛋白质家族进行大量的快速分析。Phyre2提供一套额外的服务;“Phyre警报”,例如,当新的数据允许系统计算出蛋白质的改进模型时,该警报会给研究人员发送邮件通知。
 
无论选择什么方法,寻求蛋白质结构的研究人员都可以期待更多的好消息。Agard通过对这三项技术的新进展的调查,也表示赞同结构生物学家的整体感受:“这是该领域发展的美好时光,有太多让人激动万分的事情。”■
 
(译者之一高大海系365体育手机版:海洋研究所助理研究员) 
Alan Dove是马萨诸塞州的科学作者和编辑。
DOI: 10.1126/science.opms.p1600107
鸣谢:“原文由美国科学促进会(www.aaas.org)发布在2016年7月14日《科学》杂志”。官方英文版请见http://www.sciencemag.org/custom-publishing/technology-features/structural-biology-shapes。
 
《科学新闻》 (科学新闻2017年5月刊 科学·生命)
发E-mail给:      
| 打印 | 评论 |