出品| 新浪科技《科学大家》、墨子沙龙
撰文| 饶子和 结构生物学家,中国科学院院士,南开大学前校长,中国科学院生物物理研究所原所长,清华大学教授
生命具有广阔的时间和空间的尺度,从时间维度上,须臾一瞬,历经飞秒(fs)尺度的原子反应(1fs=10^-15s),到人寿百年,横跨数十个数量级。从空间维度上,从原子尺寸Å(1Å=10^-10m)到人体身高平均一米七,我们正走在逼近认知尺度极限的探索道路上。作为结构生物学研究者,我们希望从微观的原子水平到宏观的个体尺度上,去窥探生命的奥秘,也必将伴随着无数荆棘和挑战。
无论探测分子,细胞和个体结构,都需要很先进的手段和技术。生物学跟物理学、化学、计算机、工程技术等交叉学科的紧密配合突破了现有的瓶颈,迎来了结构生物学长足的发展,回答了许多困扰已久的科学问题。
实验的数据,过去对它进行计算机模拟,现在又有人工智能或者叫大数据系统,希望有一天能做到用于电子虚拟人体,这是整个结构生物学的大方向。
结构生物学的大方向:实现电子虚拟人体
我带领的课题组做尺度比较小的东西,包括病毒病原体、新发再发传染病病原体的研究。我们研究组主要在这个领域里面进行研究,我们团队很年轻,2018年研究组成果出现井喷,包括 2篇Science,和许文清教授合作1篇Nature,以及19年刚刚在线发表的Cell文章。这些工作积累了很长时间,凑巧到去年发表了,这些成果都是属于这批年轻人的。
病毒有三个科学问题:
第一个科学问题是病毒为代表的病原体,如何能够跟宿主细胞的受体识别并相互作用,然后入侵宿主细胞。
第二个科学问题是转录与复制。病毒进入宿主细胞,将其基因组释放到宿主细胞里面,病毒基因组如何跟宿主基因组整合,然后进行转录复制。这个工作我们是从非典事件开始,以冠状病毒为研究体系,做了深入的研究。
第三个问题是病毒在宿主细胞里面进行转录复制之后,如何装配起来形成一个病毒颗粒,然后怎么释放出去的?
我今天给大家讲第三个问题,病毒转录复制以后如何装配的?
以疱疹病毒为例,过去十几年我们实验室解析了二三十个完整病毒的原子水平结构,不光有病毒的结构,还有病毒和受体复合物的结构,病毒和抗体的复合物的结构。这些结构让我们从原子水平上对病毒的作用机制有一定的了解,为进一步研究它的作用机制和药物的开发提供了坚实的结构基础。
那么,疱疹病毒的衣壳是什么样的结构?它的Architecture(构造)是什么样的?
大家知道疱疹病毒、水痘、口腔疱疹、带状疱疹,这些都是跟人们生活密切相关的、令人烦恼的病毒。病毒有两种状态,一种叫裂解期,还有一种叫潜伏期。病毒侵入人体以后,这两种状态都有,免疫系统调节出问题的时候,嘴上或者身体其他部位长出疱疹,这个时候就是活跃期。状态好它就消下去了,这就是潜伏期。正因为它会潜伏,所以很难根治,往往人们得了一次疱疹病毒以后,它就可能跟你一辈子。在国际上很多很多研究组,都在研究各式各样的疱疹病毒,疱疹病毒研究队伍非常之大,但是到现在还没有根治疱疹的药。
疱疹病毒从结构水平上来讲比较特殊,它特别大,直径超过200纳米。结构有四层。如下图:
外面一层是带有糖蛋白的囊膜。
第二层是蛋白层,叫Tegument,它有Outer Tegument(外部的),还有Inner Tegument(内部的),里面相当复杂。
第三层,绿颜色是比较均一的正二十面体,有一个通道,这个通道叫Portal,是基因组进出的地方,原则上来讲,疱疹病毒不是一个严格的正二十面体,而是一个带有瓶口的正二十面体。
第四层是双链的DNA基因组。
过去的6年,由于冷冻电镜技术的突破,人们能够从原子水平上解析很多以前无法解决的复杂结构,大家看到这一系列的结构,一直到Dengue Virus(登革热病毒)这么大的结构都在原子水平上得到解析。但像疱疹病毒这么大的病毒,由于电镜技术的局限,还没有办法做到,我们研究组在计算方法的改进,总算解析了第一个这么大尺寸的疱疹病毒原子分辨率结构,这个工作去年4月份发表在Science上。
培养疱疹病毒,分离纯化出来后发现有三种形状的颗粒,一种颗粒叫A颗粒,是空的,里面没有基因组,B颗粒也是空的,也没有基因组,但是有一点支架蛋白在里面。C颗粒是真正具有感染能力的,带有完整基因组的颗粒。从尺寸上看,A、B、C三种颗粒几乎一样,差别就在于里面有没有基因组,C颗粒在表面上还多了一种重要的复合物。
我们通过冷冻电镜解析了A,B,C三种颗粒的结构,通过结构的比对和分析,A和B颗粒衣壳层结构相似,C颗粒包含有序排列的基因组,除此以外C颗粒的五次轴附近结合了CVSC复合物。B颗粒,有一个特殊的通道叫Portal,里面没有基因组,通道像瓶子一样,里面是空的,没有被封闭上;C颗粒充满基因组,portal被UL25封闭。我们解析了B型颗粒结构,是正二十面体的结构,由4000多个蛋白质亚基组成的大球,C颗粒多一个60个Copy的CVSC复合物。如下图。
这个4000多个蛋白质亚基组成的球,它们是如何高效有序地装配的?
主要靠VP5蛋白。VP5蛋白有1000多个氨基酸残基,主要通过下部的结构构象的变化相互作用组装成稳定的核衣壳结构,其组成核衣壳结构主要靠两个手(结构域),这个红色标记的结构域叫N-lasso,绿色标记的结构域叫dimerization domain(二聚体化功能域)。这两只手为了把蛋白装成核衣壳,底部结构域发生了显著的变化以适应局部的组装微环境的差异,进而组装成一个近似二十面体结构,而上部的结构域几乎没有变化。
下面这个结构有点像故宫角楼的建筑,叫大木构架斗拱结构。
实际上是球的底部,它是由这些结构组成的。这是一个五聚体,六聚体,这是一个C型的六聚体,它们之间是怎样构造的?首先看一下五聚体之间怎么构造的,再看六聚体怎么构造的,再看五聚体和六聚体之间怎么构造的,再看六聚体和六聚体之间的结构是怎么样的。然后再分析一下三个六聚体之间是怎么构建的。
看VP5底部两个手怎么抓的,再看看其它的细部,这个是五聚体之间的构造,侧过来看β折叠像船子一样都排起来,然后是六聚体之间的构造,这就是为什么说它是architecture(建筑),它确确实实像4000个单元的房子一样。
五聚体和六聚体之间的两个平行的α螺旋,整个排下来,再侧过来看,这种构造是非常精细的,六聚体和六聚体之间的构造,除了这个还有一堆α——helix cluster (α螺旋簇),还有对称的β折叠,再看三个六聚体之间是怎么结合的,实际上中间的洞里面还可以放一个三聚体在里面。
再回到瓶口,要看病毒口的结构很难,它只占整个病毒球小于1%的面积,要解出它的原子水平的结构非常有挑战性。因为它没有对称性,挑战性就非常大。不管怎么样,我们用了Asymmetric Reconstructions的方法解析了这个结构。这个方法是怎么做的?这属于很细节的事情了,这里就不展开讲解了。根据解析出来的结构作为药物靶点,可以来设计抗病毒的药物,由于数据还未发表,就先不说解析过程了。
这项工作是我们一批年轻的学生做出的,王祥喜博士是领头的,袁帅解析了B颗粒,王佳灵解析C颗粒。杨云翔和杨盼解析了末端酶,王男解析了Portal,这些都是博士学生。
注:文章整理于饶子和在墨子沙龙的演讲,略有删减