4月21日,哈尔滨工业大学生命学院黄志伟教授团队在《自然》(《Nature》)在线发表了题目为《CRISPR-Cpf1结合crRNA的复合物晶体结构》(《The crystal structure of Cpf1 incomplex with CRISPR RNA》)的研究论文。该项研究通过结构生物学和生化研究手段揭示了CRISPR-Cpf1识别CRISPR RNA (crRNA)以及Cpf1剪切pre-crRNA成熟的分子机制,这对认识细菌如何通过CRISPR系统抵抗病毒入侵的分子机理具有十分重要的科学意义,而且为成功改造Cpf1系统,使之成为特异的、高效的全新基因编辑系统提供了结构基础,让人们可以更加高效地对目的基因进行“关闭”、“恢复”和“切换”等精准“手术”,使战胜癌症和艾滋病等疾病成为可能。
CRISPR-Cas系统是细菌编码的适应性免疫系统,该系统通过RNA引导的效应蛋白剪切病毒的DNA或者RNA从而抵抗病毒的感染。该系统之一的CRISPR-Cas9系统被用来作为可编程的基因编辑工具用于细胞内目的DNA的剪切、激活表达、修饰、突变等。由于CRISPR-Cas9系统能够在活细胞中高效地、便捷地“编辑”任何基因,作为科研、医疗等领域的强有力工具,已被广泛地应用于全世界的生物和医学实验室。
刚刚发现的CRISPR-Cpf1系统是一类新型的CRISPR-Cas系统,能够在crRNA引导下在人类细胞内剪切目的DNA底物。而且,Cpf1本身也是一个具有序列特异性的RNase,这也是目前发现的唯一一个具有核酸序列特异性且同时具有DNase和RNase活性的核酸酶。Cpf1和Cas9很大的不同还在于:Cpf1仅需要一个拷贝的crRNA,而Cas9需要序列更长的tracrRNA和crRNA去识别、剪切底物DNA,较短的crRNA在转染细胞过程中将更高效;Cpf1和Cas9识别DNA底物上的模块(PAM)也不同;Cpf1剪切底物是通过粘性末端剪切,而Cas9是末端剪切,粘性末端剪切将更有利于基因编辑后的修复。
在该项研究中,黄志伟团队首先解析了结合了crRNA的Cpf1复合物的晶体结构。非常意外的是,Cpf1并不是之前人们推测的二聚体状态,而是一个呈三角形的单体,位于该结构中间是一个带有正电荷的凹槽。crRNA通过发卡结构形成高度扭曲的构象紧密结合在Cpf1的核酸结合结构域,和底物DNA配对的crRNA 3'末端位于Cpf1凹槽的一端。和Cas9结合的sgRNA显著不同的是,Cpf1结合的crRNA的引导序列部分(guide sequence)并没有电子密度,这说明在没有底物结合的状态下这部分序列和Cpf1的结合比较松散。据黄志伟介绍,结构观察发现一个紧密结合crRNA的六水合镁离子对稳定crRNA构象激活Cpf1的催化活性非常关键。当然,我们也不能排除镁离子也同时直接参与了对底物的催化反应。通过比较Cpf1和Cas9复合物的结构发现,LHD区域推测可能是双链DNA底物结合的PAM区域。
该研究发现Cpf1在没有crRNA结合的状态下处于松散的构象,crRNA的结合引起Cpf1发生显著的构象变化。与Cas9结合sgRNA极为不同的是,仅仅crRNA的重复序列部分(repeat sequence)就能引起Cpf1构象的巨大变化,这反映了这类短小的crRNA与Cas9结合的长sgRNA的识别机制的巨大差别。该结构显示来自于H843、 K852以及K869催化残基侧链上的氮原子位于一个平面上,同时和RNA A(+20)的磷酸基团形成氢键,该结构证据表明Cpf1剪切pre-crRNA成为crRNA是一个碱催化的反应。
黄志伟为本研究论文的通讯作者,该团队的硕士研究生董德、大四本科生任宽和博士生邱小林3位同学为该论文的并列第一作者。清华大学生命科学学院高宁教授实验室、王佳伟教授、范仕龙博士参与该研究的部分工作。上海同步辐射中心为晶体数据收集提供了及时有效的支持。本项目受到国家自然科学基金委、哈工大青年科学家工作室等基金的资助。值得一提的是,这是我校本科生第一次在该顶级期刊参与发表研究论文,该文章也是黄志伟团队在我校成立实验室以来在病原与宿主相互作用领域发表在《自然》杂志上又一项研究成果。(Nature, doi: 10.1038/nature17944)