在近十余年的生命科学研究中非编码调控RNA可谓是研究最火的领域之一,从06年诺奖的siRNA,到这几年异常火爆的microRNA,到即将登场并定能风靡的lncRNA,可谓如火如荼。
RNA不仅仅只承担遗传信息中间载体的辅助性角色,而是更多地承担了各种调控功能。 lncRNA在发育和基因表达中发挥的复杂精确的调控功能极大地解释了基因组复杂性之难题,同时也为人们从基因表达调控网络的维度来认识生命体的复杂性开启新的天地.研究者大部分研究集中于短 RNA如 microRNA,piRNA 等一些 ncRNA 生物生成机制和调控通路,甚至在一些人类复杂疾病中的功能,但是这都只是冰山一角。人们对lncRNA(Long noncoding RNAs, LncRNAs) 的认识还处在初级阶段,lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。
然而,有文献研究表明,lncRNA参与了X染色 体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等多种重要的调控过程,lncRNA的这些调控作用也开始引起人们广泛的关注。哺乳动物 基因组序列中4%~9%的序列产生的转录本是lncRNA(相应的蛋白编码RNA的比例是1%),虽然关于lncRNA的研究进展迅猛,但是绝大部分的lncRNA的功能仍然是不清楚的,随着研究的推进,各类 lncRNA 的大量发现,lncRNA 的研究将是 RNA 基因组研究非常吸引人的一个方向,使人们逐渐认识到基因组存在人类知之甚少的“暗物质”
lncRNAs通常较长,具有mRNA样结构,经过剪接,具有polyA尾巴与启动子结构,分化过程中有动态的表达与不同的剪接方式。
lncRNAs启动子同样可以结合转录因子,如Oct3/4,Nanog, CREB, Sp1, c-myc, Sox2与p53,局部染色质组蛋白同样具有特征性的修饰方式与结构特征。
大多数的lncRNAs在组织分化发育过程中,都具有明显的时空表达特异性,如有人针对小鼠的1300个lncRNAs进行研究,发现在脑组织中的不同部位,lncRNAs具有不同的表达模式。
在肿瘤与其他疾病中有特征性的表达方式。
序列上保守性较低,只有约12%的lncRNA可在人类之外的其它生物中找到。
编码蛋白的基因上游启动子区(橙色)转录,干扰下游基因(蓝色)的表达
抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝色)的表达
与编码蛋白基因的转录本形成互补双链(紫色),干扰mRNA的剪切,形成不同的剪切形式
与编码蛋白基因的转录本形成互补双链(紫色),在Dicer酶的作用下产生内源性siRNA
与特定蛋白质结合,lncRNA转录本(绿色)可调节相应蛋白的活性
作为结构组分与蛋白质形成核酸蛋白质复合体
结合到特定蛋白质上,改变该蛋白质的细胞定位
作为小分子RNA(如miRNA、piRNA)的前体分子
长链非编码 RNA 与细胞分化和个体发育
长链非编码 RNA 的表达不仅具有细胞型和组织特异性, 一些长链非编码 RNA 还仅在真核生物发育过程的特定阶段表达[1] 。对线虫和果蝇发育过程中长链非编码 RNA 的表达研究发现, 这类 RNA 分子呈现出动态的表达变化, 多数长链非编码RNA 具有精确的时间和空间表达模式, 有的表达模式还保守地存在不同种的果蝇中[5] 。原位杂交分析中发现, 在黑腹果蝇的胚胎发育过程中高表达的33 个 mRNA-like 长链非编码 RNA, 有 16 个仅在中枢或者外周神经系统中得到表达
长链非编码 RNA 与人类疾病
研究发现, 长链非编码 RNA 的表达或功能异常与人类疾病的发生密切相关, 其中就包括癌症、退行性神经疾病在内的多种严重危害人类健康的重大疾病, 具体表现为长链非编码 RNA 在序列和空间结构上的异常、表达水平的异常、与结合蛋白相互作用的异常等