北京物流信息联盟

Circular RNA研究现状

2022-03-17 13:32:14

Circular RNA(circRNA)一类新的非编码RNA,具有共价连接的闭环结构,由反向剪接(backsplice或称为首位剪接,head-to-tail splice)事件产生。CircRNA在组织中广泛表达,结构稳定能够抑制RNase R的降解,并且一些circRNA具有发育阶段特异性和物种间的保守性。目前发现一些circRNA细胞质中充当miRNA海绵,或作为RNA结合蛋白(RNA binding protein, RBP)的隔绝子,或作为核内翻译的调控子,是基因表达调控网络的重要参与者。目前已发现circRNA可能在动脉粥样硬化、神经退行性疾病、朊病毒疾病和癌症中发挥重要作用。

历史回顾

CircRNA早在1970s已经RNA病毒中被发现,1990s首次在人类细胞中发现DCC转录成circRNA研究随后湮没了长达二十多年——人们认为绝大部分RNA都是线性的,因此,circRNA认为是遗传意外或实验人工产物直到2012,斯坦福大学医学院的分子生物学家Julia Salzman及其同事发现了人类细胞中有大量的circRNA表达;接着,2013nature刊登了两篇关于circRNA充当分子海绵的重要研究,表明这些circRNA分子在生物体中可能发挥着重要作用;circRNA线虫、小鼠和人类生物体中广泛表达进一步论证了它在生物学通路中扮演着重要角色

分子特征

反向剪接


与线性分子mRNA)经典的前向剪接模式(上游供体的3端与下游受体的5连接)不同circRNA由反向剪接(剪接供体的3与上游受体的5共价连接)产生。因此circRNA没有poly(A)

分子组成

circRNA主要来自编码基因的外显子,也可能来自编码基因的内含子、基因间区、UTR区域或非编码RNA基因位点CircRNA可能仅仅由一个外显子构成,也可能多个外显子构成;外显子和内含子构成的circRNA称为EIciRNA一般定位在核中;还有一类仅由内含子构成,称为ciRNA

可变环化


和线性分子一样,circRNA同一个基因位点可能由于剪接位点等因素的改变产生多个转录本。例如不同于经典的U2剪接体(spliceosome)的U12剪接体circRNA基因进行的剪接事件。

不可翻译

几乎没有circRNA可以被翻译,虽然有研究人员发现个别circRNA具有开放阅读框,例如PerrimanAres报道了一个环状mRNA包含一个简单的绿色荧光蛋白GFP的开放阅读框。迄今为止真核细胞中只有一个已知的外源病毒circRNA编码HDV还没发现有内源性circRNA编码蛋白质。

细胞内非常稳定

外显子circRNA细胞中非常稳定,在大多数物种中存活半衰期超过了48hmRNA半衰期只有10h然而,外显子circRNA血清中不稳定半衰期不超过15s可能由于环化RNA核酸外切酶的存在。

识别

目前已储存了大量RNA-seq数据(特别是Illuminal平台,通过开发生物信息学工具合理地利用这些资源识别circRNA必要的。CircRNAs没有poly(A)尾,因此,poly(A)选择的数据不适合用于识别circRNA分子,用来作为假阳性对照;circRNA环化分子,对RNase R降解抑制,因此,RNase R处理后的数据往往能识别circRNAs真实的分子,用来作为真阳性对照。

以下列出了目前识别circRNA分子一些方法和工具:

生化方法

CircleSeq

一种全基因组识别circRNA的生化方法,利用RNase R获得酶抑制的RNA然后测序,并用MapSplice比对算法识别backsplice序列CircleSeq识别套索RNase R删除套索的尾巴。该方法已经在古生菌和哺乳动物中实现,所发现的外显子circRNA也得到了证实

计算方法

1.find_circ

2013年随着Circular RNAs are a large class of animal RNAs with regulatory potency这篇文章发布的。对于circRNA,成环的剪接位点不能直接mapping基因组。因此首先通过mapping筛选出这些未比对reads然后取这些reads两头20bp,重新mapping基因组上;接着利用开发的方法检测这些短序列是否circRNA短序列。

2.MapSplice

3.Segemehl

利用segemehl直接mapping ,寻找backsplice然后人工判断

4.CIRCexplorer

2014年上海生科院Complementary Sequence-Mediated Exon Circularization发表问世CIRICexplorer巧妙运用fusion gene这个思路去检测circRNA。首先,过滤出tophat无法mappingreads然后用tophat-fusion mapping这些reads基因组上接着,利用基因注释,确定精确donoracceptor的位置;最后对circRNA进行注释。

5.circRNAFinder

6.CIRI

北京生科院发表的工具sam格式中的CIGAR进行分析,扫描PCC信号(paired chiastic clipping signals),进而识别circRNAs。该方法操作简单,但消耗内存比较大。

7.KNIFE

Known and Novel IsoForm Explorer. 发表于Statistically based splicing detection for circular and linear isoforms from RNA-Seq data是一种统计学识别真实circRNA方法。该方法finc_circ以及CIRI进行了比较,具有更强的敏感性和更高的准确性。

8. NCLscan

这些方法的详情及使用说明请自行搜索,以下网友关于这些方法讨论的连接

1. http://yulijia.net/cn/论文笔记/2015/08/07/circRNA-tools.html

2. https://www.biostars.org/p/127785/

假阳性探讨主要针对环状外显子RNA

Backsplice序列不仅仅circRNA形成产生,还可能其他机制获得,例如反转录酶模板替换reverse transcriptase template switching串联复制tandem duplicationRNA反式剪接RNA trans-splicing如图


一些方法可以区分真实circRNA这些假阳性(b)


生物起源

虽然已经有数千个circRNAs识别例如circBase收集了几篇文章发现的大量circRNAs然而这些circRNAs生物起源我们却知之甚少。CircRNAsjunction(即供体与受体相连)附近被发现具有经典的剪切信号那么剪接体spliceosome,进行RNA剪接时形成的多组分复合物,主要由小分子RNA和蛋白质组成)可能参与产生circRNA分子然而研究表明circRNA表达并不总是与同源基因所产生的线性RNA表达相关这说明剪接体能够区分前向间接(forword splicing例如mRNA)和后向间接(backsplicing例如circRNA分子的剪接)。目前对实现剪接体区分的机制还不能被了解尽管如此,对于RNA环化机制已有一定的研究目前已经发现了三种共存的环化机制这三种机制都是基于将相关的剪切位点并列在一起,至于如何实现拉近剪切位点距离三者存在差异。模式图


1. 第一种机制是内含子配对驱使环化形成:成环外显子侧翼的内含子包含反向互补motifs,它们的配对形成了茎限制性结构,却导致剪接位点临近促进了环化。

2. 绑定到了成环外显子的侧翼内含子的motifRBPs发生配对,导致剪接位点临近促进了环化

3. RBPs诱导circRNAs形成的另一种潜在方式是通过诱导外显子跳跃(exon skipping——一个转录本的一个或多个外显子被跳过而剪接出线性转录本,留下一个包含外显子的套索该套索包含被跳跃的外显子,被剪接体识别并且连接。


4. 补充模式

区分外显子circRNARNA套索非常重要。套索RNA大所诉是内含子的,在分支点是2-5连接。套索RNA比之前所预料的更加稳定,这些RNA3尾端被降解后,留下环状分子——称为intronic circRNA(ciRNAs)反转录酶跨过2’-5’junction分支点时,会有一个或多个没有模板的碱基产生,这很容易被测序检测到。同时,套索很容易被分支酶消除

功能


miRNA Sponge

目前有两个circRNAs——ciRS-7/CDR1asSry发现能够结合miR-7miR-138ciRS-7/CDR1as包含超过70miR-7结合位点能够抑制miR-7活性,在脑中特别是小脑中高表达Sry被发现在小鼠中高表达,通过体外荧光报告试验表明能够抑制miRNA活性,包含16可能的miR-138的结合位点

到目前为止,被证实作为miRNAspongecircRNA只有CDR1asSry,因此,人们开始怀疑是否circRNA真能作为miRNA sponge但研究表明许多circRNA被预测有大量miRNA结合位点,并且在果蝇中发现了高度保守的miRNA结合位点;另外,有研究发现circRNA所预测miRNAs结合位点的SNP密度较低,这与3’UTRmiRNA种子位点类似,也支持了circRNA作为miRNA sponge证据

蛋白质decoytrap

CircRNA能作为蛋白质的decoy例如果蝇中mbl位点转录的circRNA——circMBl包含MBL蛋白质的结合位点。MBL能够诱导circMbl生成从而抑制了MBL前体mRNA成,进而限制了MBL蛋白质继续产生,反过来抑制了circMbl的生成。因此circMbl似乎MBL自调控环路中的一员。

Chao等人发现小鼠的formin(Fmn)基因可以生成circRNAcircRNA包含翻译起始位点,能够作为一个mRNA trap——留下非编码的线性转录本而减少了Fmn蛋白质表达水平JeckSharpless发现在人类成纤维细胞中许多单外显子的circRNAs都包含翻译起始位点这些发现表明,circRNAs可以通过隔绝翻译起始位点作为mRNA trap从而调控蛋白质的表达。

转录调控子

EIciRNAs最近被报道通过与U1 snRNPRNA聚合酶II宿主基因的启动子上互作增强宿主基因的转录

CircRNA疾病

1. 朊病毒疾病

HEK293细胞中,朊病毒蛋白PrPC稳定过表达能够诱导ciRS-7/CDR1as表达,说明CDR1as可能涉及朊病毒疾病。

2. 肌强直性营养不良

MBL功能缺失会引起退行性疾病——肌强直性营养不良,而MBL转录本circMbl与线性转录本mbl会发生转录竞争,这样circMbl可能与肌强制性营养不良相关。

3. miRNA参与的疾病

1miR-7参与了大量通路和疾病包括作为alpha突触核蛋白泛素蛋白激酶A直接调控子CDR1as已经涉及到了帕金森病、阿尔兹海默症以及脑发育

2miR-7具有致癌和肿瘤抑制子的性质,CDR1as/miR-7可能涉及到了癌症的发生发展。Li等人已表明cir-ITCH表达在食管鳞状细胞癌中较正常低表达,因此可能miRNA(例如miR-7/miR-17/miR-214)互作发生抑癌作用,并上调ITCH表达从而降解泛素介导的Dvl2减少致癌基因c-myc表达——该过程抑制了Wnt信号通路。

4. 癌症

研究12配对的正常与结肠直肠癌的RNA-seq数据发现circRNA在癌组织中表达整体下降。通过芯片研究发现在胰腺导管癌circRNAs表达特征发生了紊乱

研究人员还发现circRNA has_circ_002059胃癌中表达下调,表明可能是一个潜在的biomarker

5. 心血管疾病

Burd等人发现了环状分子cANRIL(INK4位点中环状反义非编码RNA,来自INK4A-ARF位点)。在粥样动脉硬化血管疾病中,接近INK4/ARFCDKN2a/b)位点9p21.3存在的SNPs可能调控ANRIL剪接以及cANRIL产物CANRIL表达INK4/ARF转录以及动脉粥样硬化血管疾病相关。

6. Biomarker

人们研究果蝇circRNAs发现它们可以作为衰老的biomarker,同时研究人类唾液circRNAs推测其能作为疾病生物标记。

参考文献

[1] Detecting and Characterizing circular RNAs

[2] Circular RNAs Identification, biogenesis and function

[3] Circular RNA A new star of noncoding RNAs

欢迎关注生信人


友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟