24小时热门版块排行榜    

查看: 1738  |  回复: 2

想飞的fish

新虫 (小有名气)


[交流] 如何通过RNA-Seq了解转录本的结构

测序转录组的方法可不止一种。一些研究人员的目标是计数转录本,评估表达水平,则测序可代替DNA芯片。而另一些研究人员感兴趣的是转录本的结构。大家都知道,真核生物的基因常常经过选择性剪接。是否包含特定的外显子,这有着深远的生物学影响。
      前一个应用比较简单,也更加广泛。它与Illumina测序平台的特征相吻合,这些平台提供了短的RNA序列,但每次有数十亿个。而对于后一个阵营的研究人员而言,生物信息学工具和长读取计数才是问题的关键。

长长短短的读取

      据Pacific Biosciences的首席科学官Jonas Korlach介绍,哺乳动物的转录本大约在1,000至3,000个碱基,并以多种形式存在。例如,一个基因有5个外显子,则可能出现各种配置,如12345、1245、1345、245等等。弄清这些不同形式的结构和丰度应该不是什么难事,只要测序每个RNA分子并计算其数量。然而,问题在于目前的测序技术无法做到这一点。
       Illumina的HiSeq v4试剂每次运行大约产生40亿个高度准确的读取,这对转录组测序而言是足够了。然而,每个双端读取的长度在2 x 125 bp,这就难以确定哪些片段是在一起的。如果这些读取中包含重复元件,则很难定位到基因组中。
       斯坦福大学遗传学教授Michael Snyder在接受采访时表示:“你仔细想想,我们研究转录组的方式是疯狂的。我们得到RNA,将其炸成碎片,然后又尝试将它们组合回去,了解转录组一开始是个什么样子。这是一种可怕的方式。”
      Pacific Biosciences的单分子测序系统PacBio RS II产生了平均长度在8,500 bp的读取,这足以覆盖大多数的转录本。但RS II的每个SMRT Cell只产生50,000至80,000个读取,这对于全面读取每个转录本而言还是太少。
混合方法
     对于许多研究人员来说,两全的解决方案就是将两种方法相结合。在最近一项发表于PNAS上的研究中,Snyder的研究团队采用混合策略,利用PacBio的长读取和Illumina的短数据来测序一位儿童及其父母的淋巴母细胞转录组。同时,Illumina的读取也能用来检查PacBio碱基检出的错误[1]。
     华盛顿大学西北基因组中心的技术开发主任Jason Underwood也在H1人胚胎干细胞系的转录组分析中采用了这种策略[2]。他们的“混合测序(hybrid sequencing)”方法鉴定出H1细胞中表达的数百个新基因/长链非编码RNA(lncRNA)以及数千个已知基因的异构体。
     不过,Underwood并不总是利用短读取来进行错误校正,在分析鸡的转录组结构时,他只使用了长读取技术[3]。他利用SMRT测序来产生鸡胚胎心脏的全长cDNA,鉴定出9,000多个新颖的转录异构体,以及Ensembl注释中未包含的500多个基因。
      据Korlach介绍,PacBio的技术让研究人员能捕获全部的转录本多样性。在这种称为Iso-Seq的方法中,用户合成cDNA并筛分,创建出不同长度的文库,然后环化并测序。PacBio的SMRT分析软件对相同结构的转录本进行聚类,从而最大限度减少测序错误。互补的策略是环化测序(circular consensus sequencing,CCS),其中cDNA被环化并反复测序,以产生更加准确的平均读取。
      鉴于PacBio的读取次数相对较低,一些研究人员将这种技术与选择一些基因的方法相结合。在一项最新的研究中,瑞士巴塞尔大学Peter Scheiffele领导的研究团队利用PacBio方法,对成年小鼠大脑中的370,000个轴突蛋白转录本进行测序,鉴定出这个家族中近1,400个独特的异构体[4]。
分析工具
      为了理解那些数据,Scheiffele的团队使用了一种称为GMAP的算法程序,这也是Underwood使用的。分析转录本结构的其他生物信息学工具包括Cufflinks、SpliceMap和 SigFuge。SigFuge由北卡罗来纳大学教堂山分校D. Neil Hayes副教授的实验室开发,是一种鉴定有趣的结构变异的工具。Hayes则使用它来鉴定数千个患者样本中的癌症标志物。“如果变异很重要,那么它应当是经常性的,”他解释道。有了SigFuge,“我们能够检测RNA结构中经常性的结构变异。”
      但是你需要多少序列才能找到它们呢?Hayes认为没有简单的答案。“一般来说,越多越好。但是你测序越多,研究就越昂贵。”他认为每个肿瘤转录组需要6000万个Illumina读取。
     作为一般准则,Underwood建议对全转录组分析感兴趣的用户至少分析每个样品的100万个读取。“最低和最高表达的RNA之间可能相差5至6个数量级,”他说。因此,即使是最稀有的转录本,100万个读取应该也够了。这大约需要PacBio仪器上的20个SMRT cell,或每次运行8个cell,2.5次运行。(Jeffrey M. Perkel )
参考文献

[1] Tilgner, H, et al., “Defining a personal, allele-specific, and single-molecule long-read transcriptome,” Proc Natl Acad Sci USA, 111:9869-74, 2014. [PubMed ID: 24961374]
[2] Au, KF, et al., “Characterization of the human ESC transcriptome by hybrid sequencing,” Proc Natl Acad Sci USA, 110:E4821–30, published online November 26, 2013, doi: 10.1073/pnas.1320101110. [PubMed ID: 24282307]
[3] Thomas, S, et al., “Long-read sequencing of chicken transcripts and identification of new transcript isoforms,” PLoS ONE, 9:e94650, 2014. [PubMed ID: 24736250]
[4] Schreiner, D, et al., “Targeted combinatorial alternative splicing generates brain region-specific repertoires of neurexins,” Neuron, in press, 2014. [DOI: 10.1016/j.neuron.2014.09.011]
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hxswdl

至尊木虫 (文坛精英)

Tortoise

文献杰出贡献


小木虫: 金币+0.5, 给个红包,谢谢回帖
你是做信息分析的??
Dripping Concentrated!!energetic and active!
2楼2014-12-26 15:51:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

想飞的fish

新虫 (小有名气)


引用回帖:
2楼: Originally posted by hxswdl at 2014-12-26 15:51:52
你是做信息分析的??

有些关系吧
3楼2014-12-26 16:58:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 想飞的fish 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 环境学硕288求调剂 +7 皮皮皮123456 2026-03-22 7/350 2026-03-23 20:47 by baobaoye
[考研] 328求调剂,英语六级551,有科研经历 +7 生物工程调剂 2026-03-17 12/600 2026-03-23 18:18 by YMU施老师
[考研] 352求调剂 +3 大米饭! 2026-03-22 3/150 2026-03-22 23:28 by king123!
[考研] 310求调剂 +4 baibai1314 2026-03-16 4/200 2026-03-22 20:19 by edmund7
[考研] 315分,诚求调剂,材料与化工085600 +3 13756423260 2026-03-22 3/150 2026-03-22 20:11 by edmund7
[考研] 306求调剂 +5 来好运来来来 2026-03-22 5/250 2026-03-22 16:17 by BruceLiu320
[考研] 一志愿中南化学(0703)总分337求调剂 +9 niko- 2026-03-19 10/500 2026-03-22 16:08 by ColorlessPI
[考研] 一志愿 西北大学 ,070300化学学硕,总分287,双非一本,求调剂。 +3 晨昏线与星海 2026-03-20 3/150 2026-03-22 16:00 by ColorlessPI
[考研] 318求调剂 +4 plum李子 2026-03-21 7/350 2026-03-22 14:17 by ColorlessPI
[考研] 085600材料与化工306 +4 z1z2z3879 2026-03-21 4/200 2026-03-21 23:44 by ms629
[考研] 材料工程专硕 348分求调剂 +3 冬辞. 2026-03-17 5/250 2026-03-21 18:47 by 学员8dgXkO
[考研] 278求调剂 +9 烟火先于春 2026-03-17 9/450 2026-03-21 17:47 by 学员8dgXkO
[考研] 265求调剂 +3 Jack?k?y 2026-03-17 3/150 2026-03-21 03:17 by JourneyLucky
[考研] 化学求调剂 +4 临泽境llllll 2026-03-17 5/250 2026-03-21 02:23 by JourneyLucky
[考研] 296求调剂 +6 www_q 2026-03-18 10/500 2026-03-20 23:56 by JourneyLucky
[考研] 308求调剂 +3 阿姐阿姐家啊 2026-03-18 3/150 2026-03-20 23:24 by JourneyLucky
[考研] 304求调剂 +7 司空. 2026-03-18 7/350 2026-03-20 23:08 by JourneyLucky
[考研] 材料学硕318求调剂 +5 February_Feb 2026-03-19 5/250 2026-03-19 23:51 by 23Postgrad
[考研] 本科郑州大学物理学院,一志愿华科070200学硕,346求调剂 +4 我不是一根葱 2026-03-18 4/200 2026-03-19 09:11 by 浮云166
[考研] 【同济软件】软件(085405)考研求调剂 +3 2026eternal 2026-03-18 3/150 2026-03-18 19:09 by 搏击518
信息提示
请填处理意见