24小时热门版块排行榜    

CyRhmU.jpeg
查看: 8341  |  回复: 21
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

seamas_gao1

银虫 (小有名气)

[求助] 转录组测序结果的“raw data”和“clean data”里为什么全是100bp的序列?已有3人参与

我测了几个转录组样品,测序公司把“raw data”和“clean data”,都给我了,都是fq格式的文件,每个大概5个G。我打开发现里面全都是100 bp的序列,请问这正常吗?QC和拼接都是用这些100bp的序列吗?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

addict_cy

金虫 (小有名气)

★ ★
gyesang: 金币+2, 鼓励回帖交流! 2014-04-30 14:26:20
引用回帖:
14楼: Originally posted by seamas_gao1 at 2014-04-14 08:56:14
请问测序时用到的“100倍覆盖”,它的意思是不是就是将完整的转录组随机打断100次,之后再进行拼接呢?...

以人的基因组为例,总共3G bp, 如果总测序量是90G(90bp*1G reads),则基因组上每个位点平均被覆盖30次,叫做30X覆盖;注意这不意味着每个位点都有30次覆盖,实际上是一个分布;
转录组的话,由于每个基因表达量差别很大,所以讨论100倍覆盖其实没有意义.

» 本帖已获得的红花(最新10朵)

15楼2014-04-14 14:22:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 22 个回答

bio-li

金虫 (小有名气)


myprayer: 金币+1, 赠人玫瑰手有余香,分子生物期待你更多精彩。 2014-03-31 12:41:42
拼接用的是clean data,raw data不能用的,你这测序采用的是什么平台
你不能解决问题,你就会成为问题
3楼2014-03-31 12:09:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

seamas_gao1

银虫 (小有名气)

引用回帖:
3楼: Originally posted by bio-li at 2014-03-31 12:09:23
拼接用的是clean data,raw data不能用的,你这测序采用的是什么平台

我正是准备用clean data来拼接,用的是Illumina,我只是不明白为什么clean data全都是100 bp的序列,这正常吗?
4楼2014-04-01 08:00:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

洛基殿下~

捐助贵宾 (小有名气)


【答案】应助回帖

商家已经主动声明此回帖可能含有宣传内容
★ ★ ★ ★ ★ ★ ★
seamas_gao1(西门吹雪170代发): 金币+2, 鼓励热心回帖交流 2014-04-01 13:18:40
seamas_gao1: 金币+5, ★★★很有帮助, 十分感谢 2014-04-14 08:44:58
引用回帖:
4楼: Originally posted by seamas_gao1 at 2014-04-01 08:00:38
我正是准备用clean data来拼接,用的是Illumina,我只是不明白为什么clean data全都是100 bp的序列,这正常吗?...

正常的,如果是转录组、DNA重测序,illumina平台一般都是采用PE100测序,测序的过程中都是测DNA片断2端各100bp,所以下机出来的都是100bp的片断。

raw data是原始下机数据,clean data是经过过滤处理后留下的数据,该数据用于后续的生物信息分析。
5楼2014-04-01 10:58:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见