24小时热门版块排行榜    

查看: 1924  |  回复: 18
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

yuehedou

木虫 (小有名气)

[求助] 有人做过或接触过microRNA的paired-end测序数据分析吗

我的两个植物样,送去做microRNA的illumina HiSeq测序,公司给我送回来的数据是paired-end类型的,每个样品都有两个同样大小的序列文件,分别存储microRNA的序列及其反向互补序列。
现在在前期过滤序列时遇到了问题了,同一个样品的两份数据因为其测序质量不一样,过滤掉的reads就可能不一样。我的问题是后续分析都只需一个样品的一份数据,这样在最终获得clean reads时,就需要有所取舍,现在不知道该怎么办了,求教各位大牛赐教?!
我现在有三种想法:1. 保留一份数据;2. 把两份数据加和起来;3. 保留两个文件中相同的序列的一份,外加不同的质量高的那条序列(这个难度比较大,还没想好怎么做)。
以前看过microRNA的文献资料描述的基本都是single end的,很少看到paired-end的,如果有人有这方面的文献资料或好的软件,也可以分享给我啊,先谢谢诸位了!
回复此楼
每天都为自己的无知而羞耻!
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
15楼: Originally posted by XOooZzz at 2014-03-04 09:23:04
呃,要实现这两种方法的话分别有这些问题:
方法1:
困难在于如果序列1和序列2不保证长度相等且碱基位置一一对应的话,首先要写一个两序列比对的算法。这个我做不来。

方法2:
总质量值怎么算?直接相加的话 ...

哦,我都没想到这么多……看来还真不容易,我可能要和公司给我的分析结果一样,只分析一个文件了……
谢谢你非常细心的关注和思考!
其实有时候我又有这样的想法:其实每两个序列的筛选都可以看做是极端的序列拼接操作(最终得到一条序列),如果有这样一个拼接软件,能用它实现两个fastq序列的拼接,而这种拼接时对于匹配区那些错配碱基的取舍是根据其质量值的大小来做决定的,这样一来,我的目的也就达到了。——不过当然我也还没见到过这种软件。
每天都为自己的无知而羞耻!
16楼2014-03-05 09:34:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 19 个回答

中丘子

捐助贵宾 (小有名气)


【答案】应助回帖


感谢参与,应助指数 +1
yuehedou: 金币+1, 有帮助, 感谢参与 2014-02-28 21:13:36
你们为什么不直接让测序公司帮你们分析一下呢,至少可以当面向他们请教下吧。他们应是有这个义务的。

[ 发自手机版 http://muchong.com/3g ]
2楼2014-02-28 16:53:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

中丘子

捐助贵宾 (小有名气)


【答案】应助回帖

你们为什么不直接让测序公司帮你们分析一下呢,至少可以当面向他们请教下吧。他们应是有这个义务的。

[ 发自手机版 http://muchong.com/3g ]
3楼2014-02-28 16:54:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyang636

木虫 (著名写手)

请问为啥microRNA 还要测PE呢?
4楼2014-02-28 21:02:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见