24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 2096  |  回复: 18

XOooZzz

银虫 (小有名气)

能不能贴一小段上来看看是什么样子的?我最近在学编程,看能不能给你写个小程序
11楼2014-03-02 12:41:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
11楼: Originally posted by XOooZzz at 2014-03-02 12:41:11
能不能贴一小段上来看看是什么样子的?我最近在学编程,看能不能给你写个小程序

比如这两个fastq文件的两段序列:
文件1:
@DHDC08P1_0325:4:1101:1291:2243#GATCAG/1
TGTATGATTTCGAACTTGGCGC
+DHDC08P1_0325:4:1101:1291:2243#GATCAG/1
__^ccdeefgggghgfhhhhhf
@DHDC08P1_0325:4:1101:1843:2157#GATCAG/1
TCTCGGACCAGGCTTCATTCC
+DHDC08P1_0325:4:1101:1843:2157#GATCAG/1
^^\accccgccceZf`gYe^S
@DHDC08P1_0325:4:1101:2447:2199#GATCAG/1
ACCGTGTTGTGATTTAGAGGCACA
+DHDC08P1_0325:4:1101:2447:2199#GATCAG/1
___eacccgeeggihihihdgdgi

文件2:
@DHDC08P1_0325:4:1101:1291:2243#GATCAG/2
GCGCCAAGTTCGAAATCATACA
+DHDC08P1_0325:4:1101:1291:2243#GATCAG/2
___c`c]cggcg`f\dJ`dg_g
@DHDC08P1_0325:4:1101:1843:2157#GATCAG/2
GGAATGAAGCCTGGTCCGAGA
+DHDC08P1_0325:4:1101:1843:2157#GATCAG/2
Z_ZZ`Zacacggcg`e^effa
@DHDC08P1_0325:4:1101:2447:2199#GATCAG/2
TGTGCCTCTAAATCACAACACGGT
+DHDC08P1_0325:4:1101:2447:2199#GATCAG/2
_b_cceeeggffgiiihiiiiihe

这些看起来好像都正好,但不能保证所有序列都这么整齐。
我想到了两种替换层次:1,/1和/2中每个对应碱基依质量值的替换;
2,/1和/2中每两条对应序列的替换。
对我难度比较大,你看看能实现不……
每天都为自己的无知而羞耻!
12楼2014-03-03 15:01:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

XOooZzz

银虫 (小有名气)

引用回帖:
12楼: Originally posted by yuehedou at 2014-03-03 15:01:18
比如这两个fastq文件的两段序列:
文件1:
@DHDC08P1_0325:4:1101:1291:2243#GATCAG/1
TGTATGATTTCGAACTTGGCGC
+DHDC08P1_0325:4:1101:1291:2243#GATCAG/1
__^ccdeefgggghgfhhhhhf
@DHDC08P1_0325:4:1101:18 ...

没看明白你的量种替换方法...是这样的意思吗:
1、两个对应的序列逐个碱基比较,保留质量高的那个碱基。最终得到的单一序列里可能有部分碱基来自序列1,部分来自序列2。
2、没看懂....

刚瞄了一下fastq格式,所谓的质量值,只要取其ascii码直接比较就可以了吧?ascii码越大质量越高是吧?
13楼2014-03-03 16:12:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
13楼: Originally posted by XOooZzz at 2014-03-03 16:12:25
没看明白你的量种替换方法...是这样的意思吗:
1、两个对应的序列逐个碱基比较,保留质量高的那个碱基。最终得到的单一序列里可能有部分碱基来自序列1,部分来自序列2。
2、没看懂....

刚瞄了一下fastq格式, ...

2的意思是,如果实现1比较困难,就做简单的:算出整条序列的总质量值(每个碱基的加和),再比较两条对应序列的总质量值大小。
我这些序列的质量值是illumina的offset 64系列的,但仍然是与ascii大小对应,你试试?
每天都为自己的无知而羞耻!
14楼2014-03-03 23:06:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

XOooZzz

银虫 (小有名气)

★ ★
西门吹雪170: 金币+2, 鼓励回帖交流 2014-03-05 11:48:22
内容已删除
15楼2014-03-04 09:23:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
15楼: Originally posted by XOooZzz at 2014-03-04 09:23:04
呃,要实现这两种方法的话分别有这些问题:
方法1:
困难在于如果序列1和序列2不保证长度相等且碱基位置一一对应的话,首先要写一个两序列比对的算法。这个我做不来。

方法2:
总质量值怎么算?直接相加的话 ...

哦,我都没想到这么多……看来还真不容易,我可能要和公司给我的分析结果一样,只分析一个文件了……
谢谢你非常细心的关注和思考!
其实有时候我又有这样的想法:其实每两个序列的筛选都可以看做是极端的序列拼接操作(最终得到一条序列),如果有这样一个拼接软件,能用它实现两个fastq序列的拼接,而这种拼接时对于匹配区那些错配碱基的取舍是根据其质量值的大小来做决定的,这样一来,我的目的也就达到了。——不过当然我也还没见到过这种软件。
每天都为自己的无知而羞耻!
16楼2014-03-05 09:34:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

XOooZzz

银虫 (小有名气)

【答案】应助回帖

引用回帖:
16楼: Originally posted by yuehedou at 2014-03-05 09:34:10
哦,我都没想到这么多……看来还真不容易,我可能要和公司给我的分析结果一样,只分析一个文件了……
谢谢你非常细心的关注和思考!
其实有时候我又有这样的想法:其实每两个序列的筛选都可以看做是极端的序列拼 ...

这个我也不太懂。不过如果你能对方法2定下一个明确的评价方案的话,我之后可以找个时间给你写个小程序。
17楼2014-03-07 14:32:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cfl88gupan

金虫 (正式写手)

这位哥啊,我也测序了,但是现在面对的问题是,novel居然有八百多个,我自己都不相信啊 你碰到了这个问题嘛?该怎么办呢有什么意见不?
你还行的
18楼2014-03-08 16:04:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
18楼: Originally posted by cfl88gupan at 2014-03-08 16:04:53
这位哥啊,我也测序了,但是现在面对的问题是,novel居然有八百多个,我自己都不相信啊 你碰到了这个问题嘛?该怎么办呢有什么意见不?

我还没做到那一步啊!
每天都为自己的无知而羞耻!
19楼2014-03-20 22:25:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yuehedou 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 本科211,293分请求调剂 +4 莲菜就是藕吧 2026-04-03 4/200 2026-04-04 05:18 by gswylq
[考研] 化学调剂求助 +6 LULONG1 2026-04-03 6/300 2026-04-03 23:13 by qzxyhcsy
[考研] 材料295 +11 小英11 2026-04-03 12/600 2026-04-03 22:35 by S240
[考研] 301求调剂 +15 骆驼男人 2026-04-02 15/750 2026-04-03 18:26 by ls刘帅
[考研] 一志愿华中农业071010,总分320求调剂 +7 困困困困坤坤 2026-04-02 7/350 2026-04-03 17:26 by Yuena_Wang
[考研] 315分 085602 求调剂 +15 26考研上岸版26 2026-04-02 15/750 2026-04-03 12:45 by xingguangj
[考研] 085801 总分275 本科新能源 求调剂 +19 bradoner 2026-04-01 23/1150 2026-04-03 10:07 by linyelide
[考研] 085600,320分求调剂 +6 大馋小子 2026-04-02 6/300 2026-04-02 21:54 by dongzh2009
[考研] 296求调剂 +4 sdhu 2026-04-02 4/200 2026-04-02 21:29 by baoball
[考研] 土木304求调剂 +4 兔突突突, 2026-04-02 5/250 2026-04-02 21:16 by 兔突突突,
[考研] 0856初试324分求调剂 +6 想上学求调 2026-04-01 6/300 2026-04-02 11:42 by 星空星月
[考研] 食品学硕362求调剂 +3 xuanxianxian 2026-04-01 3/150 2026-04-01 21:05 by 啊李999
[考研] 290求调剂 +5 dfffsar 2026-03-29 5/250 2026-04-01 19:45 by 6781022
[考研] 085600,320分求调剂 +5 大馋小子 2026-04-01 6/300 2026-04-01 19:40 by 唐沐儿
[考研] 285求调剂 +7 AZMK 2026-03-30 13/650 2026-04-01 17:00 by 七度不信任
[考研] 326求调剂 +4 崽崽仔 2026-03-31 4/200 2026-04-01 09:58 by 我的船我的海
[考研] 一志愿北京科技大学085601材料工程英一数二初试总分335求调剂 +5 双马尾痞老板2 2026-03-31 5/250 2026-04-01 09:04 by oooqiao
[考研] 085404 22408 315分 +5 zhuangyan123 2026-03-31 6/300 2026-03-31 13:48 by limeifeng
[考研] 285求调剂 +6 AZMK 2026-03-29 9/450 2026-03-30 21:02 by dophin1985
[考研] 348求调剂 +6 小懒虫不懒了 2026-03-28 6/300 2026-03-30 10:29 by Evan_Liu
信息提示
请填处理意见