| 查看: 1467 | 回复: 8 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
[求助]
请帮忙编写一个perl程序处理文本(提取GI号) 已有1人参与
|
||
|
现在我碰到这样一个问题,我有一个文本文件1.txt,是Blastx的结果,内容如下: gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,33.96,106,70,0,406,723,256,361,5e-014,72.0 gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,30.43,161,107,3,244,711,28,188,7e-013,68.2 gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,32.31,130,84,2,334,711,180,309,1e-012,67.4 gi|293567065|gb|FS329521.1|FS329521,gi|388506924|gb|AFK41528.1|,42.27,220,115,1,107,766,67,274,9e-043, 167 gi|293567064|gb|FS329520.1|FS329520,gi|388510998|gb|AFK43565.1|,80.84,167,32,0,239,739,16,182,1e-079, 289 。。。。。。 后面还有很多序列,总共大概3M左右。 现在想提取前面核酸序列的GI号:gi|293567070,gi|293567065。。。输出为txt文本,其中重复的只输出一个, 另外,再输出一个文本,提取后面蛋白序列的GI号:gi|219980050,gi|388506924。。。重复的也是只输出一个。 各位大虾,请问怎样编写一个perl程序处理上面的问题啊?谢谢了! |
» 猜你喜欢
2025年遐想
已经有4人回复
投稿Elsevier的杂志(返修),总是在选择OA和subscription界面被踢皮球
已经有8人回复
自然科学基金委宣布启动申请书“瘦身提质”行动
已经有4人回复
求个博导看看
已经有18人回复
» 本主题相关价值贴推荐,对您同样有帮助:
请帮忙编写一个perl程序处理文本
已经有26人回复
Perl 生物信息学编程求助,运行出现问题,烦请帮忙查找一下错误,谢谢!
已经有3人回复
编写一个程序处理文本内容,删除长度<10,开头的,不以CTG结尾的那些序列
已经有7人回复
请教Windows系统下perl脚本的ARGV应用问题,谢谢
已经有5人回复
求助用perl语言编一个程序把一个文件分成两个文件
已经有3人回复
程序语言版拟开新子版“Shell&Perl&Python”
已经有10人回复
写了一个fortran90的小程序,编译通不过,请大侠帮忙
已经有59人回复
求助一个perl 使用svg,最好要中文的。谢谢!
已经有1人回复
longwen36
铁杆木虫 (正式写手)
- 应助: 11 (小学生)
- 金币: 6165.9
- 红花: 16
- 帖子: 344
- 在线: 208.4小时
- 虫号: 766090
- 注册: 2009-05-08
- 性别: GG
- 专业: 功能陶瓷
2楼2012-06-25 12:49:44







回复此楼