| 查看: 1457 | 回复: 8 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
[求助]
请帮忙编写一个perl程序处理文本(提取GI号) 已有1人参与
|
||
|
现在我碰到这样一个问题,我有一个文本文件1.txt,是Blastx的结果,内容如下: gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,33.96,106,70,0,406,723,256,361,5e-014,72.0 gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,30.43,161,107,3,244,711,28,188,7e-013,68.2 gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,32.31,130,84,2,334,711,180,309,1e-012,67.4 gi|293567065|gb|FS329521.1|FS329521,gi|388506924|gb|AFK41528.1|,42.27,220,115,1,107,766,67,274,9e-043, 167 gi|293567064|gb|FS329520.1|FS329520,gi|388510998|gb|AFK43565.1|,80.84,167,32,0,239,739,16,182,1e-079, 289 。。。。。。 后面还有很多序列,总共大概3M左右。 现在想提取前面核酸序列的GI号:gi|293567070,gi|293567065。。。输出为txt文本,其中重复的只输出一个, 另外,再输出一个文本,提取后面蛋白序列的GI号:gi|219980050,gi|388506924。。。重复的也是只输出一个。 各位大虾,请问怎样编写一个perl程序处理上面的问题啊?谢谢了! |
» 猜你喜欢
上海工程技术大学【激光智能制造】课题组招收硕士
已经有6人回复
带资进组求博导收留
已经有11人回复
自荐读博
已经有5人回复
求个博导看看
已经有16人回复
上海工程技术大学张培磊教授团队招收博士生
已经有4人回复
求助院士们,这个如何合成呀
已经有4人回复
临港实验室与上科大联培博士招生1名
已经有9人回复
写了一篇“相变储能技术在冷库中应用”的论文,论文内容以实验为主,投什么期刊合适?
已经有6人回复
最近几年招的学生写论文不引自己组发的文章
已经有11人回复
中科院杭州医学所招收博士生一名(生物分析化学、药物递送)
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
请帮忙编写一个perl程序处理文本
已经有26人回复
Perl 生物信息学编程求助,运行出现问题,烦请帮忙查找一下错误,谢谢!
已经有3人回复
编写一个程序处理文本内容,删除长度<10,开头的,不以CTG结尾的那些序列
已经有7人回复
请教Windows系统下perl脚本的ARGV应用问题,谢谢
已经有5人回复
求助用perl语言编一个程序把一个文件分成两个文件
已经有3人回复
程序语言版拟开新子版“Shell&Perl&Python”
已经有10人回复
写了一个fortran90的小程序,编译通不过,请大侠帮忙
已经有59人回复
求助一个perl 使用svg,最好要中文的。谢谢!
已经有1人回复
7楼2012-06-30 21:11:33
longwen36
铁杆木虫 (正式写手)
- 应助: 11 (小学生)
- 金币: 6165.9
- 红花: 16
- 帖子: 344
- 在线: 208.4小时
- 虫号: 766090
- 注册: 2009-05-08
- 性别: GG
- 专业: 功能陶瓷
2楼2012-06-25 12:49:44
christina1213
木虫 (正式写手)
- 应助: 6 (幼儿园)
- 金币: 4201.9
- 散金: 20
- 帖子: 657
- 在线: 117.7小时
- 虫号: 599542
- 注册: 2008-09-11
- 专业: 生物信息学
【答案】应助回帖
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
湖人湖人: 金币+10, ★有帮助, 用Excel删除重复项 2012-06-25 21:57:16
xzhdty: 金币+1, 谢谢 2012-06-26 06:19:02
湖人湖人: 金币+10, ★★★很有帮助 2012-06-26 21:02:39
感谢参与,应助指数 +1
湖人湖人: 金币+10, ★有帮助, 用Excel删除重复项 2012-06-25 21:57:16
xzhdty: 金币+1, 谢谢 2012-06-26 06:19:02
湖人湖人: 金币+10, ★★★很有帮助 2012-06-26 21:02:39
|
#!/usr/bin/perl use strict; use warnings; open (IN, "<1.txt" ;open (OUT, ">>out.txt" ;while (my $line= my @cut=split("|gb|",$line); print OUT $cut[0]."\n"; } close IN; close OUT; 去重的话用EXCEL吧,一下就搞定了,不用写程序。 |
3楼2012-06-25 20:04:52
libralibra
至尊木虫 (著名写手)
骠骑将军
- 程序强帖: 40
- 应助: 817 (博后)
- 金币: 12914.1
- 红花: 64
- 帖子: 2238
- 在线: 287.3小时
- 虫号: 696514
- 注册: 2009-02-05
- 专业: 计算机软件

4楼2012-06-26 00:04:46







回复此楼
;