版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

北京石油化工学院2026年研究生招生接收调剂公告

返回列表

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

湖人湖人

铁杆木虫 (小有名气)

应助: 1 (幼儿园)
金币: 5359.2
帖子: 85
在线: 244.8小时
虫号: 584191
注册: 2008-08-01
专业: 植物遗传学

[求助] 请帮忙编写一个perl程序处理文本(提取GI号) 已有1人参与

现在我碰到这样一个问题，我有一个文本文件1.txt，是Blastx的结果，内容如下：
gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,33.96,106,70,0,406,723,256,361,5e-014,72.0
gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,30.43,161,107,3,244,711,28,188,7e-013,68.2
gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,32.31,130,84,2,334,711,180,309,1e-012,67.4
gi|293567065|gb|FS329521.1|FS329521,gi|388506924|gb|AFK41528.1|,42.27,220,115,1,107,766,67,274,9e-043, 167
gi|293567064|gb|FS329520.1|FS329520,gi|388510998|gb|AFK43565.1|,80.84,167,32,0,239,739,16,182,1e-079, 289
。。。。。。
后面还有很多序列，总共大概3M左右。
现在想提取前面核酸序列的GI号：gi|293567070，gi|293567065。。。输出为txt文本，其中重复的只输出一个，
另外，再输出一个文本，提取后面蛋白序列的GI号：gi|219980050，gi|388506924。。。重复的也是只输出一个。
各位大虾，请问怎样编写一个perl程序处理上面的问题啊？谢谢了！

回复此楼

» 猜你喜欢

一志愿河北工业大学0817化工278分求调剂已经有15人回复
085601材料工程找调剂已经有15人回复
材料与化工272求调剂已经有15人回复
085600 286分材料求调剂已经有10人回复
南京大学化学调剂已经有14人回复
一志愿北京工业大学，324分求调剂已经有6人回复
求调剂已经有5人回复
281求调剂已经有6人回复
26申博自荐已经有6人回复
一志愿哈尔滨工业大学材料与化工方向336分已经有10人回复

» 本主题相关价值贴推荐，对您同样有帮助:

请帮忙编写一个perl程序处理文本已经有26人回复
Perl 生物信息学编程求助，运行出现问题，烦请帮忙查找一下错误，谢谢！已经有3人回复
编写一个程序处理文本内容，删除长度<10，开头的，不以CTG结尾的那些序列已经有7人回复
请教Windows系统下perl脚本的ARGV应用问题，谢谢已经有5人回复
求助用perl语言编一个程序把一个文件分成两个文件已经有3人回复
程序语言版拟开新子版“Shell&Perl&Python” 已经有10人回复
写了一个fortran90的小程序，编译通不过，请大侠帮忙已经有59人回复
求助一个perl 使用svg，最好要中文的。谢谢！已经有1人回复

1楼 2012-06-25 11:57:12

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

wx8359166

铁虫 (初入文坛)

应助: 0 (幼儿园)
金币: 134
帖子: 8
在线: 5.1小时
虫号: 1872503
注册: 2012-06-29
性别: GG
专业: 生物信息学

必须正则表达式啊

赞一下

回复此楼

6楼2012-06-29 16:39:02

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 9 个回答

longwen36

铁杆木虫 (正式写手)

应助: 11 (小学生)
金币: 6165.9
红花: 16
帖子: 344
在线: 208.4小时
虫号: 766090
注册: 2009-05-08
性别: GG
专业: 功能陶瓷

用正则表达式吧，规律一样的话。用matlab我会。

赞一下

回复此楼

2楼2012-06-25 12:49:44

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

christina1213

木虫 (正式写手)

应助: 6 (幼儿园)
金币: 4201.9
散金: 20
帖子: 657
在线: 117.7小时
虫号: 599542
注册: 2008-09-11
专业: 生物信息学

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与，应助指数 +1
湖人湖人: 金币+10, ★有帮助, 用Excel删除重复项 2012-06-25 21:57:16
xzhdty: 金币+1, 谢谢 2012-06-26 06:19:02
湖人湖人: 金币+10, ★★★很有帮助 2012-06-26 21:02:39

#!/usr/bin/perl
use strict;
use warnings;

open (IN, "<1.txt"

;
open (OUT, ">>out.txt"

;

while (my $line= {
my @cut=split("|gb|",$line);
print OUT $cut[0]."\n";
}
close IN;
close OUT;
去重的话用EXCEL吧，一下就搞定了，不用写程序。

赞一下

回复此楼

3楼2012-06-25 20:04:52

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

libralibra

至尊木虫 (著名写手)

骠骑将军

程序强帖: 40
应助: 817 (博后)
金币: 12914.1
红花: 64
帖子: 2238
在线: 287.3小时
虫号: 696514
注册: 2009-02-05
专业: 计算机软件

【答案】应助回帖

感谢参与，应助指数 +1

python的解法:正则+map数据结构应该是最简单的.
不知道perl有没有map类似的数据结构.
正则提取数据,map去重

赞一下(1人)

回复此楼

matlab/VB/python/c++/Java写程序请发QQ邮件:790404545@qq.com

4楼2012-06-26 00:04:46

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 9 个回答

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考研] 085601材料工程找调剂 +14	oatmealR 2026-03-29	15/750	2026-03-29 21:48 by plmuchong
[考研] 298求调剂 +3	种圣赐 2026-03-29	3/150	2026-03-29 12:06 by longlotian
[考研] 305求调剂 +8	RuiFairyrui 2026-03-28	8/400	2026-03-29 08:22 by fmesaito
[考研] 本科新能源科学与工程，一志愿华理能动285求调剂 +7	AZMK 2026-03-28	11/550	2026-03-28 21:01 by xxxsssccc
[考研] 一志愿南昌大学324求调剂 +7	hanamiko 2026-03-27	7/350	2026-03-28 09:56 by 李上岸0921
[考研] 085404求调剂，总分309，本科经历较为丰富 +4	来财aa 2026-03-25	4/200	2026-03-28 07:41 by 棒棒球手
[考研] 085701环境工程求调剂 +9	多久上课 2026-03-27	9/450	2026-03-28 03:58 by fmesaito
[考研] 化学调剂 +4	爱吃番茄的旭 2026-03-24	5/250	2026-03-27 17:50 by kiokin
[考研] 0856调剂 +5	求求让我有书读� 2026-03-26	6/300	2026-03-27 15:12 by caszguilin
[考研] 考研调剂 +10	呼呼？~+123456 2026-03-24	10/500	2026-03-27 11:46 by wangjy2002
[考研] 求调剂323材料与化工 +7	1124361 2026-03-24	7/350	2026-03-27 10:22 by wangjy2002
[考研] 324求调剂 +8	hanamiko 2026-03-26	10/500	2026-03-27 08:06 by hypershenger
[考研] 341求调剂 +7	青柠檬1 2026-03-26	7/350	2026-03-27 00:19 by wxiongid
[考研] 材料与化工304求B区调剂 +3	邱gl 2026-03-26	6/300	2026-03-26 18:03 by 邱gl
[考研] 085602化学工程求调剂。 +4	平乐乐乐 2026-03-26	4/200	2026-03-26 17:57 by fmesaito
[考研] 332求调剂 +6	032500 2026-03-25	6/300	2026-03-25 22:45 by 418490947
[考研] 296求调剂 +4	汪！？！ 2026-03-25	7/350	2026-03-25 16:41 by 汪！？！
[考研] 【2026考研调剂】制药工程 284分求相关专业调剂名额 +4	袁奂奂 2026-03-25	8/400	2026-03-25 14:32 by lbsjt
[考研] 各位老师您好：本人初试372分 +5	jj涌77 2026-03-25	6/300	2026-03-25 14:15 by mapenggao
[考研] 341求调剂(一志愿湖南大学070300) +5	番茄头--- 2026-03-22	6/300	2026-03-23 23:45 by Txy@872106