24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 2057  |  回复: 26

essen11

铜虫 (初入文坛)

[求助] 请帮忙编写一个perl程序处理文本 已有1人参与

现在我碰到这样一个问题,我有一个文本文件1.txt,内容如下:
>序列名字1(序列名字可以任意长度)ATGgcggggccccATAGGGGGGTTCCUTG。。。
>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。
>序列名字3CTGgggggggccccccgggggutg。。。。。。
后面还有很多序列

要求从这些序列里面筛选出包含一小段子序列(譬如ccccAg)的序列,以上面的三个序列为例,返回的序列文件应该是
>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。。。。
后面还有很多序列。

由于序列1,3不包含这个短序列所以被删除了。

请问怎样编写一个perl程序处理上面的问题啊?谢谢了
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

任天青

金虫 (小有名气)

【答案】应助回帖


感谢参与,应助指数 +1
xzhdty: 金币+1, 谢谢参与 2012-05-04 23:28:41
我只懂一点点,希望能帮到你。
把程序另存为find.pl
运行时输入: perl  find.pl 1.txt

程序部分:

#!/usr/bin/perl
use strict;
use warnings;

my $subseq="ccccAg";
my $seq;
my $title;
open OUTFILE, ">>outfile.txt";
while(<>{

        if (/>(\w+) (\w+)/) {
                 $title=$1;
                $seq=$2;
                if ($seq=~/$subseq/) {
                        print ">$title\n";
                        print OUTFILE ">$title\n";
                        print OUTFILE "$seq\n";
                }
       
        }

}

close OUTFILE;
实验虐我千百遍,我待实验如初恋...
4楼2012-05-04 20:16:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jackie1179

木虫 (正式写手)

对不起忘了贴代码,补上:
#!/usr/bin/perl
use strict;
use warnings;

my $subseq=$ARGV[1];
my $seq;
my $title;
open IN,"<$ARGV[0]";
open OUTFILE, ">outfile.txt";
while({
  if (/$subseq/) {
    print OUTFILE "$_\n";
   
  }

}
close IN;
close OUTFILE;
9楼2012-05-07 09:13:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

cmdblock

银虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
用per写太麻烦,用grep吧
2楼2012-05-04 18:49:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

essen11

铜虫 (初入文坛)

引用回帖:
2楼: Originally posted by cmdblock at 2012-05-04 18:49:29:
用per写太麻烦,用grep吧

可是grep也不会啊,现在完全不懂编程。
3楼2012-05-04 19:46:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

任天青

金虫 (小有名气)

那个,是右括号)
实验虐我千百遍,我待实验如初恋...
5楼2012-05-04 20:18:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

essen11

铜虫 (初入文坛)

引用回帖:
5楼: Originally posted by 任天青 at 2012-05-04 20:18:01:
那个,是右括号)

ok,thank you very much!!!先运行一下啊,要是成功的话,真不知道怎么感谢你了!!
6楼2012-05-05 12:53:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

essen11

铜虫 (初入文坛)

引用回帖:
5楼: Originally posted by 任天青 at 2012-05-04 20:18:01:
那个,是右括号)

怎么那么快就运行完了,而且输出文件里什么都没有,空文件一个。
7楼2012-05-05 12:56:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jackie1179

木虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
对前面的稍加改下就可以了:
程序保存为find.pl
在终端输入:perl ./find.pl  1.txt   substring
find.pl 和1.txt放在同一目录下,确保切换到find.pl所在目录,substring为你要找的子序列
结果输出到outfile.txt中
8楼2012-05-07 09:12:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

essen11

铜虫 (初入文坛)

引用回帖:
9楼: Originally posted by jackie1179 at 2012-05-07 09:13:33:
对不起忘了贴代码,补上:
#!/usr/bin/perl
use strict;
use warnings;

my $subseq=$ARGV;
my $seq;
my $title;
open IN,"<$ARGV";
open OUTFILE, ">outfile.txt";
while(&l ...

你好,请问怎样将序列名称一起输出啊?这个程序。
10楼2012-05-07 09:47:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 essen11 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 一志愿南科大生物学297分,求调剂推荐 +5 Y-yyusx 2026-04-06 6/300 2026-04-06 19:53 by lijunpoly
[考研] 一志愿郑州大学材料与化工085600,求调剂 +27 吃的不少 2026-04-02 27/1350 2026-04-06 15:19 by 495374996
[考研] 材料专硕322 +11 哈哈哈吼吼吼哈 2026-04-05 11/550 2026-04-06 14:07 by lqwchd
[考研] 302分求调剂 一志愿安徽大学085601 +9 zyx上岸! 2026-04-04 9/450 2026-04-06 13:05 by 猪会飞
[考研] 调剂 +9 不逢春 2026-04-05 10/500 2026-04-06 11:58 by 考研学校招点人
[考研] 085500机械专硕初试288求调剂 +3 GZJguo666- 2026-04-05 3/150 2026-04-05 18:06 by jkddd
[考研] 283分求调剂 +9 试试看呗 2026-04-04 9/450 2026-04-05 10:27 by 果冻大王
[考研] 0835学硕299求调剂 08大类可接受 +5 useryy 2026-04-03 5/250 2026-04-04 20:07 by 蓝云思雨
[考研] 363求调剂 +7 zh096 2026-04-04 7/350 2026-04-04 17:13 by dongzh2009
[考研] 一志愿中国石油大学化学工程323分求调剂 +4 化工专硕323分 2026-04-03 6/300 2026-04-03 22:12 by dongzh2009
[考研] 081200-11408-276学硕求调剂 +5 崔wj 2026-04-03 5/250 2026-04-03 15:06 by arrow8852
[考研] 315分 085602 求调剂 +15 26考研上岸版26 2026-04-02 15/750 2026-04-03 12:45 by xingguangj
[考研] 初试成绩337找调剂 +3 ??? ?. ? 2026-04-03 3/150 2026-04-03 11:43 by 土木硕士招生
[考研] 土木水利328分求调剂 +6 疾风知劲草666 2026-04-02 6/300 2026-04-03 11:38 by znian
[考研] 复试调剂 +3 bvzz 2026-04-01 3/150 2026-04-03 09:47 by 蓝云思雨
[考研] 302求调剂 +9 zyx上岸! 2026-04-02 9/450 2026-04-02 23:07 by 马儿快快地跑
[考研] 土木304求调剂 +6 兔突突突, 2026-03-31 7/350 2026-04-02 09:06 by coolminer
[考研] 339求调剂 +5 zjjkt 2026-03-31 5/250 2026-04-01 09:18 by JourneyLucky
[考研] 求调剂:一志愿:南京大学 专业:0705 总分320 ,本科985,四六级已过 +3 lfy760306 2026-03-31 3/150 2026-04-01 01:57 by Creta
[考研] 085601英二数二求调剂 总分325 +4 余航航 2026-03-31 4/200 2026-03-31 17:38 by 唐沐儿
信息提示
请填处理意见