24小时热门版块排行榜    

查看: 1928  |  回复: 26
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

essen11

铜虫 (初入文坛)

[求助] 请帮忙编写一个perl程序处理文本已有1人参与

现在我碰到这样一个问题,我有一个文本文件1.txt,内容如下:
>序列名字1(序列名字可以任意长度)ATGgcggggccccATAGGGGGGTTCCUTG。。。
>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。
>序列名字3CTGgggggggccccccgggggutg。。。。。。
后面还有很多序列

要求从这些序列里面筛选出包含一小段子序列(譬如ccccAg)的序列,以上面的三个序列为例,返回的序列文件应该是
>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。。。。
后面还有很多序列。

由于序列1,3不包含这个短序列所以被删除了。

请问怎样编写一个perl程序处理上面的问题啊?谢谢了
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

essen11

铜虫 (初入文坛)

引用回帖:
9楼: Originally posted by jackie1179 at 2012-05-07 09:13:33:
对不起忘了贴代码,补上:
#!/usr/bin/perl
use strict;
use warnings;

my $subseq=$ARGV;
my $seq;
my $title;
open IN,"<$ARGV";
open OUTFILE, ">outfile.txt";
while(&l ...

你好,请问怎样将序列名称一起输出啊?这个程序。
10楼2012-05-07 09:47:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 27 个回答

cmdblock

银虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
用per写太麻烦,用grep吧
2楼2012-05-04 18:49:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

essen11

铜虫 (初入文坛)

引用回帖:
2楼: Originally posted by cmdblock at 2012-05-04 18:49:29:
用per写太麻烦,用grep吧

可是grep也不会啊,现在完全不懂编程。
3楼2012-05-04 19:46:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

任天青

金虫 (小有名气)

【答案】应助回帖


感谢参与,应助指数 +1
xzhdty: 金币+1, 谢谢参与 2012-05-04 23:28:41
我只懂一点点,希望能帮到你。
把程序另存为find.pl
运行时输入: perl  find.pl 1.txt

程序部分:

#!/usr/bin/perl
use strict;
use warnings;

my $subseq="ccccAg";
my $seq;
my $title;
open OUTFILE, ">>outfile.txt";
while(<>{

        if (/>(\w+) (\w+)/) {
                 $title=$1;
                $seq=$2;
                if ($seq=~/$subseq/) {
                        print ">$title\n";
                        print OUTFILE ">$title\n";
                        print OUTFILE "$seq\n";
                }
       
        }

}

close OUTFILE;
实验虐我千百遍,我待实验如初恋...
4楼2012-05-04 20:16:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见