24小时热门版块排行榜    

查看: 643  |  回复: 4
【悬赏金币】回答本帖问题,作者shuifeng1988将赠送您 10 个金币
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

shuifeng1988

金虫 (小有名气)

木虫

[求助] ubuntu10.10 中脚本求助

我在桌面上有一个in文件夹和一个out文件夹,in文件夹中有十个不同的文件,如a.fas, b.fas, c.fas ......., 每个文件内容如下所示(每个文件有多条序列,每条序列名都在>号后面,序列名要保留和原来一样)!我想将每条序列的最后面20个碱基除去,然后用相同的文件名字保存在out文件夹中,我应该如何写脚本!


>Myotis ricketti
ATGGATCATGCTGAAGAAACTGAAATCCTTGCAGCGGCCCAGAAGTACTATGTGGACAGG
CCTATCTTCAGTCACCTGGCCCTCCAGGAAATACTGCACACGAAGGACAAGATTCCGGAT
TCCATTGGGGATAAGCTAAAACAGGCATTCACATGTACTCCGAAGAAAATAAGAAATATC
ATTTATATGTTCTTACCCATAACTAAGTGGTTGCCAGCATACAAATTCAAGGAGTATGTG
TTGGGTGACTTGGTCTCAGGCATTAGCACAGGGGTGCTTCAGCTTCCTCAAGGCTTAGCC
TTCGCAATGTTGGCAGCTGTGCCTCCGGTGTTCGGCCTGTACTCTTCGTTTTACCCTGTT
ATCATGTATTGTTTTTTTGGAACCTCCAGACACATATCCATAGGTCCGTTTGCTGTAATT
AGCCTGATG
>Rhinopoma hardwickii
ATGGATCATGCTGAAGAAAATGAAATCCTTGCAGCAACCCAGAGGTACTATGTGGAAAGG
CCTATCTTTAGTCATCCCATCCTCCAGGAAAGACTGCACCAGAAGGACAAGATTTCGGAT
TCCATTGGGGATAAGCTGAAACAGGCATTCACATGTACTCCTAAGAAAATAAGAAATATC
ATTTATATGTTCTTACCCATAACTGAGTGGCTGCCAGCATACAAATTCAAGGAGTATGTG
TTGGGTGACTTGGTCTCAGGCATAAGCACAGGGGTGCTTCAGCTTCCTCAAGGTTTAGCC
TTTGCAATGTTGGCAGCTGTGCCTCCGGTGTTTGGCCTGTACTCTTCGTTTTACCCTGTT
ATCATGTATTGCTTTTTTGGAACCTCCAAACACATATCCATAGGTCCATTTGCTGTTATT
AGCCTGATG
>Murina leucogaster
ATGGATCATGCTGAAGAAACTGAAATCCTTGCAGCGGCCCAGAAGTACTATGTGGACAGG
CCTATCTTTAGTCACCTGGCCCTCCAGGAAATACTGCACACGAAGGACAAGATTCCGGAT
TCCATTGGGGATAAGCTAAAACAGGCGTTCACATGTACTCCTAAGAAAATAAGAAATATC
ATTTATATGTTCTTACCCATAACTGAGTGGTTGCCAGCATACAAATTCAAGGAGTATGTG
TTGGGTGACTTGGTCTCAGGCATTAGCACAGGGGTGCTTCAGCTTCCTCAAGGCTTAGCC
TTCGCAATGCTGGCAGCTGTGCCTCCGGTGTTCGGCCTGTACTCCTCGTTTTACCCTGTT
ATCATGTATTGTTTTTTTGGAACCTCCAAACACATATCCATAGGTCCGTTTGCTGTAATT
AGCCTGATG
>Megaderma lyra
ATGGATCATGCTGAAGAAACTGAAATCCTTGCAGCAACCCAGAAGTACTATGTGGAAAGG
CCTATCTTTAGTCATTCAGTCCTCCAGGAAAGACTGCACAAGAAGGACAAGATTTCAGAG
TCCATTGGGGATAAGCTGAAACAGGCATTCACATGTACTCCTAAGAAAATAAGAAATATC
ATTTATATGTTCCTACCCATAACTAAGTGGTTGCCAGCATACAATTTCAAGGAATATGTG
TTGGGTGACTTGGTCTCAGGCATAAGCACAGGAGTGCTTCAGCTTCCTCAAGGTTTAGCC
TTTGCAATGTTGGCAGCTGTGCCACCAGTGTTTGGCCTGTACTCTTCGTTTTACCCTGTT
ATCATGTATTGCTTTTTTGGAACCTCCAGACATATATCCATAGGTCCATTTGCTGTTATT
AGCCTGATG
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

平生两愿:抱着美人,浪迹天涯!
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huycwork

金虫 (著名写手)

【答案】应助回帖

shuifeng1988(金币+10): 谢谢啊,基 本上好了,但还有个问题,就是序列要求在一行上,而我的序列是多行的,用你的方法,我得先将我的每条序列排在一行上 2011-04-27 01:16:36
上面的程序少了一个换行,补上,print OUT "$data\n";
漩涡的中心有一块空地,空空的。
5楼2011-04-26 10:31:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 5 个回答

594wolfo

至尊木虫 (正式写手)

用perl吧
>Myotis ricketti 后面跟着的 跟它是一行么?
如果是一行 20个碱基=n个字符?
#!/user/bin/perl
use warnings;
use strict;
use Cwd;
my $dir= getcwd; #current directory
open IN, "<$dir\/in\/a.fas";
open OUT, ">>$dir\/out\/a.fas";
for my $line ( {
  chomp($line);
  $line=~ s/[A-Z]{n}$//;  ##n是行尾的目标字符数
  print OUT "$line\n";
}
copy下来 另存为 test.pl 放在跟in out文件夹一个路径上
多个文件的话 glob *.fas下 加个 循环 就行了

本地没安装perl 没法测试了 找本书看看 一天时间就Ok了
2楼2011-04-26 02:35:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

594wolfo

至尊木虫 (正式写手)

★ ★
微尘、梦想(金币+2): 谢谢参与应助! 2011-04-26 17:39:30
上个回复中有些字符 被解析成 表情了 麻烦斑竹删除 谢谢
试试这个
用perl吧
>Myotis ricketti 后面跟着的 跟它是一行么?
如果是一行 20个碱基=n个字符?
CODE:
#!/user/bin/perl
use warnings;
use strict;
use Cwd;
my $dir= getcwd; #current directory
open IN, "<$dir\/in\/a.fas";
open OUT, ">>$dir\/out\/a.fas";
  for my $line () {
  chomp($line);
  $line=~ s/[A-Z]{n}$//; ##n是行尾的目标字符数
  print OUT "$line\n";
}
close IN;
close OUT;

copy下来 另存为 test.pl 放在跟in out文件夹一个路径上
多个文件的话 glob *.fas下 加个 循环 就行了

本地没安装perl 没法测试了 找本书看看 一天时间就Ok了
3楼2011-04-26 02:40:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huycwork

金虫 (著名写手)

【答案】应助回帖

★ ★
微尘、梦想(金币+2): 谢谢参与应助! 2011-04-26 17:39:51
俺给你来一个,经过测试的,假定abs文件的每个记录只有两行,多行的没测试过,不过应该也没得问题,因为.不匹配换行。
假定工作目录是in:
CODE:
#!/usr/bin/perl
use strict;
my @files = glob("*.abs");
foreach my $file (@files){
    open IN, "<", $file;
    open OUT, ">", "../out/$file";
    while(){
        if(/^>/){
            print OUT $_;
            next;
        }
        my($data) = /(.*)[ATCG]{20}$/;
        print OUT $data;
    }
    close IN;
    close OUT;
}

漩涡的中心有一块空地,空空的。
4楼2011-04-26 10:28:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
不应助 确定回帖应助 (注意:应助才可能被奖励,但不允许灌水,必须填写15个字符以上)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[基金申请] 恳请大家帮我看看如何提高 +12 drwuwenhan 2024-06-28 15/750 2024-07-01 18:43 by 汤姆喵喵喵
[基金申请] 咨询 +4 李长云 2024-06-30 5/250 2024-07-01 18:27 by yumaomao2011
[基金申请] 希望青基是一个正反馈 +7 tureAurora 2024-06-30 7/350 2024-07-01 16:06 by 青木6281
[基金申请] 提交了只要等着就好,这样的评审会有吗? +7 随缘化 2024-06-28 7/350 2024-07-01 15:53 by gy116024
[基金申请] 工材口,今年的面上和青年资助率多少呢,大家有消息了吗? +10 今晚推荐22 2024-07-01 11/550 2024-07-01 15:45 by gy116024
[基金申请] 2024上会名单已出 +8 dream200606 2024-06-28 13/650 2024-07-01 13:51 by dream200606
[论文投稿] 投稿JAMT 2+3 sdfuu 2024-06-30 4/200 2024-07-01 13:19 by 投必得科研顾问
[论文投稿] 求助光催化方向二区末,三区期刊 5+4 糖糖不落布 2024-06-27 14/700 2024-07-01 07:29 by 龙余沧海
[基金申请] 是否上会都不知道的三无人员,翻论坛想看会评消息 +7 sparknow 2024-06-27 8/400 2024-07-01 00:19 by 临川树荫
[论文投稿] 关于论文第一通讯作者的问题? +13 winsaint 2024-06-26 13/650 2024-06-30 22:29 by liuyupu132
[考博] 25申博?找科研助理岗位 +3 鸿钧少爷 2024-06-28 5/250 2024-06-30 15:46 by 鸿钧少爷
[基金申请] 博后面上如何提高创新分? +5 yuyiang 2024-06-29 10/500 2024-06-29 18:24 by yuyiang
[有机交流] 大佬们,打的核磁氢谱与chemdraw预测的有偏差 +8 来了个 2024-06-26 9/450 2024-06-29 17:58 by if今年的吧
[论文投稿] 我投稿了Elsevier,后来申请撤稿,你不允许我撤稿,强制发表然后问我要钱 5+4 996247712 2024-06-26 12/600 2024-06-29 15:17 by bobvan
[硕博家园] 考博英语 +8 198新用户 2024-06-25 15/750 2024-06-29 15:02 by Lucaswu
[论文投稿] Scitific Reports +5 智晨君 2024-06-27 5/250 2024-06-29 10:37 by zhulei513
[基金申请] 专科院校申请国自然 +18 孤单12站 2024-06-24 33/1650 2024-06-28 12:26 by sunjc
[基金申请] 省基金对国自然申请是有利还是有弊 +6 zycumt04 2024-06-26 7/350 2024-06-26 15:02 by 潇湘之迷
[基金申请] 今天能不能出来名单 +8 地理学1995 2024-06-25 10/500 2024-06-26 09:46 by msjy
[基金申请] 基金申请书名称有变化 +5 xuel2011 2024-06-25 7/350 2024-06-26 00:07 by 老虎当猫养
信息提示
请填处理意见