24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 947  |  回复: 4

shuifeng1988

金虫 (小有名气)

木虫

[求助] ubuntu10.10 中脚本求助

我在桌面上有一个in文件夹和一个out文件夹,in文件夹中有十个不同的文件,如a.fas, b.fas, c.fas ......., 每个文件内容如下所示(每个文件有多条序列,每条序列名都在>号后面,序列名要保留和原来一样)!我想将每条序列的最后面20个碱基除去,然后用相同的文件名字保存在out文件夹中,我应该如何写脚本!


>Myotis ricketti
ATGGATCATGCTGAAGAAACTGAAATCCTTGCAGCGGCCCAGAAGTACTATGTGGACAGG
CCTATCTTCAGTCACCTGGCCCTCCAGGAAATACTGCACACGAAGGACAAGATTCCGGAT
TCCATTGGGGATAAGCTAAAACAGGCATTCACATGTACTCCGAAGAAAATAAGAAATATC
ATTTATATGTTCTTACCCATAACTAAGTGGTTGCCAGCATACAAATTCAAGGAGTATGTG
TTGGGTGACTTGGTCTCAGGCATTAGCACAGGGGTGCTTCAGCTTCCTCAAGGCTTAGCC
TTCGCAATGTTGGCAGCTGTGCCTCCGGTGTTCGGCCTGTACTCTTCGTTTTACCCTGTT
ATCATGTATTGTTTTTTTGGAACCTCCAGACACATATCCATAGGTCCGTTTGCTGTAATT
AGCCTGATG
>Rhinopoma hardwickii
ATGGATCATGCTGAAGAAAATGAAATCCTTGCAGCAACCCAGAGGTACTATGTGGAAAGG
CCTATCTTTAGTCATCCCATCCTCCAGGAAAGACTGCACCAGAAGGACAAGATTTCGGAT
TCCATTGGGGATAAGCTGAAACAGGCATTCACATGTACTCCTAAGAAAATAAGAAATATC
ATTTATATGTTCTTACCCATAACTGAGTGGCTGCCAGCATACAAATTCAAGGAGTATGTG
TTGGGTGACTTGGTCTCAGGCATAAGCACAGGGGTGCTTCAGCTTCCTCAAGGTTTAGCC
TTTGCAATGTTGGCAGCTGTGCCTCCGGTGTTTGGCCTGTACTCTTCGTTTTACCCTGTT
ATCATGTATTGCTTTTTTGGAACCTCCAAACACATATCCATAGGTCCATTTGCTGTTATT
AGCCTGATG
>Murina leucogaster
ATGGATCATGCTGAAGAAACTGAAATCCTTGCAGCGGCCCAGAAGTACTATGTGGACAGG
CCTATCTTTAGTCACCTGGCCCTCCAGGAAATACTGCACACGAAGGACAAGATTCCGGAT
TCCATTGGGGATAAGCTAAAACAGGCGTTCACATGTACTCCTAAGAAAATAAGAAATATC
ATTTATATGTTCTTACCCATAACTGAGTGGTTGCCAGCATACAAATTCAAGGAGTATGTG
TTGGGTGACTTGGTCTCAGGCATTAGCACAGGGGTGCTTCAGCTTCCTCAAGGCTTAGCC
TTCGCAATGCTGGCAGCTGTGCCTCCGGTGTTCGGCCTGTACTCCTCGTTTTACCCTGTT
ATCATGTATTGTTTTTTTGGAACCTCCAAACACATATCCATAGGTCCGTTTGCTGTAATT
AGCCTGATG
>Megaderma lyra
ATGGATCATGCTGAAGAAACTGAAATCCTTGCAGCAACCCAGAAGTACTATGTGGAAAGG
CCTATCTTTAGTCATTCAGTCCTCCAGGAAAGACTGCACAAGAAGGACAAGATTTCAGAG
TCCATTGGGGATAAGCTGAAACAGGCATTCACATGTACTCCTAAGAAAATAAGAAATATC
ATTTATATGTTCCTACCCATAACTAAGTGGTTGCCAGCATACAATTTCAAGGAATATGTG
TTGGGTGACTTGGTCTCAGGCATAAGCACAGGAGTGCTTCAGCTTCCTCAAGGTTTAGCC
TTTGCAATGTTGGCAGCTGTGCCACCAGTGTTTGGCCTGTACTCTTCGTTTTACCCTGTT
ATCATGTATTGCTTTTTTGGAACCTCCAGACATATATCCATAGGTCCATTTGCTGTTATT
AGCCTGATG
回复此楼
平生两愿:抱着美人,浪迹天涯!
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

594wolfo

至尊木虫 (正式写手)

用perl吧
>Myotis ricketti 后面跟着的 跟它是一行么?
如果是一行 20个碱基=n个字符?
#!/user/bin/perl
use warnings;
use strict;
use Cwd;
my $dir= getcwd; #current directory
open IN, "<$dir\/in\/a.fas";
open OUT, ">>$dir\/out\/a.fas";
for my $line ( {
  chomp($line);
  $line=~ s/[A-Z]{n}$//;  ##n是行尾的目标字符数
  print OUT "$line\n";
}
copy下来 另存为 test.pl 放在跟in out文件夹一个路径上
多个文件的话 glob *.fas下 加个 循环 就行了

本地没安装perl 没法测试了 找本书看看 一天时间就Ok了
2楼2011-04-26 02:35:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

594wolfo

至尊木虫 (正式写手)

★ ★
微尘、梦想(金币+2): 谢谢参与应助! 2011-04-26 17:39:30
上个回复中有些字符 被解析成 表情了 麻烦斑竹删除 谢谢
试试这个
用perl吧
>Myotis ricketti 后面跟着的 跟它是一行么?
如果是一行 20个碱基=n个字符?
CODE:
#!/user/bin/perl
use warnings;
use strict;
use Cwd;
my $dir= getcwd; #current directory
open IN, "<$dir\/in\/a.fas";
open OUT, ">>$dir\/out\/a.fas";
  for my $line () {
  chomp($line);
  $line=~ s/[A-Z]{n}$//; ##n是行尾的目标字符数
  print OUT "$line\n";
}
close IN;
close OUT;

copy下来 另存为 test.pl 放在跟in out文件夹一个路径上
多个文件的话 glob *.fas下 加个 循环 就行了

本地没安装perl 没法测试了 找本书看看 一天时间就Ok了
3楼2011-04-26 02:40:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huycwork

金虫 (著名写手)

【答案】应助回帖

★ ★
微尘、梦想(金币+2): 谢谢参与应助! 2011-04-26 17:39:51
俺给你来一个,经过测试的,假定abs文件的每个记录只有两行,多行的没测试过,不过应该也没得问题,因为.不匹配换行。
假定工作目录是in:
CODE:
#!/usr/bin/perl
use strict;
my @files = glob("*.abs");
foreach my $file (@files){
    open IN, "<", $file;
    open OUT, ">", "../out/$file";
    while(){
        if(/^>/){
            print OUT $_;
            next;
        }
        my($data) = /(.*)[ATCG]{20}$/;
        print OUT $data;
    }
    close IN;
    close OUT;
}

漩涡的中心有一块空地,空空的。
4楼2011-04-26 10:28:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huycwork

金虫 (著名写手)

【答案】应助回帖

shuifeng1988(金币+10): 谢谢啊,基 本上好了,但还有个问题,就是序列要求在一行上,而我的序列是多行的,用你的方法,我得先将我的每条序列排在一行上 2011-04-27 01:16:36
上面的程序少了一个换行,补上,print OUT "$data\n";
漩涡的中心有一块空地,空空的。
5楼2011-04-26 10:31:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 shuifeng1988 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 一志愿河北工业大学材料工程,初试344求专硕调剂 +4 15933906766 2026-04-05 4/200 2026-04-06 07:22 by hmn_wj
[考研] 一志愿211,化学学硕,310分,本科重点双非,求调剂 +13 努力奋斗112 2026-04-04 13/650 2026-04-06 07:13 by jj987
[考研] 材料专硕(0856) 339分求调剂 +10 哈哈哈鹅哈哈哈 2026-04-04 10/500 2026-04-05 18:51 by 蓝云思雨
[考研] 考研调剂生寻找导师 +3 顾瞻考研啊 2026-04-05 3/150 2026-04-05 18:18 by 啵啵啵0119
[考研] 270分求调剂 +4 maxjxbsk 2026-04-01 4/200 2026-04-05 17:04 by yulian1987
[考研] 313求调剂 +5 海日海日 2026-04-04 5/250 2026-04-05 15:52 by jndximd
[考研] 工科08专硕机械275求调剂 +3 AaAa7420 2026-04-02 3/150 2026-04-05 13:26 by jp9609
[考研] 一志愿南航,数一英一学硕317求调剂!! +5 Acaciad 2026-04-04 5/250 2026-04-05 12:31 by 搏击518
[考研] 生物工程求调剂 +6 喜欢还是不甘心 2026-04-05 6/300 2026-04-05 10:28 by 唐沐儿
[考研] 一志愿郑州大学材料与化工085600,求调剂 +24 吃的不少 2026-04-02 24/1200 2026-04-04 23:20 by 永字号
[考研] 考研调剂 +6 15615482637 2026-04-04 6/300 2026-04-04 22:43 by yu221
[考研] 278求调剂 +14 范婷娜 2026-04-04 15/750 2026-04-04 22:15 by lqwchd
[考研] 一志愿华北电力大学(北京),材料科学与工程学硕265,求调剂 +11 yelck 2026-04-03 12/600 2026-04-04 19:52 by dongzh2009
[考研] 求生物学专业调剂-332分 +5 云朵遛弯指南 2026-04-04 5/250 2026-04-04 10:05 by rzh123456
[考研] 考研调剂 +5 小sun要好运 2026-04-03 5/250 2026-04-03 21:43 by 啵啵啵0119
[考研] 338求调剂 +4 zzz,,r 2026-04-03 4/200 2026-04-03 16:39 by lijunpoly
[考研] 321求调剂 +17 y-yh 2026-04-01 20/1000 2026-04-03 12:57 by y-yh
[考研] 材料工程322分 +8 哈哈哈吼吼吼哈 2026-04-01 8/400 2026-04-02 11:53 by 3041
[考研] 一志愿中海洋材料357 +4 麦恩莉. 2026-03-30 4/200 2026-03-31 14:35 by 记事本2026
[考研] 一志愿食品科学与工程083200求调剂 +4 XQTJZ 2026-03-30 4/200 2026-03-31 04:10 by fmesaito
信息提示
请填处理意见