24小时热门版块排行榜    

查看: 2730  |  回复: 16
本帖产生 1 个 BioEPI ,点击这里进行查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

Hi小木虫

新虫 (小有名气)

[求助] 如何处理大量的fasta格式的rna序列

我在ncbi上下载了上千个序列,急需一个简单一点的方法来处理,谢谢了!!!!
具体是在记事本上以fasta格式打开,将类似于
>gi|194140302|gb|EU845739.1| Uncultured bacterium clone 1103200832590 16S ribosomal RNA gene, partial sequenceGCCGCTGCAGAGTTTGATCCTGGCTCAGATTGAAATTGAACGCTGGCG
GCAGGCTTAACACATGCAAGTCGAGCGG>gi|194140303|gb|EU845740.1| Uncultured bacterium clone 1103200832592 16S ribosomal RNA gene, partial sequenceCAGGACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGGA
AGTTGAAGAGCTTGCTCTTCAACT...............
转化为
>EU845739
GCCGCTGCAGAGTTTGATCCTGGCTCAGATTGAAATTGAACGCTGGCGGCAGGCTTAACACATGCAAGTCGAGCGG
>EU845740
CAGGACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGGAAGTTGAAG
AGCTTGCTCTTCAAC.......

希望有经验的好心人速度救命,我快被它折磨死了。
回复此楼

» 收录本帖的淘帖专辑推荐

技能GET

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hxp9802

新虫 (小有名气)

gaoyang636,您好,我想问您,我想把>gi|194140302|gb|EU845739.1| Uncultured bacterium clone 1103200832590 16S ribosomal RNA gene, partial sequence这个只留下>194140302,如何实现啊?如何修改上面那个rename.pl 呢?
过去,未来
14楼2014-01-21 22:49:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hxp9802

新虫 (小有名气)

比如:>gi|194140302|gb|EU845739.1| Uncultured bacterium clone 1103200832590 16S ribosomal RNA gene, partial sequence 太长,PRIMER3运行总出现错误,必须把名字简化,gi是唯一的mRNA号,我想保留它,将来好找这些序列的来源,您能不能帮我把那个ranme.pl 修改一下,批量保留GI号
过去,未来
15楼2014-01-21 22:51:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hxp9802

新虫 (小有名气)

我知道了!
可以吧那个脚本第11行的 gb\|(\w+)\. 改为 gi\|(\d+)\|
其他不变,就可以了
过去,未来
16楼2014-01-22 11:20:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 Hi小木虫 的主题更新
信息提示
请填处理意见