24小时热门版块排行榜    

查看: 6589  |  回复: 6

smiles2011

新虫 (小有名气)

[交流] 请教批量更改fasta序列名的方法? 已有5人参与

在下正在做进化树,遇到了一个难题,故想请教各位大神,关于批量更改fasta序列名的方法?
如序列名:
>A/Hong Kong/CUHK52247/2000 | 2000-12-08  | HA | 161173 |
atgaagactatcattgctttgagctacattttatgtctggttttcgctcaaaaacttcccgtaaatgacaacagcacggc
a......
>A/Hong Kong/CUHK21932/2001 | 2001-04-27  | HA | 161055 |
atgaagactatcattgctttgagctacattttatgtctggttttcgctcaaaaacttccaggaaatgacaacagcactgc
aac....
删除名称的一部分我只想保留:
>A/Hong Kong/CUHK52247/2000
atgaagactatcattgctttgagctacattttatgtctggttttcgctcaaaaacttcccgtaaatgacaacagcacggc
a......
>A/Hong Kong/CUHK21932/2001
atgaagactatcattgctttgagctacattttatgtctggttttcgctcaaaaacttccaggaaatgacaacagcactgc
aac....
简而言之,就是fasta名称中的第一个“|”后的字符全部删除;
但是由于目前数据太多,一个一个来太慢了,就想请教大神们能不能批量修改了!先谢谢各位!!!
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我是鱼豆腐

金虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
fastq文件是不是高通量测序公司给你的文件- -我记得可以直接用来分析的丫
2楼2015-07-15 14:45:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

flyy1986

铜虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
写个脚本就可以了😁

[ 发自手机版 http://muchong.com/3g ]
3楼2015-07-15 18:26:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

flyy1986

铜虫 (小有名气)

你可以试试excel分列功能,分割符号是|

[ 发自手机版 http://muchong.com/3g ]
4楼2015-07-15 18:28:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Fleaves

至尊木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
自己写一个吧,应该不难
读取文件,遇到第一个|,然后执行删除,判断是否遇到回车,如果不是就删除,是就结束,关闭并保存文件,读取下一个文件
5楼2015-07-16 00:22:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qhuzhl

金虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
用正则表达式直接查找替换就可以了
6楼2015-07-16 14:48:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhjcao

木虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
拷进WORD,用查找-替换,
7楼2015-07-16 15:59:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 smiles2011 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见