| 查看: 791 | 回复: 0 | |||
emanlee木虫 (小有名气)
|
[求助]
从两个不同fasta文件中寻找不重复的序列
|
|
题目:从两个不同fasta文件中寻找不重复的序列 第一个fasta文件aaa.fa中有40000条碱基序列或者氨基酸序列: >gi|118600994|ref|NM_001079530.1| Homo sapiens cripto, FRL-1, cryptic family 1B (CFC1B), mRNA ATGCCAAATACAGCCATGAAGAAAAAGGTGCTGCTGATGGGGAAGAGCGGGTCGGGGAAGACCAGCATGAGGTCGATAATCTT >gi|57863286|ref|NM_006570.4| Homo sapiens Ras-related GTP binding A (RRAGA), mRNA ACGCTCTACAAAGCCTGGTCCAGCATCGTCTACCAGCTGATTCCCAACGTTCAGCAGCTGGAGATGAACCTCAGGAATTTTG >gi|254587897|ref|NM_178495.5| Homo sapiens inositol 1,4,5-trisphosphate receptor CGCCAATTACATTGCTCGCGACACCCGGCGCCTGGGGGCCACCATTGACGTGGAACACTCCCACGTCCGATTCCTAGGGAACC >gi|191252813|ref|NM_001128635.1| Homo sapiens RIMS binding protein 3B (RIMBP3B), mRNA TGGTGCTGAACCTGTGGGACTGTGGCGGTCAGGACACCTTCATGGAAAATTACTTCACCAGCCAGCGAGACAATATCTTCCGTA >gi|61656209|ref|NM_001013355.1| Homo sapiens olfactory receptor, family 2, subfamily G, member 6 (OR2G6), mRNA ACGTGGAAGTTTTGATTTACGTGTTTGACGTGGAGAGCCGCGAACTGGAAAAGGACATGCATTATTACCAGTCGTGTCTGGAGG 第二个fasta文件bbb.fa中有40000条碱基序列或者氨基酸序列: >gi|83267870|ref|NM_080431.4| Homo sapiens actin-related protein T2 (ACTRT2), mRNA CCATCCTCCAGAACTCTCCTGACGCCAAAATCTTCTGCCTGGTGCACAAAATGGATCTGGTTCAGGAGGATCAGCGTGACCTGA >gi|53828675|ref|NM_001001923.1| Homo sapiens olfactory receptor, family 5, subfamily C, member 1 (OR5C1), mRNA TTTTTAAAGAGCGAGAGGAAGACCTGAGGCGTCTGTCTCGCCCGCTGGAGTGTGCTTGTTTTCGAACGTCCATCTGGGATGAG >gi|52627150|ref|NM_001005276.1| Homo sapiens olfactory receptor, family 2, subfamily AE, member 1 (OR2AE1), mRNA TTTTTAAAGAGCGAGAGGAAGACCTGAGGCGTCTGTCTCGCCCGCTGGAGTGTGCTTGTTTTCGAACGTCCATCTGGGATGAG >gi|61656211|ref|NM_001013357.1| Homo sapiens olfactory receptor, family 8, subfamily U, member 9 (OR8U9), mRNA ACGCTCTACAAAGCCTGGTCCAGCATCGTCTACCAGCTGATTCCCAACGTTCAGCAGCTGGAGATGAACCTCAGGAATTTTG >gi|51871366|ref|NM_001004124.1| Homo sapiens olfactory receptor, family 4, subfamily P, member 4 (OR4P4), mRNA ATGCCAAATACAGCCATGAAGAAAAAGGTGCTGCTGATGGGGAAGAGCGGGTCGGGGAAGACCAGCATGAGGTCGATAATCTT 我们想从第二个文件bbb.fa中找出与aaa.fa中的序列不overlapping的序列(overlap-ratio<0.8),请问如何使用blast比对? 是否有现成的perl或者python,或者C代码可以直接使用? |
» 猜你喜欢
筑牢营养安全线:以精准检测,护健康基石
已经有0人回复
推荐一些20种氨基酸检测的实际应用案例
已经有0人回复
化学工程及工业化学论文润色/翻译怎么收费?
已经有166人回复
不合理蛙科研实验中的趣事:实验器材的 “乌龙”
已经有0人回复
不合理蛙科研实验中的趣事:和实验材料的 “斗智斗勇”
已经有0人回复
蛋白质检测:精准分析,解锁生物分子的密码
已经有0人回复
不合理蛙科研实验之小鼠实验:严谨设计,解析生命机制的重要载体
已经有0人回复
不合理蛙科研实验之重金属检测:精准筛查,守护健康与环境的防线
已经有0人回复
不合理蛙科研实验之“蛙测重金属我背锅三千”
已经有0人回复
不合理蛙科研实验之“鼠逃三次我发三篇SCI”
已经有0人回复
找到一些相关的精华帖子,希望有用哦~
如何把一个氨基酸序列转化成FASTA格式
已经有7人回复
从uniprot中下载的氨基酸序列的fasta格式中的PE,SV分别指什么
已经有4人回复
在一个TXT文本中,以fasta格式保存着1000多个氨基酸序列,每个序列的长度如何得出
已经有5人回复
请问如何将这些序列转化为FASTA格式?
已经有8人回复
如何处理大量的fasta格式的rna序列
已经有16人回复
菜鸟求助——着急求助解答:在NCBI上为什么下载不了FASTA格式的基因序列
已经有9人回复
【求助/交流】有登陆号,如何批量从Genbank中导出fasta格式的核酸序列
已经有6人回复
如何将序列转换为FASTA格式?
已经有11人回复
科研从小木虫开始,人人为我,我为人人













回复此楼
点击这里搜索更多相关资源