24小时热门版块排行榜    

查看: 2359  |  回复: 15
本帖产生 1 个 BioEPI ,点击这里进行查看

我要学perl么

新虫 (初入文坛)

[求助] 【求助】如何得到某一物种的所有蛋白翻译基因的不同位置(exon、intron)的GC含量

如题:
如何得到某一物种的所有蛋白翻译基因的不同位置(exon、intron)的GC含量,如下图



是要从网上下染色体的全部序列信息然后再自己计算吗?
【求助】如何得到某一物种的所有蛋白翻译基因的不同位置(exon、intron)的GC含量
图片1.png



[ Last edited by 我要学perl么 on 2013-8-14 at 22:30 ]
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
silicare: 金币+2, 辛苦了 2013-08-21 17:51:30
自己计算是最方便最自由的
如果是人等的注释很好的基因组,可以考虑用galaxy
2楼2013-08-15 08:08:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我要学perl么

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by wizardfan at 2013-08-15 08:08:24
自己计算是最方便最自由的
如果是人等的注释很好的基因组,可以考虑用galaxy

我做的 是猪的。
galaxy可以用吗?
如果要自己计算的话是要下载全基因组序列,然后自己写perl代码?

另外有个小问题:就是计算GC含量的时候假如遇到这样的情况,ACGN,GC含量算50%吗?
3楼2013-08-15 08:42:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
我要学perl么: 金币+5, ★★★很有帮助 2013-08-16 16:55:05
silicare: 金币+5, BioEPI+1 2013-08-21 17:51:44
引用回帖:
3楼: Originally posted by 我要学perl么 at 2013-08-15 08:42:36
我做的 是猪的。
galaxy可以用吗?
如果要自己计算的话是要下载全基因组序列,然后自己写perl代码?

另外有个小问题:就是计算GC含量的时候假如遇到这样的情况,ACGN,GC含量算50%吗?...

I think so
Go to website https://main.g2.bx.psu.edu/
click "get data" in the left panel, choose UCSC main
Select pig in the genome
Search for geecee to calculate gc content

If you are not sure, read the tutorials, particularly this one https://main.g2.bx.psu.edu/u/aun1/p/galaxy101
4楼2013-08-15 17:33:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我要学perl么

新虫 (初入文坛)

引用回帖:
4楼: Originally posted by wizardfan at 2013-08-15 17:33:44
I think so
Go to website https://main.g2.bx.psu.edu/
click "get data" in the left panel, choose UCSC main
Select pig in the genome
Search for geecee to calculate gc content

If you a ...


Thank you very much!
5楼2013-08-16 16:54:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我要学perl么

新虫 (初入文坛)

引用回帖:
4楼: Originally posted by wizardfan at 2013-08-15 17:33:44
I think so
Go to website https://main.g2.bx.psu.edu/
click "get data" in the left panel, choose UCSC main
Select pig in the genome
Search for geecee to calculate gc content

If you a ...

你好,我还想再问2个问题。
1. 我有包含lncRNA的exon的位置信息的GFF文件,怎么样才能得到他们的内含子及上下游的信息?另外在USCS main里position选项的define regions里它提示There is a limit of 1,000 defined regions. 是不是意思就是说不能超过1000条的lncRNA的exon?

2. 在1楼的那张图里,怎么样才能得到random的位置呢?

非常谢谢你的解答!
6楼2013-08-18 23:20:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

引用回帖:
6楼: Originally posted by 我要学perl么 at 2013-08-18 23:20:39
你好,我还想再问2个问题。
1. 我有包含lncRNA的exon的位置信息的GFF文件,怎么样才能得到他们的内含子及上下游的信息?另外在USCS main里position选项的define regions里它提示There is a limit of 1,000 define ...

random的那个要看paper里是怎么写的了
exon以外的不就是intron吗?
在下拉菜单里有exons的选项吧。
7楼2013-08-19 05:06:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我要学perl么

新虫 (初入文坛)

引用回帖:
7楼: Originally posted by wizardfan at 2013-08-19 05:06:58
random的那个要看paper里是怎么写的了
exon以外的不就是intron吗?
在下拉菜单里有exons的选项吧。...

你好!谢谢,Galaxy是非常好用的工具。
蛋白编码基因的内含子、外显子和上下游的GC含量我会计算了。但是对于lncRNA仍有点问题。
现在我有lncRNA的gtf和gff两种文件,对于如何计算GC含量我有2个想法,不知道哪个对

1. 第一种就是讲gtf转化为bed,然后使用Extract Features的Gene BED To Exon/Intron/Codon BED expander工具得到包含内含子的bed文件,然后再转化为gff, 以便用Feature Sequence得到fasta序列。
但是fasta文件为空,提示是“susScr3
290 warnings, 1st is: Unable to fetch the sequence from '9162341' to '543' for chrom '1'. Skipped 290 invalid lines, 1st is #4, "1        bed2gff        CUFF.1911.1 9162341        9162884        0        -        . CUFF.1911.1;"”

2.第二种就是将gtf过滤得到transcrip和exon的两种文件,然后用Operate on Genomic Intervals里的Subtract工具可以得到内含子的文件,Get flanks 工具可以得到上下游序列。然后就可以计算了。

感觉第二种方法是对的。
By the way,在用第一种方法的时候如果transcription和exon的起始终止位置一样的话,Gene BED To Exon/Intron/Codon BED expander工具判断内含子的话会出现start 和end相反的情况(比如说正链的内含子应该为0的,可是出现start为1300 end 为300)。不知道这样算不算错误?

写的有点乱,可能表达不清楚,见谅!
谢谢你的回复!
8楼2013-08-20 01:07:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

引用回帖:
8楼: Originally posted by 我要学perl么 at 2013-08-20 01:07:22
你好!谢谢,Galaxy是非常好用的工具。
蛋白编码基因的内含子、外显子和上下游的GC含量我会计算了。但是对于lncRNA仍有点问题。
现在我有lncRNA的gtf和gff两种文件,对于如何计算GC含量我有2个想法,不知道哪个对 ...

我不是GALAXY专家,推荐你加入官方邮件列表参与讨论
9楼2013-08-20 07:24:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我要学perl么

新虫 (初入文坛)

引用回帖:
9楼: Originally posted by wizardfan at 2013-08-20 07:24:54
我不是GALAXY专家,推荐你加入官方邮件列表参与讨论...

嗯。
谢谢你的帮助!
10楼2013-08-20 09:52:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 我要学perl么 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 环境学硕288求调剂 +8 皮皮皮123456 2026-03-22 8/400 2026-03-23 23:47 by 热情沙漠
[考研] 306求0703调剂一志愿华中师范 +7 纸鱼ly 2026-03-21 8/400 2026-03-23 23:31 by chixmc
[考研] 085600材料与化工调剂 +7 A-哆啦Z梦 2026-03-23 12/600 2026-03-23 23:16 by 星空星月
[考研] 328求调剂,英语六级551,有科研经历 +7 生物工程调剂 2026-03-17 12/600 2026-03-23 18:18 by YMU施老师
[考研] 316求调剂 +7 梁茜雯 2026-03-19 7/350 2026-03-23 16:21 by lingjue
[考研] 石河子大学(211、双一流)硕博研究生长期招生公告 +3 李子目 2026-03-22 3/150 2026-03-22 21:01 by 怎么释怀
[考研] 289材料与化工(085600)B区求调剂 +3 这么名字咋样 2026-03-22 4/200 2026-03-22 17:56 by 云民大李老师
[考研] 308求调剂 +3 墨墨漠 2026-03-21 3/150 2026-03-22 16:54 by i_cooler
[考研] 一志愿中南化学(0703)总分337求调剂 +9 niko- 2026-03-19 10/500 2026-03-22 16:08 by ColorlessPI
[考研] 286分人工智能专业请求调剂愿意跨考! +4 lemonzzn 2026-03-17 8/400 2026-03-21 22:49 by lemonzzn
[考研] 297求调剂 +3 喜欢还是不甘心 2026-03-20 3/150 2026-03-21 18:33 by 学员8dgXkO
[考研] 材料学硕333求调剂 +3 北道巷 2026-03-18 3/150 2026-03-21 18:17 by 学员8dgXkO
[考研] 296求调剂 +4 www_q 2026-03-20 4/200 2026-03-21 17:26 by 学员8dgXkO
[基金申请] 学校已经提交到NSFC,还能修改吗? 40+4 babangida 2026-03-19 9/450 2026-03-21 16:12 by babangida
[考研] 0805材料320求调剂 +3 深海物语 2026-03-20 3/150 2026-03-21 15:46 by 无际的草原
[考研] 求调剂 +6 Mqqqqqq 2026-03-19 6/300 2026-03-21 08:04 by JourneyLucky
[考研] 一志愿天津大学化学工艺专业(081702)315分求调剂 +12 yangfz 2026-03-17 12/600 2026-03-21 03:30 by JourneyLucky
[考研] 304求调剂 +6 曼殊2266 2026-03-18 6/300 2026-03-21 00:32 by JourneyLucky
[考研] 南京大学化学376求调剂 +3 hisfailed 2026-03-19 6/300 2026-03-20 23:43 by hisfailed
[考研] 求调剂 +3 @taotao 2026-03-20 3/150 2026-03-20 19:35 by JourneyLucky
信息提示
请填处理意见