24小时热门版块排行榜    

查看: 1936  |  回复: 3
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

aegeansea

金虫 (小有名气)

[求助] 基因组上snp位点分布的随机性如何检验?

我正在分析基因组上的snp位点。
现在有几千个snp位点,分布在染色体上1~10,000,000区间内,分别为899,1002,4886等这些位点。
我想检验这些snp的分布是否是完全随机的(例如1~1000区间内有2个snp,2000~3000内还有snp这种随机,而不是指正态分布),还是在某些位置有聚集,而在另一些位置稀少。这该用何种算法实现呢?
有如何运用R语言或者perl语言实现呢?

请高手指点。多谢多谢
回复此楼

» 收录本帖的淘帖专辑推荐

BioDiscussion

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yangsh_nj

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★
aegeansea: 金币+5, ★★★很有帮助, 非常感谢 2012-03-25 18:50:07
The P value 的计算就是根据你的实际观察值在单独的每一个window(假定为n)与你随机模拟10000次的这个window所有的值进行比较,看有多少各个值比你观察的值还大(假定为m个),则p=(m+1)/10001。假定m=0,即随机10000次没有一个值比你的观测值还大的话,说明你的snp在这个window不随机分布的概率p<0.0001。以此类推
3楼2012-03-25 08:33:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 4 个回答

yangsh_nj

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
aegeansea: 金币+5, 非常感谢 2012-03-25 18:49:57
利用随机模型,根据你SNP的数量,随机模拟10000次,以此为基础,划分window来进行检验就行。就用perl随机生成函数即可。
2楼2012-03-25 08:25:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

genomelin

银虫 (小有名气)

【答案】应助回帖

★ ★ ★
感谢参与,应助指数 +1
zhaohq1209: 金币+3, 列出了参考文献,鼓励哈~回帖时间有点晚啦~lz已经没有金币奖励了~送你3个吧 2012-03-27 07:10:14
Random your string in R by "sample" about 10000 times
and you will get a random data set
then calculate the density distribution (obv/exp);
fano factor
or use other methods.
Maybe this paper will be helpful
LERCHER M J, URRUTIA A O, HURST L D. Clustering of housekeeping genes provides a unified model of gene order in the human genome [J]. nature genetics, 2002, 31(2): 180‐3.
4楼2012-03-25 16:00:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见