24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2597  |  回复: 9
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

也是醉了.

铜虫 (小有名气)

[求助] 请教关于 多样性指数、聚类分析的方法。已有1人参与

我做100个品种的遗传多样性差异分析,每个品种田间取10株,灌浆中期在每个小区中间2行随机抽选10株,调查单株穗数、株高、主茎穗长、小穗数、旗叶长、旗
叶宽及倒一节长,收获后室内调查主茎穗粒数、单株粒重和单穗粒重。
    多样性指数(Shannon,1949)的计算方法如下:先计算参试材料总体平均数(x)和标准差(σ),然后划分为10级,从第一级【xi<(x-2σ)】到第10级[xi>(x+2σ)】,每0.5 σ为一级。每一级的相对频率用于计算多样性指数。多样性指数公式为:H’=-Σpi Lnpi,公式中Pi为某性状第i级别内材料份数占总份数的百分比,ln为自然对数。
    看了这段话,很多文献都是用这种方法计算多样性指数,不理解这话的意思,具体怎么操作呢?100个品种每个品种10次重复,参试材料总体平均数(x),这个是啥意思,每个品种的同一性状分别求出平均值之后,再用所求的平均值再算一次平均值吗?从第一级【xi<(x-2σ)】到第10级[xi>(x+2σ)】,每一级的相对频率用于计算多样性指数,这个可以用EXCL操作么?怎么操作呢,请大拿指教,万分感激。
    另外需要做聚类分析,关于聚类分析的方法选择也存在疑惑,哪种聚类方法都可以吗,不同方法得出的结果是否有影响,用DPS做遗传多样性聚类哪种方法最常用呢?聚类分析的数据是平均值算,还是10次重复数值直接录入计算呢?
期待您的解答。
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   关注TA 给TA发消息 送TA红花 TA的回帖

也是醉了.

铜虫 (小有名气)

引用回帖:
9楼: Originally posted by badman20 at 2014-11-06 11:04:33
由于有几个公式在文本框无法显示,我以附件方式上传,请查看!

解答.JPG
...

谢谢您的指导,基本我的问题都解决了,厉害,大赞!!
10楼2014-11-06 12:12:42
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

badman20

木虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
也是醉了.: 金币+20, ★★★★★最佳答案, 非常清晰的讲解 2014-11-05 15:37:07
lqf808: 金币+5, 很对 2014-11-05 18:59:29
第一,关于如何操作数据分析:
1.        所谓总体平均值就是所有参试个体的总平均值(X),你先算每个品种的均值,再算所有品种间的均值,结果都是一样的;
2.        标准差(σ)就是先对品种进行方差分析,得到表型方差(V),开根号等到标准差σ;
3.        得到以上两个值后,计算每个品种的均值(xi);
4.        按照按照公式计算分级,统计每一级的品种个数;
5.        按照香农多样性指数计算多样性;
PS:以上所有步骤都可在EXCEL里进行!
第二,关于聚类:
另关于聚类的问题,原则上用任何一种方法均可(但你用了哪一种方法得到的聚类图最好在下面注明),因为这些计算品种间距离(差异)的几种方法都是大家公认的,当然你也可以参考类似文献采用的得较多的一种方法!
祝顺利!
3楼2014-11-05 13:05:45
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

也是醉了.

铜虫 (小有名气)

引用回帖:
3楼: Originally posted by badman20 at 2014-11-05 13:05:45
第一,关于如何操作数据分析:
1.        所谓总体平均值就是所有参试个体的总平均值(X),你先算每个品种的均值,再算所有品种间的均值,结果都是一样的;
2.        标准差(σ)就是先对品种进行方差分析,得到表型方差(V), ...

讲解的太明白了,大赞!!!受益匪浅啊,感谢啊~~~ 另外问一下大哥,聚类分析数据是用每个品种的平均值,还是直接10次重复数据进行聚类呢,我用的是DPS。
4楼2014-11-05 15:36:34
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

也是醉了.

铜虫 (小有名气)

引用回帖:
3楼: Originally posted by badman20 at 2014-11-05 13:05:45
第一,关于如何操作数据分析:
1.        所谓总体平均值就是所有参试个体的总平均值(X),你先算每个品种的均值,再算所有品种间的均值,结果都是一样的;
2.        标准差(σ)就是先对品种进行方差分析,得到表型方差(V), ...

大哥,我想了一下,还有几个不懂的问题,请您指教。
1.标准差是所有品种的某一性状的总标准差吗?如果是这样,那我10株的重复数据,比如单株粒重这一项,我的一个品种十株一起脱粒,称重后的重量是10株的重量之和,除以10就可以得到这个品种的单株粒重的平均值了,貌似不需要进行单独每一株都称重,分别记下数值了?是这样吗,这样是不是也可以做多样性指数分析,也就是说品种内个别的性状不需要进行重复了,我只是要某一个品种的平均值就行了呢?计算多样性指数,我需要用总体的平均值,每个品种的平均值,表型方差,标准差,这些我假设我每个品种都只有一个总数,能算出平均值就能求出吧,是这样吗?我之前问的一个关于变异系数的帖子您也指导我了,我可以理解成变异系数的计算需要10次重复数据,而多样性指数的计算不需要10次重复数据,只需有均值即可吗?这是引用的一篇文献【【从变异系数可以看出,除小穗数外,其他5个性状均存在较大的变异,其中单株粒重的变异程度最大,其次是单穗粒重。各性状的变异系数在不同国家材料间存在明显差异,智利材料的单穗粒重、墨丙哥材料的小穗数、千粒重和单株粒重、澳大利亚材料的单株穗数及俄罗斯材料的穗粒数变异程度最小;荷兰材料的单穗粒重和千粒重、中国材料的穗粒数和单株穗数及俄罗斯材料的小穗数和单株粒重变异程度最大。采用6个性状变异系数的平均值评价不同国家种质资源产量综合性状的变异大小,其顺序为:荷兰材料(25.53%)>俄罗斯材料(24.48%)>中国材料(23.47%)>智利材料(22.22%)>澳大利亚材料(19.24%)>墨西哥材料(19.14%)。】】我需要计算的各性状的变异系数到底是您所说表型变异还是遗传变异呢。换句话说我到底是用各个品种均值计算还是用10次重复数据计算呢?下面还有一个图片的附表,请您看一下。
2.关于这个【划分为10级,从第一级【xi<(x-2σ)】到第10级[xi>(x+2σ)】,每0.5σ为一级。每一级的相对频率用于计算多样性指数。】统计每一级的品种个数,比如我100个品种,第一级有12个品种,那么Pi就是0.12,用这个公式H’=-Σpi Lnpi,将Pi带入,算出第一级的指数。再统计余下的9级,将余下的求和,就算出了这个性状的多样性指数了,这样操作对吗?
3.聚类分析的问题,文献中聚类方法大多不一致,有用离差平方和法,有用最长、短距离法,还有完全联接法的,我该如何选择聚类方法呢?
聚类分析是否需要将10次重复数据录入计算,还是根据各个品种的平均值计算(我记得好像需要,但是单一的数据好像也可以聚类,这个不太懂..)
  问题好多,麻烦您了
请教关于 多样性指数、聚类分析的方法。
截图.png

5楼2014-11-05 16:43:36
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见