版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

邙山的鱼

木虫 (正式写手)

应助: 1 (幼儿园)
金币: 3074.3
散金: 30
帖子: 454
在线: 228.9小时
虫号: 1863418
注册: 2012-06-18
性别: GG
专业: 化学生物学与生物有机化学

[求助] 关于统计中样本数目的一些问题已有3人参与

我是学化学的，对数学的东西停留在大二学的概率论与数理统计上，不过也忘得差不多了。
最近看了一篇文章，其中提到说
如果你用两个方法去计算一套数据，得到两个系列计算值，和这个实验值去做线性回归。可以得到两个R值。
但是当样本量过小的时候，在一定的置信区间内。R值大的，不一定比R值小的表明该方法得到的计算结果更好。
如图所示。
我想知道这个适用有前提条件么？作者给的这些结果是有理论推导的依据么？
这篇作者在关于引用公式是参考了DOUGLAS G. BONETT，THOMAS A. WRIGHT，等人的SAMPLE SIZE REQUIREMENTS FOR ESTIMATING PEARSON, KENDALL AND SPEARMAN CORRELATIONS这篇paper。
在此求教，不胜感激！

原paper.png

回复此楼

» 猜你喜欢

表哥与省会女结婚，父母去帮带孩子被省会女气回家生重病了已经有12人回复
依托企业入选了国家启明计划青年人才。有无高校可以引进的。已经有14人回复
江汉大学解明教授课题组招博士研究生/博士后已经有3人回复
AI 太可怕了，写基金时，提出想法，直接生成的文字比自己想得深远，还有科学性已经有11人回复
同年申请2项不同项目，第1个项目里不写第2个项目的信息，可以吗已经有10人回复
依托企业入选了国家启明计划青年人才。有无高校可以引进的。已经有11人回复

» 本主题相关价值贴推荐，对您同样有帮助:

决策树算法总结已经有0人回复
日本科技的强大！！初音未来2011美国洛杉矶演唱会 720p 4.39G 已经有20人回复

1楼 2016-08-12 10:00:37

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

mbchen

专家顾问 (著名写手)

专家经验: +191
应助: 111 (高中生)
贵宾: 0.15
金币: 4905.9
散金: 240
红花: 84
帖子: 1220
在线: 738.2小时
虫号: 383121
注册: 2007-05-26
性别: GG
专业: 理论和计算化学
管辖: 无机/物化

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与，应助指数 +1
邙山的鱼: 金币+5, ★★★很有帮助 2016-08-15 08:50:40

你的问题的答案，还可以参看小木虫网站无机物化
http://muchong.com/bbs/viewthread.php?tid=10552390&fpage=1
中转载《化学通报》的文章。包括数学原理，如何查统计表得到数据点数与相关系数R之间的关系；还有，在化学领域该错误以讹传讹六十年的源头及其历史。

赞一下

回复此楼

7楼2016-08-14 15:45:16

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 7 个回答

peterflyer

木虫之王 (文学泰斗)

peterflyer

数学EPI: 10
应助: 20282 (院士)
金币: 146037
红花: 1374
帖子: 93091
在线: 7694.3小时
虫号: 1482829
注册: 2011-11-08
性别: GG
专业: 功能陶瓷

【答案】应助回帖

感谢参与，应助指数 +1

样本数量过小，就不能充分避免随机因素导致的误差，导致算出的R值不是太可靠。

赞一下

回复此楼

2楼2016-08-12 12:00:44

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

邙山的鱼

木虫 (正式写手)

应助: 1 (幼儿园)
金币: 3074.3
散金: 30
帖子: 454
在线: 228.9小时
虫号: 1863418
注册: 2012-06-18
性别: GG
专业: 化学生物学与生物有机化学

引用回帖:

2楼: Originally posted by peterflyer at 2016-08-12 12:00:44
样本数量过小，就不能充分避免随机因素导致的误差，导致算出的R值不是太可靠。

有没有哪里能明确说明样本的大小具体有多大，跟样本性质有关系么？

赞一下

回复此楼

3楼2016-08-12 15:26:31

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

FMStation

至尊木虫 (知名作家)

应助: 591 (博士)
贵宾: 0.03
金币: 18247.2
红花: 97
帖子: 8891
在线: 1487.9小时
虫号: 2400059
注册: 2013-04-04
专业: 计算机应用技术

【答案】应助回帖

感谢参与，应助指数 +1

https://www.ncbi.nlm.nih.gov/pmc ... pdf/nihms514340.pdf

a large dataset is absolutely critical for statistically significant results with tight confidence intervals.
200 complexes: Pearson R = 0.7 > Pearson R = 0.6

linear regression - used to evaluate methods

A tighter correlation means better agreement between the data points and the fit line; therefore, there are smaller residuals and a tighter distribution of those residuals around the value zero.

Higher correlations lead to larger R^2 and smaller σ_res and
weaker correlations lead to lower R^2 and larger σ_res,
but the distributions remain Gaussian in shape.

赞一下

回复此楼

4楼2016-08-13 11:02:18

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 7 个回答

24小时热门版块排行榜

邙山的鱼

[求助] 关于统计中样本数目的一些问题 已有3人参与

» 猜你喜欢

» 本主题相关价值贴推荐，对您同样有帮助:

mbchen

【答案】应助回帖

peterflyer

【答案】应助回帖

邙山的鱼

FMStation

【答案】应助回帖

[求助] 关于统计中样本数目的一些问题已有3人参与