24小时热门版块排行榜     石溪大学接受考研调剂申请>

【调剂】北京石油化工学院2024年16个专业接受调剂
查看: 3498  |  回复: 16
【奖励】 本帖被评价13次,作者制用读6085增加金币 9.8

制用读6085

禁虫 (初入文坛)


[资源] 最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)

大家肯定会经常遇到一大堆临床数据不知从何入手的情况,尽管看了很多教材,里面也介绍了应该先做什么再怎么样,但是当我们实际操作时,却发现并不是一件那么有用的事,所以今天就分享一些统计学常用术语、分析软件、统计方法及案例以及统计方法相关知识。

一、统计学常用术语

1、计量资料

计量资料指连续的数据,通常有具体的数值,如年龄、身高、体重、血红蛋白、胆红素和白蛋白等。

计量资料的数据分布特征有三种情况:集中趋势(涉及量:均数、几何均数、中位数)、离散程度(涉及量:极差、百分位数和四分位数间距、方差、标准差、变异系数)、分布形状(正态分布、偏态分布)。
最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)
1.png
2、正态分布

是一种概率分布,其特征是“钟”形曲线。

3、均值(mean)

是平均数水平,应用甚广,最适用于对称分布,特别是正态分布。

4、标准偏差(standard deviation,sd)

总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。(也叫标准差)

5、标准误差(standard error of mean,sem)

是描述对应的样本统计量抽样分布的离散程度及衡量对应样本统计量抽样误差大小的尺度。反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。将标准差除以样本大小n的平方根即可得出标准误差。(也叫标准误)

6、变异系数(coefficient of variation,cv)

是原始数据标准差与原始数据平均数的比(标准差 sd / 平均值mean );如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除。

最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)-1
2.png
7、偏态分布

即统计数据峰值与平均值不相等的频率分布,特点一是左右不对称(即所谓偏态)、二是当样本增大时,其均数趋向正态分布。

8、中位数(median)

指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数。是位次居中的观察值水平,应用于偏态分布,分布不明,或分布末端无确定值情况。

9、四分位间距

由p25、p50、p75将一组变量值等分为四部分,p25称下四分位数,p75称上四分位数,将p75与p25之差定义为四分位数间距。(p50即中位数)

excel公式函数:中位数(median):median(an:am);  

四分位间距:quartile(an:am,1)即为p25,quartile(an:am,3)即为p75。

10、计数资料

计数资料是指先将观察单位按其性质或类别分组,然后清点各组观察单位个数所得的资料。(比如:某100例研究对象,其中男性58例,女性42例。)

11、率

率又称频率指标,是反映一定时期内某现象发生的频率或强度,常以百分率(%)。(比如:上述男性所占百分率为58.0%。)

12、构成比

构成比又称构成指标,是用于反映某一事物内部各组成部分所占的比重或分布。(比如:上述男性吸烟15例(男性吸烟率15/58=25.9%),女性吸烟10例(女性吸烟率10/42=23.8%),而男性吸烟构成比为15/25=0.6。)

二、统计学分析软件
最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)-2
3.png
三、统计方法

1、t检验

亦称student t检验(student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布;用于检验两个总体的均值差异是否显著。

注意:

t检验的前提:

① 来自正态分布总体;

② 随机样本 ;

③ 均数比较时,要求两样本总体方差相等,即具有方差齐性)

包括配对t检验和非配对t检验(独立样本t检验)

配对t检验:

适用于配对设计计量资料均数的比较。包含同源配对(同一受试对象或同一标本的2个部分,如癌组织和癌旁组织配对分析、受试对象治疗前后的指标差异等)和异源配对(将2个同质受试对象配对,分别接受两种处理,如把同窝、同性别和体重相近的动物配成对)。

非配对t检验(独立样本t检验):

适用于完全随机设计的两样本均数的比较。

2、单因素方差分析

(one-way anova):

对多个(两个以上)处理平均数进行假设检验的方法,而单因素是指该实验中只有一个实验因素。

注意:

单因素方差分析的前提:

① 各样本是相互独立的随机样本;

② 各样本均来自正态分布总体;

③ 各样本的总体方差相等,即具有方差齐性;

④ 在不满足正态性时可以用非参数检验。

one-way anova:

务必进行post hoc检验,也称事后分析,或称为两两比较分析。

post hoc检验包含:

tukey's(最常用,需要样本数目相同) 、bonferroni(样本数目相同,比较次数不多时效果好)、s-n-k (student-newman-keuls)、dunnett等。

3、重复测量方差分析

(repeated measurement anova)

每个受试对象在不同时间点进行了重复测量。

前提:

① 各处理水平的个体间是相互独立的随机样本(样本内不独立),符合正态分布,满足方差齐;

② 各方差点的协方差阵满足球形性特征。

双因素方差分析(two-way anova ):

是指用于分析两因素实验资料的方差分析。

满足6项假设:

① 因变量是连续变量;

② 存在两个自变量,且都是分类变量;

③ 具有相互独立的观测值;

④ 任一分类中不存在显著异常值;

⑤ 任一分类中残差近似正态分布;

⑥ 任一分类都具有等方差性。

同样需进行post hoc检验,也称事后分析,或称为两两比较分析(与单因素方差分析类似);

post hoc检验包含:tukey's(最常用,需要样本数目相同) 、bonferroni(比较次数不多时效果好)、s-n-k (student-newman-keuls)、dunnett等

4、相关性分析

衡量两个变量因素的相关密切程度(相关系数 :0.8-1.0 极强相关;0.6-0.8 强相关;0.4-0.6 中等程度相关;0.2-0.4 弱相关;0.0-0.2 极弱相关或无相关)包含:pearson相关和spearman相关。

pearson相关:

用于度量两个变量x和y之间的相关(线性相关),其值介于-1与1之间。

spearman相关:

等级变量之间的pearson相关系数。(等级变量:如tnm分期:t1/t2/t3/t4;免疫组化:阴性/弱阳性/中等阳性/强阳性)

方法或结果描述:pearson/spearman相关分析x和y的关系。

5、kaplan meier

以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。常用于临床分析,用于预后分析,如死亡、疾病的发生、复发、转移和痊愈的研究。

定义:

起始事件(initial event):反应生存时间起始特征的事件,如疾病确诊、某种疾病治疗开始等。

失效事件(failure event):在生存分析随访研究过程中,一部分研究对象可观察到死亡,可以得到准确的生存时间,它提供的信息是完全的,这种事件称为失效事件,也称之为死亡事件、终点事件。

终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。

总生存(overall survival ,os):

——指从随机化开始至因任何原因引起死亡的时间。

无进展生存(progression-free survival ,pfs):

——指由随机至第一次发生疾病进展或任何原因死亡的时间。

无复发生存(relapse free survival,rfs):

——从随机化开始直至肿瘤复发、或死亡的时间。

无瘤生存(disease-free survival ,dfs)一般称为无病生存:

指从随机化开始到出现复发或转移的时间。

无远处转移生存(distant metastasis-free surviva,dmfs):

从随机化开始直至发生远处转移的时间。非癌局部或区域内出现的继发性病灶称为远处转移。

无事件生存(event-free survival ,efs):

指从随机化开始到出现复发、死亡或继发第二肿瘤的时间。

kaplan meier生存分析总结:

① 应用:主要用于临床(研究对象人)各种预后分析或观察动物生存情况。

② 方法描述(举例):采用kaplan-meier法计算患者的生存率,用log-rank检验进行单因素分析。其他:生存分析用kaplan-meier法,log-rank法进行生存率差异检

③ 图题/图注描述(举例):图题:kaplan-meier 分析患者的总生存/无进展生存(使用log-rank检验计算p值)

④ 其他:图中需体现p值,建议可以在横坐标时间轴上体现具体的数据信息(如之前的文献参考案例)。

6、卡方检验(chi-squared test)

比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。

① 四格表资料的卡方检验用于进行两个率或两个构成比的比较。

要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率(fisher精确检验)。

② r*c 列联表的卡方检验用于r*c列联表的相关分析

要求每个格子中的理论频数t均大于5或1<t<5的格子数不超过总格子数的1/5。当有t<1或1<t<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行x列表资料卡方检验的应用条件。而多个率的两两比较可采用行x列表分割的办法。


最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)-3
4.png

四、统计方法相关总结
最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)-4
5.png


最详细的统计学入门知识(附(中国医科大学)医学统计视频教程)-5
6.png
回复此楼

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:libolin3@tal.com
  • 附件 1 : 中国医科大学_医学统计_视频教程.docx
  • 2019-07-24 09:30:02, 158.02 K

» 本帖已获得的红花(最新10朵)

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ly274126594

新虫 (初入文坛)


送红花一朵
非常感谢!
3楼2019-07-29 13:07:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hanxiaominhu

至尊木虫 (著名写手)


引用回帖:
7楼: Originally posted by hanxiaominhu at 2019-10-02 01:02:11
顶一下,感谢分享!

原来只是借鸡下蛋啊!
8楼2019-10-02 01:06:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sunvzi

铜虫 (初入文坛)


★ 一星级,一般

很详细,很感谢分享!不过我想咨询一下,pearson相关系数和spearman相关系数之间具体的区别?还是没有特别明白,感谢!
10楼2020-02-08 20:59:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

humenghu

铁虫 (初入文坛)


引用回帖:
10楼: Originally posted by sunvzi at 2020-02-08 20:59:53
很详细,很感谢分享!不过我想咨询一下,pearson相关系数和spearman相关系数之间具体的区别?还是没有特别明白,感谢!

区别是前者用原始值算,后者用秩来算。都可以体现相关。后者对非线性的相关反应的好一些。
13楼2020-02-20 20:53:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
简单回复
2019-07-29 13:06   回复  
三星好评  顶一下,感谢分享!
dangt4楼
2019-08-04 16:17   回复  
五星好评  顶一下,感谢分享!
lhswmg5楼
2019-08-29 14:43   回复  
五星好评  顶一下,感谢分享!
2019-09-11 23:55   回复  
五星好评  顶一下,感谢分享!
2019-10-02 01:02   回复  
五星好评  顶一下,感谢分享!
2019-10-06 07:56   回复  
五星好评  顶一下,感谢分享!
hwxlq11楼
2020-02-16 08:27   回复  
五星好评  顶一下,感谢分享!
2020-02-19 11:07   回复  
五星好评  顶一下,感谢分享!
jxguo14楼
2020-10-10 16:54   回复  
五星好评  顶一下,感谢分享!
kingniuniu15楼
2023-01-18 09:42   回复  
五星好评  顶一下,感谢分享!
sxyhb16楼
2023-02-24 12:51   回复  
五星好评  顶一下,感谢分享!
zhoucp3yao17楼
2023-03-03 15:35   回复  
五星好评  顶一下,感谢分享!
相关版块跳转 我要订阅楼主 制用读6085 的主题更新
☆ 无星级 ★ 一星级 ★★★ 三星级 ★★★★★ 五星级
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[硕博家园] 博士白读了 +33 Da_Meng_Zi 2024-04-21 36/1800 2024-04-23 17:22 by 李_q_y
[教师之家] 刚博士毕业,入职普通一本高校 +16 保持肌肤 2024-04-20 17/850 2024-04-23 17:20 by 白菜1992
[有机交流] 紧急求助,有谁用过三甲基硅醇钾TMSOK吗? 1000+3 genius2008 2024-04-19 8/400 2024-04-23 16:57 by czyzsu
[考博] 博士申请 +4 zhangxm0525 2024-04-17 12/600 2024-04-23 16:35 by 莹亮的星空
[硕博家园] 聊天 +6 暮色恋伊人 2024-04-22 7/350 2024-04-23 15:35 by viraa
[电化学] 有偿收购废弃锂硫电池 +3 汤圆喵 2024-04-19 5/250 2024-04-23 10:41 by Happy C
[基金申请] 特别资助审核状态 +12 pantray 2024-04-17 18/900 2024-04-23 09:50 by y20150913
[论文投稿] 国家重点研发计划论文可以发MDPI里的期刊吗 +6 lin_2018 2024-04-17 6/300 2024-04-22 17:32 by 20094958
[考博] 25申博记录贴 +6 我属驴核动力驴 2024-04-18 12/600 2024-04-22 15:50 by 诩雾
[考研] 博士生招生!! +3 2458827884 2024-04-19 3/150 2024-04-22 12:37 by 钰波love
[论文投稿] 研究光催化的,好中的三四区 20+3 sl.0117 2024-04-20 3/150 2024-04-22 09:53 by bobvan
[论文投稿] 编辑是选国外的好还是国内的好。 +8 lizhengke06 2024-04-20 8/400 2024-04-22 08:58 by cuiyunjian
[有机交流] 兄弟们帮我看看这两个结构怎么合成 +6 xl2088131 2024-04-17 8/400 2024-04-21 22:39 by zyqchem
[论文投稿] 催稿后秒拒 +9 lizhengke06 2024-04-19 11/550 2024-04-21 22:29 by ggjjyyy
[硕博家园] 材料工程,二本硕士,值得读吗 +3 简风23 2024-04-20 6/300 2024-04-21 12:19 by 简风23
[考研] 312求调剂 +3 Leroic000 2024-04-19 3/150 2024-04-20 18:19 by xinaishan
[论文投稿] 一审一个审稿人,小修,会怎么样呀? +10 林师妹 2024-04-18 10/500 2024-04-20 18:08 by 肖虫家
[基金申请] 估计今年青基又没戏 +11 忆念7 2024-04-18 11/550 2024-04-20 17:29 by mygod_nju
[论文投稿] CCS Chemistry投稿求助 30+3 wfqtriumph 2024-04-17 4/200 2024-04-19 08:56 by Bletilla
[论文投稿] 发个文章,结果被某学报请的外审PUA了 +3 ziniu168 2024-04-18 8/400 2024-04-18 21:40 by xli1984
信息提示
请填处理意见