24小时热门版块排行榜    

查看: 898  |  回复: 3

zyl910616

银虫 (初入文坛)

[求助] Logistic分析时两分类数据时的一些问题 已有2人参与

对数据进行Logistic回归建模时,发生次数明显少于未发生次数,用全部数据拟合时拟合的方程结果很不理想。有的文献是从未发生数据中随机抽取一部分与发生数据进行拟合,但是我发现抽取数据不同时,拟合结果差距很大,这么分析的话结果可靠么。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
晋鹏: 屏蔽内容, 不鼓励回复与帖子无关内容~ 2017-10-07 14:00:50
本帖内容被屏蔽

2楼2017-08-17 22:37:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

b12345abba

金虫 (小有名气)

【答案】应助回帖

★ ★
zyl910616(晋鹏代发): 金币+2, 鼓励回帖交流~欢迎常来农林版交流经验~ 2017-10-07 20:45:25
两种思路,一种是采用零膨胀的二分类回归做,我理解到的零膨胀就是实验中发现某类事件大量的没有发生(最常见的是零膨胀的possion回归,R软件里的pscl包可以处理这种模型);
另一种就是如你所说的做抽样,但不是只抽一次、二次,可以采用bootstrap做,分别选择不同的抽样次数,比如500、600、700、800、900、1000,这样还可以分析,模型参数估计的稳定性随抽样次数的增加的变化情况。这个自己写个循环就行了。
3楼2017-08-19 23:08:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

伪装

金虫 (正式写手)

【答案】应助回帖


zyl910616(晋鹏代发): 金币+1, 鼓励回帖交流~欢迎常来农林版交流经验~ 2017-10-07 20:45:31
你可以做个Fisher判别分析。何必局限于logistics
从绝望中走向希望,人生才能迎来辉煌
4楼2017-10-07 10:23:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zyl910616 的主题更新
信息提示
请填处理意见