24小时热门版块排行榜    

查看: 1150  |  回复: 5

SunRuikang

新虫 (小有名气)

[交流] 建立qsar模型,为什么训练集化合物数量不应过多? 已有1人参与

《计算机辅助药物设计》指明,“用于构建方程的训练集最好不要超过50个化合物”。
个人认为,训练集化合物数量越多越好,像是过拟合等问题,应该从算法找原因,不是训练集过多的问题。
为什么qsar的训练集不能过多?
谢谢同好们!

发自小木虫Android客户端
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

SunRuikang

新虫 (小有名气)

2楼2020-09-01 17:41:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ltl_1988

至尊木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
这里是说的同系物建模的情况,而且是线性模型

发自小木虫Android客户端
3楼2020-09-02 01:00:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

SunRuikang

新虫 (小有名气)

引用回帖:
3楼: Originally posted by ltl_1988 at 2020-09-02 01:00:39
这里是说的同系物建模的情况,而且是线性模型

感谢回复,所以为什么化合物不应过多呢?

发自小木虫Android客户端
4楼2020-09-02 16:02:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ltl_1988

至尊木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼: Originally posted by SunRuikang at 2020-09-02 16:02:21
感谢回复,所以为什么化合物不应过多呢?
...

大概是因为容易过拟合或欠拟合吧,类似的太多会过拟合,差异太大的过多会欠拟合

发自小木虫Android客户端
5楼2020-09-02 21:14:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

SunRuikang

新虫 (小有名气)

引用回帖:
5楼: Originally posted by ltl_1988 at 2020-09-02 21:14:50
大概是因为容易过拟合或欠拟合吧,类似的太多会过拟合,差异太大的过多会欠拟合
...

谢谢!按理来说拟合错误应该是算法的问题,数据量增加会不会这样,我再研究一下。

发自小木虫Android客户端
6楼2020-09-03 20:20:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 SunRuikang 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见