24小时热门版块排行榜    

查看: 1152  |  回复: 5
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

SunRuikang

新虫 (小有名气)

[交流] 建立qsar模型,为什么训练集化合物数量不应过多? 已有1人参与

《计算机辅助药物设计》指明,“用于构建方程的训练集最好不要超过50个化合物”。
个人认为,训练集化合物数量越多越好,像是过拟合等问题,应该从算法找原因,不是训练集过多的问题。
为什么qsar的训练集不能过多?
谢谢同好们!

发自小木虫Android客户端
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ltl_1988

至尊木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
这里是说的同系物建模的情况,而且是线性模型

发自小木虫Android客户端
3楼2020-09-02 01:00:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 6 个回答

SunRuikang

新虫 (小有名气)

2楼2020-09-01 17:41:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

SunRuikang

新虫 (小有名气)

引用回帖:
3楼: Originally posted by ltl_1988 at 2020-09-02 01:00:39
这里是说的同系物建模的情况,而且是线性模型

感谢回复,所以为什么化合物不应过多呢?

发自小木虫Android客户端
4楼2020-09-02 16:02:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ltl_1988

至尊木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼: Originally posted by SunRuikang at 2020-09-02 16:02:21
感谢回复,所以为什么化合物不应过多呢?
...

大概是因为容易过拟合或欠拟合吧,类似的太多会过拟合,差异太大的过多会欠拟合

发自小木虫Android客户端
5楼2020-09-02 21:14:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见