24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1548  |  回复: 8
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

thunderay

铁杆木虫 (小有名气)

[求助] QSAR中分集的问题

在一般的QSAR中,会分training set 和prediction set,前者用于建模,后者用于对建立模型的验证,然后如果这个模型可行就可以用于其它未知物的预测了;
但也有文献是在建模时分为calibration set, prediction set和testing set,这样分和之前的方法有没有实质性的区别?
回复此楼

» 收录本帖的淘帖专辑推荐

高斯

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

引用回帖:
: Originally posted by yalefield at 2012-02-27 21:38:15:
按照统计学,应该是按照上述第二种方法;但由于实践中数据集不够大(样本少),因此之分两组,但training set在建模时,要用Cross Validation。

还有就是假设只有20个左右化合物,选取出其中80%在用软件比如DS建立MLR模型时,会自动Cross Validation吗?
3楼2012-02-28 09:24:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 9 个回答

yalefield

金虫 (文坛精英)

老汉一枚

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
thunderay(金币+2): ★★★很有帮助 谢谢啊,那prediction set和testing set在用于验证的时候有实质性的差别吗 2012-02-28 09:22:18
dbb627(金币+2, 专家考核): 感谢应助 2012-03-02 10:55:42
按照统计学,应该是按照上述第二种方法;但由于实践中数据集不够大(样本少),因此之分两组,但training set在建模时,要用Cross Validation。
2楼2012-02-27 21:38:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

【答案】应助回帖

俺不知道DS具体会咋做;如果它不做CV,俺估计它也不敢出来混。
4楼2012-02-28 09:31:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

引用回帖:
: Originally posted by yalefield at 2012-02-28 09:31:16:
俺不知道DS具体会咋做;如果它不做CV,俺估计它也不敢出来混。

还想请教一下,用training set或者calibration set建模完成之后,prediction set和testing set在用于验证的时候有实质性的差别吗
5楼2012-02-29 18:50:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见