24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 1736  |  回复: 8

thunderay

铁杆木虫 (小有名气)

[求助] QSAR中分集的问题

在一般的QSAR中,会分training set 和prediction set,前者用于建模,后者用于对建立模型的验证,然后如果这个模型可行就可以用于其它未知物的预测了;
但也有文献是在建模时分为calibration set, prediction set和testing set,这样分和之前的方法有没有实质性的区别?
回复此楼

» 收录本帖的淘帖专辑推荐

高斯

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
thunderay(金币+2): ★★★很有帮助 谢谢啊,那prediction set和testing set在用于验证的时候有实质性的差别吗 2012-02-28 09:22:18
dbb627(金币+2, 专家考核): 感谢应助 2012-03-02 10:55:42
按照统计学,应该是按照上述第二种方法;但由于实践中数据集不够大(样本少),因此之分两组,但training set在建模时,要用Cross Validation。
2楼2012-02-27 21:38:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

引用回帖:
: Originally posted by yalefield at 2012-02-27 21:38:15:
按照统计学,应该是按照上述第二种方法;但由于实践中数据集不够大(样本少),因此之分两组,但training set在建模时,要用Cross Validation。

还有就是假设只有20个左右化合物,选取出其中80%在用软件比如DS建立MLR模型时,会自动Cross Validation吗?
3楼2012-02-28 09:24:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

【答案】应助回帖

俺不知道DS具体会咋做;如果它不做CV,俺估计它也不敢出来混。
4楼2012-02-28 09:31:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

引用回帖:
: Originally posted by yalefield at 2012-02-28 09:31:16:
俺不知道DS具体会咋做;如果它不做CV,俺估计它也不敢出来混。

还想请教一下,用training set或者calibration set建模完成之后,prediction set和testing set在用于验证的时候有实质性的差别吗
5楼2012-02-29 18:50:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

czbee

金虫 (正式写手)

环科人

终于看到QSAR的帖子啦,留言收藏~~~
环科人
6楼2012-02-29 20:38:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★
dbb627(金币+2, 专家考核): 感谢应助 2012-03-02 10:56:17
引用回帖:
5楼: Originally posted by thunderay at 2012-02-29 18:50:32:
还想请教一下,用training set或者calibration set建模完成之后,prediction set和testing set在用于验证的时候有实质性的差别吗

training set或者calibration set建模,属于自我评价
用prediction set,则是同事评价
而test set,则是社会评价
7楼2012-03-01 09:12:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zlp-lw

木虫 (正式写手)

【答案】应助回帖


fegg7502: 金币+1, 鼓励交流 2012-09-08 10:21:14
你好,我想请教一下,那你的测试集和训练集是用什么方法划分的?
8楼2012-09-07 20:09:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yang16

新虫 (小有名气)

引用回帖:
2楼: Originally posted by yalefield at 2012-02-27 21:38:15
按照统计学,应该是按照上述第二种方法;但由于实践中数据集不够大(样本少),因此之分两组,但training set在建模时,要用Cross Validation。

您好,请问怎么划分测试集和训练集啊,谢谢啦
9楼2014-09-13 10:53:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 thunderay 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 材料考研求调剂总分280 +6 mkjlz1 2026-04-06 6/300 2026-04-06 16:33 by 197024
[考研] 环境专硕调剂 +3 会说话的肘子 2026-04-06 3/150 2026-04-06 15:44 by 给你你注意休息
[考研] 求助 +3 卡卡东88 2026-04-06 4/200 2026-04-06 15:28 by going home
[考研] 专硕304找调剂,一线城市最好 +3 李lsl李 2026-04-05 3/150 2026-04-06 12:16 by ffffjjjj
[考研] 0703化学调剂325分 +12 15771691647 2026-04-04 13/650 2026-04-06 12:00 by lijunpoly
[考研] 华南理工0703化学,总分336求调剂 +8 手机用户 2026-04-03 8/400 2026-04-06 11:48 by lijunpoly
[考研] 085602调剂 初试总分335 +9 19123253302 2026-04-05 9/450 2026-04-06 06:14 by houyaoxu
[考研] 材料工程302分求调剂 +9 zyx上岸! 2026-04-04 9/450 2026-04-05 22:08 by 醉翁wl
[考研] 348求调剂 +3 车厘子zzz 2026-04-05 3/150 2026-04-05 20:30 by 啵啵啵0119
[考研] 一志愿苏州大学材料工程(085601)专硕有科研经历三项国奖两个实用型专利一项省级立项 +10 大火山小火山 2026-04-05 10/500 2026-04-05 19:58 by 小蜗牛小蜗牛
[考研] 275求调剂 +16 waltzh 2026-04-01 16/800 2026-04-05 17:14 by Hdyxbekcb
[考研] 270求调剂 +9 小杰pp 2026-03-31 11/550 2026-04-05 11:02 by 风雨无晴
[考研] 求生物学学硕调剂——364分 +7 云朵遛弯指南 2026-04-04 7/350 2026-04-04 22:49 by zhyzzh
[考研] 296材料专硕求调剂 +21 202451007219 2026-04-02 22/1100 2026-04-04 21:48 by hemengdong
[考研] 调剂0855-288 +5 x熊二a 2026-04-03 5/250 2026-04-04 00:19 by 猪会飞
[考研] 调剂 +5 asdasdassda 2026-04-03 6/300 2026-04-03 20:27 by 岸上的一条鱼
[考研] 336求调剂 +8 kiyy 2026-04-01 8/400 2026-04-03 19:41 by lijunpoly
[考研] 372求调剂 +3 jj涌77 2026-04-02 3/150 2026-04-02 09:57 by olim
[考研] 310分求调剂 +4 成功上岸wang 2026-04-01 4/200 2026-04-01 20:35 by liu823948201
[考研] 合肥区域性重点一本招收调剂 +4 6266jl 2026-03-30 8/400 2026-03-31 18:43 by 6266jl
信息提示
请填处理意见