版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

thunderay

铁杆木虫 (小有名气)

应助: 4 (幼儿园)
金币: 14923.3
红花: 1
帖子: 182
在线: 129.8小时
虫号: 425995
注册: 2007-07-28
性别: GG
专业: 生物制药

[求助] QSAR中分集的问题

在一般的QSAR中，会分training set 和prediction set，前者用于建模，后者用于对建立模型的验证，然后如果这个模型可行就可以用于其它未知物的预测了；
但也有文献是在建模时分为calibration set, prediction set和testing set，这样分和之前的方法有没有实质性的区别？

回复此楼

1楼 2012-02-27 19:22:02

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

计算强帖: 2
应助: 129 (高中生)
贵宾: 0.17
金币: 21238.9
散金: 3440
红花: 66
帖子: 12101
在线: 759.1小时
虫号: 96063
注册: 2005-10-07
专业: 高等教育学
管辖: 计算模拟

【答案】应助回帖

★ ★
感谢参与，应助指数 +1
thunderay(金币+2): ★★★很有帮助谢谢啊，那prediction set和testing set在用于验证的时候有实质性的差别吗 2012-02-28 09:22:18
dbb627(金币+2, 专家考核): 感谢应助 2012-03-02 10:55:42

按照统计学，应该是按照上述第二种方法；但由于实践中数据集不够大（样本少），因此之分两组，但training set在建模时，要用Cross Validation。

赞一下

回复此楼

2楼2012-02-27 21:38:15

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

应助: 4 (幼儿园)
金币: 14923.3
红花: 1
帖子: 182
在线: 129.8小时
虫号: 425995
注册: 2007-07-28
性别: GG
专业: 生物制药

引用回帖:

楼: Originally posted by yalefield at 2012-02-27 21:38:15:
按照统计学，应该是按照上述第二种方法；但由于实践中数据集不够大（样本少），因此之分两组，但training set在建模时，要用Cross Validation。

还有就是假设只有20个左右化合物，选取出其中80%在用软件比如DS建立MLR模型时，会自动Cross Validation吗？

赞一下

回复此楼

3楼2012-02-28 09:24:58

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

计算强帖: 2
应助: 129 (高中生)
贵宾: 0.17
金币: 21238.9
散金: 3440
红花: 66
帖子: 12101
在线: 759.1小时
虫号: 96063
注册: 2005-10-07
专业: 高等教育学
管辖: 计算模拟

【答案】应助回帖

俺不知道DS具体会咋做；如果它不做CV，俺估计它也不敢出来混。

赞一下

回复此楼

4楼2012-02-28 09:31:16

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

应助: 4 (幼儿园)
金币: 14923.3
红花: 1
帖子: 182
在线: 129.8小时
虫号: 425995
注册: 2007-07-28
性别: GG
专业: 生物制药

引用回帖:

楼: Originally posted by yalefield at 2012-02-28 09:31:16:
俺不知道DS具体会咋做；如果它不做CV，俺估计它也不敢出来混。

还想请教一下，用training set或者calibration set建模完成之后，prediction set和testing set在用于验证的时候有实质性的差别吗

赞一下

回复此楼

5楼2012-02-29 18:50:32

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

czbee

金虫 (正式写手)

环科人

应助: 6 (幼儿园)
金币: 1329.2
散金: 405
红花: 2
帖子: 498
在线: 133.4小时
虫号: 1162633
注册: 2010-12-04
性别: MM
专业: 理论环境化学

终于看到QSAR的帖子啦，留言收藏~~~

赞一下

回复此楼

环科人

6楼2012-02-29 20:38:01

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

计算强帖: 2
应助: 129 (高中生)
贵宾: 0.17
金币: 21238.9
散金: 3440
红花: 66
帖子: 12101
在线: 759.1小时
虫号: 96063
注册: 2005-10-07
专业: 高等教育学
管辖: 计算模拟

★ ★
dbb627(金币+2, 专家考核): 感谢应助 2012-03-02 10:56:17

引用回帖:

5楼: Originally posted by thunderay at 2012-02-29 18:50:32:
还想请教一下，用training set或者calibration set建模完成之后，prediction set和testing set在用于验证的时候有实质性的差别吗

training set或者calibration set建模，属于自我评价
用prediction set，则是同事评价
而test set，则是社会评价

赞一下

回复此楼

7楼2012-03-01 09:12:44

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖