版块导航: 正在加载中...

客户端APP下载

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

thunderay

铁杆木虫 (小有名气)

应助: 4 (幼儿园)
金币: 14921.3
红花: 1
帖子: 182
在线: 129.8小时
虫号: 425995
注册: 2007-07-28
性别: GG
专业: 生物制药

[求助] QSAR中分集的问题

在一般的QSAR中，会分training set 和prediction set，前者用于建模，后者用于对建立模型的验证，然后如果这个模型可行就可以用于其它未知物的预测了；
但也有文献是在建模时分为calibration set, prediction set和testing set，这样分和之前的方法有没有实质性的区别？

» 收录本帖的淘帖专辑推荐

» 猜你喜欢

津理工大学晶体材料全国重点实验室刘红军教授课题组招收博士生一名已经有0人回复
【原创讨论】从电子约束到物质编辑：一套可迭代的环形磁场科技树已经有0人回复
物理学I论文润色/翻译怎么收费? 已经有288人回复
【方案分享】单环磁场+轴心控制+偏转导出电子束约束系统（可行性实验）已经有6人回复
【修正版】单环用磁约束低速电子实验方案（简化版）已经有0人回复
桂林理工大学物理学专业招收调剂，还有三个名额！！！已经有22人回复
考博自荐已经有4人回复
山东大学第二批博士研究生招生已经有0人回复
中国科学院东莞材料科学与技术研究所-2026年博士招生-吴昊研究员-磁学与自旋电子学已经有0人回复
《电磁学》教材推荐已经有1人回复
【急招】合肥工大核聚变材料计算方向2026级工程博士生已经有4人回复

» 本主题相关价值贴推荐，对您同样有帮助:

偏最小二乘算法已经有3人回复
如何选decoy set，做虚拟筛选？已经有11人回复
帮助介绍一些地理学方面的书籍！多谢关注！已经有7人回复
3D-QSAR运算时，CoMSIA的立体场色块问题已经有5人回复
【原创】分子对接，同源模建，分子动力学软件介绍帖已经有35人回复
【讨论】做QSAR时训练集和测试集的划分问题已经有5人回复
【原创】64位linux5.4下安装MS5.0全过程及MS linux原文件lic文件（已搜索，无重复）已经有43人回复
【求助】请教用DS做3D-QSAR问题已经有11人回复
09年晶体牛人名家实验室链接介绍(回帖有金币) 已经有161人回复
【求助】QSAR模型中交叉验证系数（q2）怎么获得？已经有19人回复

1楼 2012-02-27 19:22:02

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

应助: 4 (幼儿园)
金币: 14921.3
红花: 1
帖子: 182
在线: 129.8小时
虫号: 425995
注册: 2007-07-28
性别: GG
专业: 生物制药

引用回帖:

楼: Originally posted by yalefield at 2012-02-27 21:38:15:
按照统计学，应该是按照上述第二种方法；但由于实践中数据集不够大（样本少），因此之分两组，但training set在建模时，要用Cross Validation。

还有就是假设只有20个左右化合物，选取出其中80%在用软件比如DS建立MLR模型时，会自动Cross Validation吗？

3楼2012-02-28 09:24:58

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 9 个回答

yalefield

金虫 (文坛精英)

老汉一枚

计算强帖: 2
应助: 129 (高中生)
贵宾: 0.17
金币: 21238.9
散金: 3440
红花: 66
帖子: 12101
在线: 759.1小时
虫号: 96063
注册: 2005-10-07
专业: 高等教育学
管辖: 计算模拟

【答案】应助回帖

★ ★
感谢参与，应助指数 +1
thunderay(金币+2): ★★★很有帮助谢谢啊，那prediction set和testing set在用于验证的时候有实质性的差别吗 2012-02-28 09:22:18
dbb627(金币+2, 专家考核): 感谢应助 2012-03-02 10:55:42

按照统计学，应该是按照上述第二种方法；但由于实践中数据集不够大（样本少），因此之分两组，但training set在建模时，要用Cross Validation。

2楼2012-02-27 21:38:15

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

计算强帖: 2
应助: 129 (高中生)
贵宾: 0.17
金币: 21238.9
散金: 3440
红花: 66
帖子: 12101
在线: 759.1小时
虫号: 96063
注册: 2005-10-07
专业: 高等教育学
管辖: 计算模拟

【答案】应助回帖

俺不知道DS具体会咋做；如果它不做CV，俺估计它也不敢出来混。

4楼2012-02-28 09:31:16

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

thunderay

铁杆木虫 (小有名气)

应助: 4 (幼儿园)
金币: 14921.3
红花: 1
帖子: 182
在线: 129.8小时
虫号: 425995
注册: 2007-07-28
性别: GG
专业: 生物制药

引用回帖:

楼: Originally posted by yalefield at 2012-02-28 09:31:16:
俺不知道DS具体会咋做；如果它不做CV，俺估计它也不敢出来混。

还想请教一下，用training set或者calibration set建模完成之后，prediction set和testing set在用于验证的时候有实质性的差别吗

5楼2012-02-29 18:50:32

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 9 个回答