24小时热门版块排行榜    

查看: 374  |  回复: 4
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

bbslover

金虫 (正式写手)

[交流] 【讨论】outlier去除后,还需要重新计算描述符吗?

outlier的存在会使相关性变差,去除后模型的相关性会变好。于是有个问题,比如我有72个化合物,经过计算这72个化合物的描述符,再经过统计回归,发现有3个是outlier,这时我要去掉这3个,那么我是否还要重新计算剩下的69个的描述符,然后在进行统计呢? 还是不用计算了,就用第一次计算的结果,只是把这3个outlier去掉就行了呢?
谢谢!

[ Last edited by zeoliters on 2009-11-13 at 18:30 ]
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bbslover

金虫 (正式写手)

引用回帖:
Originally posted by yalefield at 2009-10-9 20:26:
描述符是一个分子一个分子计算的,除去Outlier,与分子的描述符无关,不需要重新计算。
但是,由于除去Outlier,那么描述符的“矩阵”发生变化,最大最小值,偏差等,都不同了。
因此,建立模型的过程,如归一化 ...

这个是关于2D的,那么3D的outlier去除后,还需要重新叠合吗? 是不是去除outlier后的,所有分子还需要重新叠合下?
3楼2009-10-09 22:18:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 5 个回答

yalefield

金虫 (文坛精英)

老汉一枚

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
mingdong(金币+3,VIP+0):感谢交流! 10-9 20:57
描述符是一个分子一个分子计算的,除去Outlier,与分子的描述符无关,不需要重新计算。
但是,由于除去Outlier,那么描述符的“矩阵”发生变化,最大最小值,偏差等,都不同了。
因此,建立模型的过程,如归一化处理等,都要重新进行。
2楼2009-10-09 20:26:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bbslover

金虫 (正式写手)

引用回帖:
Originally posted by yalefield at 2009-10-9 22:40:
当然要重新叠合

这个知道了,那写论文的时候,如何列出预测的值呢? 因为第一次计算比如(comfa)得到预测值,通过这些值可以判断出哪些是outlier,那这些第一次计算的结果是不是要列出来啊? 通过列出来的表说明哪些是outlier,那去除outlier之后,还要重新叠合,重新计算,得到的结果还要再列出一个表格吗? 看到paper上常常就说哪些是outlier,似乎没有重新计算呢? 不知道我理解的对不?
5楼2009-10-09 23:14:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见