24小时热门版块排行榜    

查看: 279  |  回复: 4
当前主题已经存档。

bbslover

金虫 (正式写手)

[交流] 【讨论】描述符太多了,处理后剩下200个,能行吗?

原始600个描述符,去除恒值,去除零值个数占90%的描述符,去除sd<0.5的描述符后还剩下200个, 接下来用这200个进行主成份分析得出主成份在进行回归可以吗?  还有更好的方法把这200个描述符进一步减少呢?

[ Last edited by zeoliters on 2009-11-13 at 17:33 ]
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yinjj

金虫 (职业作家)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
zeoliters(金币+2,VIP+0):谢谢回帖交流! 11-12 17:15
当然还有其它方法了,如简单的fisher法、熵法........复杂的如遗传算法、决策树之类的....................不管用什么方法,选择出来的decriptors一定要有物理意义,且要具有可解释性,这样建立的QSAR/QSPR在理论才有一定的意义啊!
独立之精神,自由之思想!
2楼2009-11-12 19:16:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bbslover

金虫 (正式写手)

引用回帖:
Originally posted by yinjj at 2009-11-12 19:16:
当然还有其它方法了,如简单的fisher法、熵法........复杂的如遗传算法、决策树之类的....................不管用什么方法,选择出来的decriptors一定要有物理意义,且要具有可解释性,这样建立的QSAR/QSPR在理论 ...

那是不是说,不管用什么方法,选出来的描述符对training set 和test set都有好的统计结果,且可以解释,就可以啊? 比如说,我随便自己瞎选几个,恰巧碰上了这几过效果好,也好解释,就行。呵呵,这是极端说法了。写文章时候没有依据。
3楼2009-11-14 01:41:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yinjj

金虫 (职业作家)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
zeoliters(金币+2,VIP+0):谢谢回帖交流! 11-15 22:35
选择描述符时,一是根据专家知识选择,二是根据统计方法选择,即所谓的统计分子设计。当然二者结合也可以啊。法无定法,只要能找到具有物理化学、生物意义的应当就可以了吧。说得不好,请批评哈!
独立之精神,自由之思想!
4楼2009-11-14 13:33:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bbslover

金虫 (正式写手)

引用回帖:
Originally posted by yinjj at 2009-11-14 13:33:
选择描述符时,一是根据专家知识选择,二是根据统计方法选择,即所谓的统计分子设计。当然二者结合也可以啊。法无定法,只要能找到具有物理化学、生物意义的应当就可以了吧。说得不好,请批评哈!

说的很好。谢谢回复。
5楼2009-11-14 21:30:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 bbslover 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见