24小时热门版块排行榜    

CyRhmU.jpeg
查看: 153  |  回复: 2
当前主题已经存档。

bbslover

金虫 (正式写手)

[交流] 【讨论】如何把高维数据映射到二维,使用SOM??

The 120 compounds were split into training and test sets based on their distribution in the chemical space as defined by SOM .如何理解这句话? 什么叫based on their distribution in the chemical space,问题 1.是不是就是计算的描述符的值,然后用SOM得到附件中的图形? 这里面使用区分测试集和训练集的方法就是用描述符本身吧,没有考虑到活性?
2.要是就基于描述符,那这些描述符是去除衡量值之后,以及标准差接近零等描述符之后的,还是所有描述符(即就是直接计算完没有任何处理的,比如dragon的1664个?  还是经过处理后的80个?)来应用SOM聚类呢?

3. 相应的样本号如何标出来呢?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

whitewatercn

银虫 (小有名气)

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
lei0736(金币+3,VIP+0):谢谢 欢迎常来 12-23 17:59
这句话就是说:把所有的分子用SOM映射到二维空间(网格)内,然后在平面内均匀地挑选出一部分作为测试集(图中的红色点,基本上是每个网格内挑一个)

SOM就是把高维的描述符空间投影到低维的空间,你用1000个也行,用80个也可以,个人觉得用描述符选择后的80个比较合理一些

[ Last edited by whitewatercn on 2009-12-23 at 09:44 ]
2楼2009-12-23 09:39:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bbslover

金虫 (正式写手)

多谢帮助,回去试试
3楼2009-12-23 15:09:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 bbslover 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见