24小时热门版块排行榜    

查看: 2720  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

sunices

木虫 (初入文坛)

[交流] 【求助】欧式距离在很高维空间是否有维数灾难问题(太重要了)

我们知道维数灾难(Curse of Dimensionality)是说由于维数增加使得空间体积指数级增长所引起的问题。一个方法的性能如果受空间体积指数级增长的影响,则发生维数灾难。例如估计密度函数的邻域法,当维数较高时,在大部分邻域内是没有样本的,从而邻域法取不到样本。
(1)对于计算空间中两个点之间距离的欧式距离公式,其计算的欧式距离在很高维空间是否有维数灾难问题?
(2)当维数很高时,是否欧式距离测度将使得任两点间的距离趋向相等?
    此问题的重要性在于,广泛使用的欧式距离在高维空间若有维数灾难问题,那么现有的与欧式距离有关的大部分方法将在高维空间失效,不能使用!例如在做高维数据的聚类时就碰到这个问题,若此问题成立,则基于欧式距离的聚类方法都不能使用!
    那么如何分析这个问题?有什么可参考的文章?

请大家指点!

看了大家的回复,这里举个例子以更好地说明:
    数据(1,0)和(0,1)是2维的,放在平面上就是2个点,可以计算这2个点之间的欧式距离为根号2;数据(1,0,1)和(0,1,0)是3维的,可在3维空间中表示这2个点,可以计算这2个点之间的欧式距离为根号3;这种低维情况没有维数灾难问题。那么,若数据(1,0,1,0,1,0,...)和(0,1,0,1,0,1,...)是例如1万或1亿维的(生物学中的基因表达数据就有上万维的数据),就要考虑是否有维数灾难问题。此时,就需要知道上述(1)和(2)的问题是否成立。

[ Last edited by sunices on 2010-4-1 at 08:39 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

379417723

铜虫 (小有名气)


sunices(金币+1):谢谢参与
小雨萌萌:如果每个求助帖必回,请说点含金量更高的话,否则要被扣金币的。请理解。 2010-03-31 14:45
额,有点复杂了吧。
10楼2010-03-31 14:03:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

379417723

铜虫 (小有名气)

不好意思,题目大概还是看懂了,可我觉得版主举得例子与题目联系么有很大,拓扑空间是豪斯多夫空间,那么单点集就一定是闭集。为什么要与维数扯上关系了?
12楼2010-04-03 07:41:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 sunices 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见