24小时热门版块排行榜    

查看: 2723  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

sunices

木虫 (初入文坛)

[交流] 【求助】欧式距离在很高维空间是否有维数灾难问题(太重要了)

我们知道维数灾难(Curse of Dimensionality)是说由于维数增加使得空间体积指数级增长所引起的问题。一个方法的性能如果受空间体积指数级增长的影响,则发生维数灾难。例如估计密度函数的邻域法,当维数较高时,在大部分邻域内是没有样本的,从而邻域法取不到样本。
(1)对于计算空间中两个点之间距离的欧式距离公式,其计算的欧式距离在很高维空间是否有维数灾难问题?
(2)当维数很高时,是否欧式距离测度将使得任两点间的距离趋向相等?
    此问题的重要性在于,广泛使用的欧式距离在高维空间若有维数灾难问题,那么现有的与欧式距离有关的大部分方法将在高维空间失效,不能使用!例如在做高维数据的聚类时就碰到这个问题,若此问题成立,则基于欧式距离的聚类方法都不能使用!
    那么如何分析这个问题?有什么可参考的文章?

请大家指点!

看了大家的回复,这里举个例子以更好地说明:
    数据(1,0)和(0,1)是2维的,放在平面上就是2个点,可以计算这2个点之间的欧式距离为根号2;数据(1,0,1)和(0,1,0)是3维的,可在3维空间中表示这2个点,可以计算这2个点之间的欧式距离为根号3;这种低维情况没有维数灾难问题。那么,若数据(1,0,1,0,1,0,...)和(0,1,0,1,0,1,...)是例如1万或1亿维的(生物学中的基因表达数据就有上万维的数据),就要考虑是否有维数灾难问题。此时,就需要知道上述(1)和(2)的问题是否成立。

[ Last edited by sunices on 2010-4-1 at 08:39 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

379417723

铜虫 (小有名气)

不好意思,题目大概还是看懂了,可我觉得版主举得例子与题目联系么有很大,拓扑空间是豪斯多夫空间,那么单点集就一定是闭集。为什么要与维数扯上关系了?
12楼2010-04-03 07:41:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 17 个回答

scuxchen

金虫 (著名写手)


sunices(金币+1):谢谢参与
感觉很高深,不懂。
更想知道这个“维数”是什么维数。
拳打脚踢
2楼2010-03-27 16:52:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

小雨萌萌

铜虫 (文坛精英)

优秀版主



sunices(金币+1):谢谢参与
对于算法的收敛性证明也是如此。好多东西在高维时做不下去。可惜了那么多漂亮的结果。比如任意有界子集是相对紧集。

[ Last edited by 小雨萌萌 on 2010-3-27 at 19:33 ]
3楼2010-03-27 17:26:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

just_play

至尊木虫 (正式写手)


sunices(金币+1):谢谢参与
引用回帖:
Originally posted by 小雨萌萌 at 2010-03-27 17:26:56:
对于算法的收敛性证明也是如此。好多东西在高维时做不下去。可惜了那么多漂亮的结果。比如单点集是闭集。

看不懂斑竹举的例子:

只要所考察的拓扑空间是豪斯多夫空间,那么单点集就一定是闭集。这个与维数无关吧??
So Trivial !
4楼2010-03-27 17:49:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见