24小时热门版块排行榜    

查看: 2717  |  回复: 16

sunices

木虫 (初入文坛)

[交流] 【求助】欧式距离在很高维空间是否有维数灾难问题(太重要了)

我们知道维数灾难(Curse of Dimensionality)是说由于维数增加使得空间体积指数级增长所引起的问题。一个方法的性能如果受空间体积指数级增长的影响,则发生维数灾难。例如估计密度函数的邻域法,当维数较高时,在大部分邻域内是没有样本的,从而邻域法取不到样本。
(1)对于计算空间中两个点之间距离的欧式距离公式,其计算的欧式距离在很高维空间是否有维数灾难问题?
(2)当维数很高时,是否欧式距离测度将使得任两点间的距离趋向相等?
    此问题的重要性在于,广泛使用的欧式距离在高维空间若有维数灾难问题,那么现有的与欧式距离有关的大部分方法将在高维空间失效,不能使用!例如在做高维数据的聚类时就碰到这个问题,若此问题成立,则基于欧式距离的聚类方法都不能使用!
    那么如何分析这个问题?有什么可参考的文章?

请大家指点!

看了大家的回复,这里举个例子以更好地说明:
    数据(1,0)和(0,1)是2维的,放在平面上就是2个点,可以计算这2个点之间的欧式距离为根号2;数据(1,0,1)和(0,1,0)是3维的,可在3维空间中表示这2个点,可以计算这2个点之间的欧式距离为根号3;这种低维情况没有维数灾难问题。那么,若数据(1,0,1,0,1,0,...)和(0,1,0,1,0,1,...)是例如1万或1亿维的(生物学中的基因表达数据就有上万维的数据),就要考虑是否有维数灾难问题。此时,就需要知道上述(1)和(2)的问题是否成立。

[ Last edited by sunices on 2010-4-1 at 08:39 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

scuxchen

金虫 (著名写手)


sunices(金币+1):谢谢参与
感觉很高深,不懂。
更想知道这个“维数”是什么维数。
拳打脚踢
2楼2010-03-27 16:52:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

小雨萌萌

铜虫 (文坛精英)

优秀版主



sunices(金币+1):谢谢参与
对于算法的收敛性证明也是如此。好多东西在高维时做不下去。可惜了那么多漂亮的结果。比如任意有界子集是相对紧集。

[ Last edited by 小雨萌萌 on 2010-3-27 at 19:33 ]
3楼2010-03-27 17:26:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

just_play

至尊木虫 (正式写手)


sunices(金币+1):谢谢参与
引用回帖:
Originally posted by 小雨萌萌 at 2010-03-27 17:26:56:
对于算法的收敛性证明也是如此。好多东西在高维时做不下去。可惜了那么多漂亮的结果。比如单点集是闭集。

看不懂斑竹举的例子:

只要所考察的拓扑空间是豪斯多夫空间,那么单点集就一定是闭集。这个与维数无关吧??
So Trivial !
4楼2010-03-27 17:49:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

再见北极雪

木虫 (著名写手)

快乐家族之打酱油的小伙计


sunices(金币+1):谢谢参与
引用回帖:
Originally posted by 小雨萌萌 at 2010-03-27 17:26:56:
对于算法的收敛性证明也是如此。好多东西在高维时做不下去。可惜了那么多漂亮的结果。比如任意有界子集是相对紧集。

[ Last edited by 小雨萌萌 on 2010-3-27 at 19:33 ]

从最基本的开始讨论。个人认为,数学的基础还不够完善,就像复数未被定义之前一样,很多东西值得我们讨论!
5楼2010-03-28 11:37:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kingkanglee

新虫 (正式写手)


sunices(金币+1):谢谢参与
帮你顶一下
两岸共同市场就是一中市场。
6楼2010-03-29 14:22:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

susan09

木虫 (正式写手)


sunices(金币+1):谢谢参与
没看明白
7楼2010-03-29 16:15:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

硕士生

铁杆木虫 (著名写手)


sunices(金币+1):谢谢参与
好复杂的啊
低调!
8楼2010-03-30 12:41:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Pchief

铁杆木虫 (正式写手)


sunices(金币+1):谢谢参与
sunices(金币+2):借鉴了: 维数 n 会出现在这些量的指数位置,指数的爆炸式增长是没有东西能够对付的。 2010-05-30 17:13:36
楼主对问题的提法不够明确,按我的理解,好比说一个单位方体,它的相距最远的两个顶点的欧氏距离是维数 n 的平方根,我觉得这个增长速度还算可以,一个三万维方体的直径也不过是一个三维方体的一百倍而已(假定边长相同)。

当然对于象体积一类的几何量那就不行了,维数 n 会出现在这些量的指数位置,指数的爆炸式增长是没有东西能够对付的。

[ Last edited by Pchief on 2010-3-30 at 20:16 ]
9楼2010-03-30 20:13:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

379417723

铜虫 (小有名气)


sunices(金币+1):谢谢参与
小雨萌萌:如果每个求助帖必回,请说点含金量更高的话,否则要被扣金币的。请理解。 2010-03-31 14:45
额,有点复杂了吧。
10楼2010-03-31 14:03:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 sunices 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见