24小时热门版块排行榜    

查看: 2970  |  回复: 6

liuxinyu1206

银虫 (小有名气)

[交流] 【求助】归一化和降维顺序 已有4人参与

想问一下,对于样本,大家说是先归一化,然后进行降维。还是顺序颠倒一下更合适?
回复此楼
上帝创造了0和1,其余都是人的工作。
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shuxue001

金虫 (小有名气)

都试一下呗
谁说知识改变命运,知识也可能让人发疯
2楼2010-12-16 19:34:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuxinyu1206

银虫 (小有名气)

呵呵,我自己的数据有局限性,大家都说说。。从理论上分析就更好了。。
上帝创造了0和1,其余都是人的工作。
3楼2010-12-17 16:05:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

928724630

银虫 (小有名气)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
mze04532(金币+1):感谢热心应助~ 2010-12-27 18:33:51
肯定是先归一化,后降为。。归一化一般是针对某一维进行的,也就是每一维进行归一化时都是相互独立的,而降维要用到所有维,为了每一维都有相同的量纲,所以要归一化。。
4楼2010-12-27 17:33:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuxinyu1206

银虫 (小有名气)

★ ★
mze04532(金币+2):热心应助,鼓励新虫~ 2011-01-09 09:00:27
那么反过来,如果先降维,要用到所有的数据,这些数据没有经过归一化,那么都是真实的,而一旦经过了归一化以后,原来的数据都发生了改变,而这个时候再降维,那么就是新的数据之间的相关性能了。
不知我说的有没有道理。
上帝创造了0和1,其余都是人的工作。
5楼2011-01-08 21:26:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

928724630

银虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
mze04532(金币+2):鼓励热烈讨论~ 2011-01-13 19:59:30
引用回帖:
Originally posted by liuxinyu1206 at 2011-01-08 21:26:36:
那么反过来,如果先降维,要用到所有的数据,这些数据没有经过归一化,那么都是真实的,而一旦经过了归一化以后,原来的数据都发生了改变,而这个时候再降维,那么就是新的数据之间的相关性能了。
不知我说的有没 ...

有诡辩的嫌疑。。不同量纲的数据是无法进行运算,比如,某一维中的数据取值范围是1000-2000,而另一个是10-20之间,如果计算任意两条记录之间的距离,很明显,第一维计算出来的差值明显大于第二维,第二维差值基本不起作用,所以要归一化,归一化是对raw数据进行处理,原始数据必须经过处理之后才能进行分析,这是必须的。。。
6楼2011-01-13 17:35:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gnahz123

新虫 (初入文坛)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
6楼: Originally posted by 928724630 at 2011-01-13 17:35:31
有诡辩的嫌疑。。不同量纲的数据是无法进行运算,比如,某一维中的数据取值范围是1000-2000,而另一个是10-20之间,如果计算任意两条记录之间的距离,很明显,第一维计算出来的差值明显大于第二维,第二维差值基本 ...

那先对测试集归一化,再归一训练集(再按照归一测试集的规则),这样可以吗?
因为之前我把训练集与测试集放在同一个文本文件中一起归一化,最后准确率很差劲。
先归一训练集,再归一测试集,也很差劲
7楼2016-02-24 20:56:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 liuxinyu1206 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见