版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

汕头大学海洋科学接受调剂

返回列表

【奖励】本帖被评价5次，作者yingzhilian增加金币 5 个

当前主题已经存档。

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

yingzhilian

木虫 (正式写手)

应助: 2 (幼儿园)
金币: 6069.7
帖子: 578
在线: 94.4小时
虫号: 99846

[资源] 【原创】数据归一化汇总（matlab)

数据归一化汇总
=================================
归一化化定义：我是这样认为的，归一化化就是要把你需要处理的数据经过处理后（通过某种算法）限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便，其次是保正程序运行时收敛加快。
在matlab里面，用于归一化的方法共有三种:
（1）premnmx、postmnmx、tramnmx
（2）prestd、poststd、trastd
（3）是用matlab语言自己编程。
premnmx指的是归一到[－1 1],prestd归一到单位方差和零均值。（3）关于自己编程一般是归一到[0.1  0.9] 。具体用法见下面实例。
为什么要用归一化呢？首先先说一个概念，叫做奇异样本数据，所谓奇异样本数据数据指的是相对于其他输入样本特别大或特别小的样本矢量。
下面举例：
m=[0.11 0.15 0.32 0.45 30;
   0.13 0.24 0.27 0.25 45];
其中的第五列数据相对于其他4列数据就可以成为奇异样本数据（下面所说的网络均值bp）。奇异样本数据存在所引起的网络训练时间增加，并可能引起网络无法收敛，所以对于训练样本存在奇异样本数据的数据集在训练之前，最好先进形归一化，若不存在奇异样本数据，则不需要事先归一化。
具体举例：
close all
clear
echo on
clc
%BP建模
%原始数据归一化
m_data=[1047.92 1047.83 0.39 0.39 1.0 3500 5075;
1047.83 1047.68 0.39 0.40  1.0 3452 4912;
1047.68 1047.52  0.40  0.41 1.0  3404 4749;
1047.52  1047.27  0.41  0.42 1.0  3356 4586;
1047.27  1047.41 0.42 0.43  1.0  3308  4423;
1046.73  1046.74 1.70 1.80 0.75  2733  2465;
1046.74  1046.82  1.80  1.78 0.75  2419 2185;
1046.82 1046.73  1.78  1.75  0.75 2105  1905;
1046.73  1046.48 1.75 1.85 0.70 1791  1625;
1046.48  1046.03  1.85  1.82  0.70 1477 1345;
1046.03 1045.33 1.82 1.68  0.70  1163  1065;
1045.33  1044.95  1.68  1.71 0.70  849  785;
1044.95  1045.21 1.71  1.72  0.70  533  508;
1045.21 1045.64  1.72  1.70 0.70 567  526;
1045.64 1045.44 1.70  1.69  0.70  601  544;
1045.44 1045.78  1.69  1.69 0.70  635  562;
1045.78 1046.20  1.69  1.52 0.75  667  580];
%定义网络输入p和期望输出t
pause
clc
p1=m_data(:,1:5);
t1=m_data(:,6:7);
p=p1';t=t1';
[pn,minp,maxp,tn,mint,maxt]=premnmx(p,t)
%设置网络隐单元的神经元数(5~30验证后5个最好）
n=5;
%建立相应的BP网络
pause
clc
net=newff(minmax(pn),[n,2],{'tansig','purelin'},'traingdm');
inputWeights=net.IW{1,1};
inputbias=net.b{1};
layerWeights=net.IW{1,1};
layerbias=net.b{2};
pause
clc
% 训练网络
net.trainParam.show=50;
net.trainParam.lr=0.05;
net.trainParam.mc=0.9;
net.trainParam.epochs=200000;
net.trainParam.goal=1e-3;
pause
clc
%调用TRAINGDM算法训练BP网络
net=train(net,pn,tn);
%对BP网络进行仿真
A=sim(net,pn);
E=A-tn;
M=sse(E)
N=mse(E)
pause
clc
p2=[1046.20 1046.05 1.52 1.538 0.75;
1046.05 1046.85 1.538 1.510 0.75;
1046.85 1046.60 1.510 1.408 0.75;
1046.60 1046.77 1.408 1.403 0.75;
1046.77 1047.18 1.403 1.319 0.75];
p2=p2';
p2n=tramnmx(p2,minp,maxp);
a2n=sim(net,p2n);
a2=postmnmx(a2n,mint,maxt)
echo off
pause
clc
程序说明：所用样本数据（见m_data）包括输入和输出数据，都先进行归一化，还有一个问题就是你要进行预测的样本数据(见本例p2)在进行仿真前，必须要用tramnmx函数进行事先归一化处理，然后才能用于预测，最后的仿真结果要用postmnmx进行反归一，这时的输出数据才是您所需要的预测结果。
个人认为：tansig、purelin、logsig是网络结构的传递函数，本身和归一化没什么直接关系，归一化只是一种数据预处理方法。

由于采集的各数据单位不一致，因而须对数据进行[-1，1]归一化处理，归一化方法主要有如下几种，供大家参考：（by james）
1、线性函数转换，表达式如下：
y=(x-MinValue)/(MaxValue-MinValue)
说明：x、y分别为转换前、后的值，MaxValue、MinValue分别为样本的最大值和最小值。
2、对数函数转换，表达式如下：
y=log10(x)
说明：以10为底的对数函数转换。
3、反余切函数转换，表达式如下：
y=atan(x)*2/PI
归一化是为了加快训练网络的收敛性，可以不进行归一化处理

归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算，首先基本度量单位要同一，神经网络是以样本在事件中的统计分别几率来进行训练（概率计算）和预测的，归一化是同一在0-1之间的统计概率分布；

当所有样本的输入信号都为正值时，与第一隐含层神经元相连的权值只能同时增加或减小，从而导致学习速度很慢。为了避免出现这种情况，加快网络学习速度，可以对输入信号进行归一化，使得所有样本的输入信号其均值接近于0或与其均方差相比很小。

归一化是因为sigmoid函数的取值是0到1之间的，网络最后一个节点的输出也是如此，所以经常要对样本的输出归一化处理。所以这样做分类的问题时用[0.9 0.1 0.1]就要比用[1 0 0]要好。

但是归一化处理并不总是合适的，根据输出值的分布情况，标准化等其它统计变换方法有时可能更好。
关于用premnmx语句进行归一化：
premnmx语句的语法格式是：[Pn,minp,maxp,Tn,mint,maxt]=premnmx(P,T)
其中P，T分别为原始输入和输出数据，minp和maxp分别为P中的最小值和最大值。mint和maxt分别为T的最小值和最大值。
premnmx函数用于将网络的输入数据或输出数据进行归一化，归一化后的数据将分布在[-1,1]区间内。
我们在训练网络时如果所用的是经过归一化的样本数据，那么以后使用网络时所用的新数据也应该和样本数据接受相同的预处理，这就要用到tramnmx。
下面介绍tramnmx函数：
[Pn]=tramnmx(P,minp,maxp)
其中P和Pn分别为变换前、后的输入数据，maxp和minp分别为premnmx函数找到的最大值和最小值。

matlab中的归一化处理有三种方法
1. premnmx、postmnmx、tramnmx
2. restd、poststd、trastd
3. 自己编程
具体用那种方法就和你的具体问题有关了
（by happy）
pm=max(abs(p(i,: ))); p(i,: )=p(i,: )/pm;
和
for i=1:27
p(i,: )=(p(i,: )-min(p(i,: )))/(max(p(i,: ))-min(p(i,: )));
end 可以归一到0 1 之间
0.1+(x-min)/(max-min)*(0.9-0.1)其中max和min分别表示样本最大值和最小值。
这个可以归一到0.1-0.9

补充一个吧，归一还可以用 mapminmax。
这个函数可以把矩阵的每一行归一到[-1 1].
[y1,PS] = mapminmax(x1). 其中x1 是需要归一的矩阵 y1是结果
当需要对另外一组数据做归一时，比如SVM 中的 training data用以上方法归一，而test data就可以用下面的方法做相同的归一了
y2 = mapminmax('apply',x2,PS)
当需要把归一的数据还原时，可以用以下命令
x1_again = mapminmax('reverse',y1,PS)

你的回复和评价是我发帖的动力！

[ Last edited by yingzhilian on 2009-6-9 at 20:55 ]

回复此楼

» 收录本帖的淘帖专辑推荐

source

» 猜你喜欢

291分调剂已经有9人回复
调剂求收留已经有34人回复
291 求调剂已经有38人回复
22408 312求调剂已经有17人回复
一志愿华中农业071010，320求调剂已经有6人回复
290调剂生物0860 已经有41人回复
291求调剂已经有3人回复
211本科材料化工求调剂已经有23人回复
山东省基金2026 已经有9人回复
药学求调剂已经有13人回复

1楼 2009-06-01 08:51:25

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

yingzhilian

木虫 (正式写手)

应助: 2 (幼儿园)
金币: 6069.7
帖子: 578
在线: 94.4小时
虫号: 99846

★ ★
sunxiao(金币+2,VIP+0):谢谢 6-4 02:48

应大家要求，笑脸改掉了

赞一下(10人)

回复此楼

3楼2009-06-03 10:31:25

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 7 个回答

sunxiao

荣誉版主 (著名写手)

★★★★★ 五星级,优秀推荐

顶一个吧，建议修改笑脸，哈哈

赞一下

回复此楼

2楼2009-06-02 02:35:54

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

ljling

木虫 (小有名气)

应助: 0 (幼儿园)
金币: 2051.1
帖子: 133
在线: 23.1小时
虫号: 670567

★★★★★ 五星级,优秀推荐

很好啊，还没看完，支持

回复此楼

4楼2009-06-08 17:09:08

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

menglv17

铜虫 (小有名气)

应助: 0 (幼儿园)
金币: 124
帖子: 73
在线: 3.6小时
虫号: 755036

★★★★★ 五星级,优秀推荐

好东东，顶起！！！！

回复此楼

5楼2009-06-09 17:46:18

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 7 个回答

☆ 无星级 ★ 一星级 ★★★ 三星级 ★★★★★ 五星级

普通表情龙兔虎猫高级回复 (可上传附件)

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考研] 271求调剂 +29	2261744733 2026-04-11	29/1450	2026-04-14 16:48 by zhouxiaoyu
[考研] 335求调剂 +19	想上岸呀！！ 2026-04-12	21/1050	2026-04-14 16:23 by Art1977
[考研] 求调剂 +16	雪逢冬 2026-04-10	16/800	2026-04-14 14:27 by 逆水乘风
[考研] 求调剂 +12	璃茉一定上岸 2026-04-10	13/650	2026-04-14 00:08 by Equinoxhua
[考研] 一志愿厦大生物学332求调剂 +11	池池池池池池 2026-04-08	11/550	2026-04-13 14:10 by 科研论
[考研] 材料考研调剂 +29	云木达达 2026-04-11	31/1550	2026-04-13 13:32 by lyh鲁老师
[考研] 。 +10	李多米lee. 2026-04-12	11/550	2026-04-12 22:58 by yuyin1233
[考研] 本科南方医科大学一志愿985 药学学硕284分求调剂 +5	弱水听文 2026-04-09	5/250	2026-04-12 13:16 by shengxi123
[考研] 药学专硕调剂 +8	? 一路生?花? 2026-04-10	10/500	2026-04-11 21:21 by zhouxiaoyu
[考研] 调剂 +6	青灯不负 2026-04-09	6/300	2026-04-11 20:35 by dongdian1
[考研] 085410-273求调剂 +6	X1999 2026-04-10	6/300	2026-04-11 10:32 by Delta2012
[考研] 293求调剂 +6	勇远库爱314 2026-04-08	6/300	2026-04-11 10:08 by zhq0425
[考研] 085402通信工程调剂，有4项学科竞赛国奖（电赛国二），硕士研究生调剂自荐信。 +5	m永o不v言o弃m 2026-04-09	5/250	2026-04-11 09:33 by zhq0425
[考研] 309求调剂 +14	wdhw 2026-04-10	15/750	2026-04-10 21:06 by zhouxiaoyu
[考研] 263能源动力专硕求调剂 +4	加大号饭盒袋 2026-04-10	4/200	2026-04-10 20:52 by gong120082
[考研] 298求调剂 +13	钉叮咚冬瓜 2026-04-09	13/650	2026-04-10 15:49 by jiajinhpu
[考研] 青岛科技大学材料学院，环境学院调剂补录4月10日以前都可以 +3	1青科大。 2026-04-09	5/250	2026-04-10 09:58 by 翩翩一书生
[考研] 初试分332，一志愿报考西北工业大学， +11	故人?? 2026-04-09	11/550	2026-04-09 21:54 by JineShine
[考研] 求调剂 +3	猪肉墩粉条cc 2026-04-08	4/200	2026-04-09 10:05 by 猪肉墩粉条cc
[考研] 085404，334分，求调剂 +5	sunjie8888 2026-04-08	8/400	2026-04-09 07:26 by sunjie8888