24小时热门版块排行榜    

查看: 450  |  回复: 0

jackyma

新虫 (小有名气)

[求助] 求助:数据分析方法求解!

大家好,我有一批数据不知到该如何分析,特来请教,希望高人指点!
先致谢!

简单举例描述一下我的数据(实际数据内容不方便公开):
比如有一批球状物体表面会有红,白,蓝,绿等颜色的一种或多种构成。现在测得所有球的体积(V),表面积(A),半径(R)。
所有球的数据的最大值,最小值及数据总量。
max(V)=63000     max(R)= 13.4407
min(V)=3.0080    min(R)= 0.7232
数据总量N=950000

含有红色的球的数据
max(hongV)= 63000    max(hongR)=13.44
min(hongV)=3.0080     min(hongR)=0.74
红N=353368

其他颜色的就不列举了。

现在想知道各种颜色出现的特征。该如何统计?

我用R语言做了整体的频数分布分析

分组    频数    相对频数   累积频数   累积相对频数
0~        945606        100.0        945606        100.0
5000~        81        0.0        945687        100.0
10000~        6        0.0        945693        100.0
15000~        1        0.0        945694        100.0
20000~        1        0.0        945695        100.0
25000~        0        0.0        945695        100.0
30000~        0        0.0        945695        100.0
35000~        0        0.0        945695        100.0
40000~        0        0.0        945695        100.0
45000~        0        0.0        945695        100.0
50000~        10        0.0        945705        100.0
55000~        0        0.0        945705        100.0
60000~        4        0.0        945709        100.0
合計        945709        100.0
应为数据跨度很大作出的频数分布直方图只有第一组的可以显示出来。
把组距变为小为1,或者5画出的图也觉得看不出分布特征,下面贴出两张图。

有朋友建议我把各个颜色的频数除以总体的频数,重新画图右可能看出各个颜色之间的不同。
不太清楚这么做,统计学上怎么解释?是什么处理?是正态化处理么?

用R语言该怎么写命令?

由于本人统计学知识缺乏,可能问题描述的不够清楚,请大家指正.





[ Last edited by jackyma on 2012-5-9 at 18:42 ]
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

智能机器人

Robot (super robot)

我们都爱小木虫

相关版块跳转 我要订阅楼主 jackyma 的主题更新
信息提示
请填处理意见