|
|
[求助]
求助:数据分析方法求解!
大家好,我有一批数据不知到该如何分析,特来请教,希望高人指点!
先致谢!
简单举例描述一下我的数据(实际数据内容不方便公开):
比如有一批球状物体表面会有红,白,蓝,绿等颜色的一种或多种构成。现在测得所有球的体积(V),表面积(A),半径(R)。
所有球的数据的最大值,最小值及数据总量。
max(V)=63000 max(R)= 13.4407
min(V)=3.0080 min(R)= 0.7232
数据总量N=950000
含有红色的球的数据
max(hongV)= 63000 max(hongR)=13.44
min(hongV)=3.0080 min(hongR)=0.74
红N=353368
其他颜色的就不列举了。
现在想知道各种颜色出现的特征。该如何统计?
我用R语言做了整体的频数分布分析
分组 频数 相对频数 累积频数 累积相对频数
0~ 945606 100.0 945606 100.0
5000~ 81 0.0 945687 100.0
10000~ 6 0.0 945693 100.0
15000~ 1 0.0 945694 100.0
20000~ 1 0.0 945695 100.0
25000~ 0 0.0 945695 100.0
30000~ 0 0.0 945695 100.0
35000~ 0 0.0 945695 100.0
40000~ 0 0.0 945695 100.0
45000~ 0 0.0 945695 100.0
50000~ 10 0.0 945705 100.0
55000~ 0 0.0 945705 100.0
60000~ 4 0.0 945709 100.0
合計 945709 100.0
应为数据跨度很大作出的频数分布直方图只有第一组的可以显示出来。
把组距变为小为1,或者5画出的图也觉得看不出分布特征,下面贴出两张图。
有朋友建议我把各个颜色的频数除以总体的频数,重新画图右可能看出各个颜色之间的不同。
不太清楚这么做,统计学上怎么解释?是什么处理?是正态化处理么?
用R语言该怎么写命令?
由于本人统计学知识缺乏,可能问题描述的不够清楚,请大家指正.
![]()
![]()
[ Last edited by jackyma on 2012-5-9 at 18:42 ] |
» 猜你喜欢
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有3人回复
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有4人回复
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有3人回复
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有3人回复
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有3人回复
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有3人回复
售SCI一区文章,我:8 O5 51O 54,科目齐全,可+急
已经有3人回复
基金正文30页指的是报告正文还是整个申请书
已经有4人回复
今年春晚有几个节目很不错,点赞!
已经有6人回复
球磨粉体时遇到了大的问题,请指教!
已经有15人回复
|