利用相关软件对数据作简单的统计处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2.利用相关软件对数据作简单的统计处理
1. Excel
Excel是美国微软(Microsoft)公司的一种办公系列软件, Excel有友好的用户界面,卓越的数据处理和数据分析能力,它预装的各种函数多达245个,单是统计函数就有80个,用户还可以自行编辑各种公式,或将各个函数组合使用,各种图标化的提示与仅用鼠标就可进行的操作使一般人可以很快掌握基本的操作,无须经过培训。方便的智能型复制功能,极大地减轻了计算工作量,并使大部分结果可以自动生成。
充分利用Excel的统计分析功能,可以对数据作多方面的统计分析处理,包括两个变量之间的相关分析和回归分析。我们相信,关于Excel的数据统计处理功能,读者已经有所了解,此处不拟进行过多的赘述。
2.Matlab
在Matlab中,一整套关于统计分析的运算函数,主要包括
corrcoef(x)——求相关函数;
cov(x)——协方差矩阵;
cross(x,y)——向量的向量积;
diff(x)——计算元素之间差;
dot(x,y)——向量的点积;
gradient(z,dx,dy)——近似梯度;
histogram(x)——直方图和棒图;
max(x), max(x,y)——最大分量;
mean(x)——均值或列的平均值;
min(x), min(x,y)——最小分量;
prod(x)——列元素的积;
rand(x)——均匀分布随机数;
rands(x)——正态分布随机数;
sort(x)——按升序排列;
std(x)——列的标准偏差;
sum(x)——各列的元素和;
subspace(A,B)——两个子空间之间的夹角。
3.SPSS
SPSS for Windows是一个功能强大的组合式统计软件包,它集数据整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较,以及相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。
4.例——相关系数计算
对于简单相关系数的计算,可以在Excel、Matlab和SPSS软件中都可以完成。
在Excel中,调用统计函数CORREL,引用数据范围,就可以求出相关系数。
在SPSS中,没有单一的命令来计算相关系数,但是在进行类似因子分析、聚类分析等计算时,通常内部过程中均嵌套了相关系数计算,在这里就不再详述。
下面,通过具体的例子来说明如何在这两个软件中来实现相关系数的计算。
例如,已知某一地区的不同变量的一组数据,计算变量之间的相关系数矩阵。
样本序号人口密度人均耕地
面积
森林覆盖
率
农民人均
纯收入
人均粮食
产量
经济作物
占农作物
播面比例
耕地占土
地面积比
率
果园与林
地面积之
比
灌溉田占
耕地面积
之比
1 363.91
2 0.352 16.101 192.11 295.34 26.724 18.492 2.231 26.262
2 141.50
3 1.68
4 24.301 1752.3
5 452.2
6 32.314 14.464 1.455 27.066
3 100.695 1.067 65.601 1181.5
4 270.12 18.266 0.162 7.474 12.489
4 143.739 1.336 33.20
5 1436.12 354.2
6 17.486 11.805 1.892 17.534
5 131.412 1.623 16.607 1405.09 586.59 40.683 14.401 0.303 22.932
6 68.33
7 2.032 76.204 1540.29 216.39 8.12
8 4.065 0.011 4.861
7 95.416 0.801 71.106 926.35 291.52 8.135 4.063 0.012 4.862
8 62.901 1.652 73.307 1501.24 225.25 18.352 2.645 0.034 3.201
9 86.624 0.841 68.904 897.36 196.37 16.861 5.176 0.055 6.167
10 91.394 0.812 66.502 911.24 226.51 18.279 5.643 0.076 4.477
11 76.912 0.858 50.302 103.52 217.09 19.793 4.881 0.001 6.165
12 51.274 1.041 64.609 968.33 181.38 4.005 4.066 0.015 5.402
13 68.831 0.836 62.804 957.14 194.04 9.11 4.484 0.002 5.79
14 77.301 0.623 60.102 824.37 188.09 19.409 5.721 5.055 8.413
15 76.948 1.022 68.001 1255.42 211.55 11.102 3.133 0.01 3.425
16 99.265 0.654 60.702 1251.03 220.91 4.383 4.615 0.011 5.593
17 118.505 0.661 63.304 1246.47 242.16 10.706 6.053 0.154 8.701
18 141.473 0.737 54.206 814.21 193.46 11.419 6.442 0.012 12.945
19 137.761 0.598 55.901 1124.05 228.44 9.521 7.881 0.069 12.654
20 117.612 1.245 54.503 805.67 175.23 18.106 5.789 0.048 8.461
21 122.781 0.731 49.102 1313.11 236.29 26.724 7.162 0.092 10.078
利用Matlab软件系统,将变量数据转化成数据矩阵A,在此例中即为21行9列的数据矩阵,然后调用命令:Corr=corrcoef(A),即可得到以上各变量之间的相关系数矩阵如下:
人口密度人均耕
地面积
森林覆
盖率
农民人均
纯收入
人均粮
食产量
经济作物占农
作物播面比例
耕地占土地
面积比率
果园与林地
面积之比
灌溉田占耕
地面积之比
人口密度 1.000 -0.327 -0.714 -0.336 0.309 0.408 0.790 0 .156 0 .744 人均耕地面
积
-0.327 1.000 -0.035 0.644 0.420 0.255 0.009 -0 .078 0.094 森林覆盖率-0.714 -0.035 1.000 0.070 -0.740 -.755 -0.930 -0.109 -0.924 农民人均纯
收入
-0.336 0.644 0.070 1.000 0.383 0.069 -0.046 -0.031 0 .073 人均粮食产
量
0.309 0.420 -0.740 0.383 1.000 0.734 0.672 0.098 0 .747 经济作物占
农作物播面
比例
0.408 0.255 -0.755 0.069 0.734 1.000 0.658 0.222 0 .707
耕地占土地
面积比率
0.790 0.009 -0.930 -0.046 0.672 0.658 1.000 -0 .030 0.890
果园与林地
面积之比
0.156 -0.078 -0.109 -0.031 0.098 0.222 -0.030 1.000 0 .290
灌溉田占耕
地面积之比
0.744 0.094 -0.924 0.073 0.747 0.707 0.890 0.290 1.000