sas统计分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计软件》报告
聚类分析和方差分析
在统计学成绩分析中的应用
班级:精算0801 班
姓名:张倪
学号:2008111500
报告时间:2011年11 月指导老师:郝际贵成绩:
目录
一、背景及数据来源 (1)
二、描述性统计分析 (2)
三、聚类分析 (4)
四、方差分析 (6)
五、结果分析与结论 (8)
聚类分析和方差分析在统计学成绩分析中的应用
,、背景及数据来源
SAS系统全称为Statistics Analysis System最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS 软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。
SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身
所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调
度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各
模块的安装及更新都可通过其安装程序非常方便地进行。
本文利用SAS软件进行描述性统计、聚类分析等统计分析方法,将学生按照多指标综合考虑进行聚类。
数据来源:选取2010—2011第一学期统计学选教课成绩单,选取性别系别等变量进行考察。将中文名称改为英文。
数据类型如下所示:
当输入字符型的变量时,需要加上符号$在该变量的后面,用于区分数值型
变量,所以用$来作为后缀。删除缺考错误分数等异常值。命名为2010stat.xls
】、描述性统计分析
(一) 导入数据
首先建立永久磁盘路径,导入数据集
stat
libn ame path "D:\sas\"; run ;
(二) 描述性统计分析
然后进行描述性统计对性别、平时成绩、期末成绩、总评成绩进行计算,代 码如下:
proc means data=path.stat;
var sex s1 s2 s3; run ;
输出结果如下:
MEANS PROCEDURE
吏星 标签
N
均值 标准差 垢小值
援大值
从结果可以分析出,总体学生平时成绩平均分为
86.28分,总评成绩均分为
77.15 分。
按照系别分类,每个系进行描述性统计,代码如下:
proc means data=path.stat;
var sex si s2 s3; class dept; run ;
运行的输出结果如下所示:
6
123s s s S
6123S S S S
4969 2080
665B C.3706897 0.4831382 86.2S52704 15.8409394 74.2894073 18J641766
77.1490367 IB.5374497
il 0
5,0000000
1.0000000 100.0000000 100.0000000 100.0000000
0.4634146 0.5017284 0 1.0000000 81.0731707 18.9103019 0
100.0000000 65.8510519 22.8057619
17.0000000
99.0000000 69.8609756
21.5164178
99.8000000
e 1 2--3 s s s s
e 1 23 s s s s
从结果可以分析得出, 各个系别学生成绩的均值、 观测值、标准差及最大值 d@pt
观测的亍数 变量 标签
N 均值 标准差 摄小值 摄犬值
财政丢
221
sex sex 221 0.3800905 0.4865108 0 1.0000000 si si 221 87.5610360 15.5391625 0
100.0000000 s2
s2 221
75.6515037 19.8630745
5.0000000
100.0000000
s3
s3
221
78.2821267
17.8623447
11.2000000
100.0000000
管理科学与工程系
105
sex sex 105 0.4380952 0.4985326 0
1.0000000 si
si
105 88.9714206 11.1091241 50.0000000 100.0000000
或 或 105
77.8380952
16.2977041
12.0000000
100.0000000
s3
s3
105 01.1000000 14.2162380
81.8000000
100.0000000
国际经济贸易系.
142
sex sex 142
0.3073239
0.4883631 0
1.0000000 si §1
142 85.2464739
15.9022665
100.0000000
£2 £2
140 72.8500000
19.1333544
17.0000000
100.0000000
s3 s3
142 75.8584507
18.7036206
0 100.0000000 会计系
429
sex sex
429 0.3240093 0.4685499 0
1.0000000 si si
429 89.1165501 11.9393104 33.0000000 100.0000000
s2 s2
429 77.6011666
18.1890094 8.0000000 100.0000000
s3 虏
429 80.9867133 15.6030996 27.8000000
100.0000000
35
sex
sex
35
0.3423571
0.4815940 n
1.0000000
si
si
35 84.2285714
14.4834301 37.0000000
100.0000000 s2 s2
35 72.2571429
21.0116314 12.0000000
97.0000000
53
s3
35 75.8571429 18,5197079
28.4000000
97.9000000 留学生
56
sex
sex
56
0.8085714
0.4689609
1.0000000
si si
56 77.4642057 16.1627679 0
95.0000000
£
55 61.9810182 8.1114709 47.0000000
80.0000000
s3
s3
56 65.8517057 11.4553519 0 83.0000000
101
sex sex
101 0.2071207 0.4546786 U 1.0000000 si
si
101 82.2079208 23.4500318 0
100.0000000 或
s2
90 75,0777778 18.0260908 16.0000000
100.0000000
101
71.9970297 26.7744298 0 100.0000000
市场営销系
207
sex §1
sex si s2 s3 237 237 279 237 0.3067596 85.3972125 72.4695341 74.9414634 0.48785S5 17.8710139 18.7183101 19.9953278 0 0
16.0000000
0 1.0000000 100.0000000 100.0000000 IUU.UUUUUUU 数学丢
36 sex
sex
36 0,3611111 0.4871361 0
1.0000000 创 创
36 34.3611111 7.7317630 75.0000000 100.0000000 s2
s2 36 83.166BBB7 16.9073108 31.0000000 100.0000000
s3 s3 36 86.5130009 13.6230928 47.0000000
100.0000000 体育生
15
Sgx
15 0.3333333
0.4879500
0 1.0000000
si
si 0 -
-
-
-
s2 s3
s2 s3
0 0
和最小值。其中,会计系、财政系和市场营销系人数众多,除了经济系、市场营 销系和留学生以外,各系都有100分
(三)统计图
绘制频率直方图,直方图可以良好的反映各系的人数和性别比例。 代码如下
所示:
proc gchart data=path.stat;
vbar dept/type=sum subgroup=sex; run ;
统计直方图如下所示: