sas统计分析报告

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计软件》报告

聚类分析和方差分析

在统计学成绩分析中的应用

班级:精算0801 班

姓名:张倪

学号:2008111500

报告时间:2011年11 月指导老师:郝际贵成绩:

目录

一、背景及数据来源 (1)

二、描述性统计分析 (2)

三、聚类分析 (4)

四、方差分析 (6)

五、结果分析与结论 (8)

聚类分析和方差分析在统计学成绩分析中的应用

,、背景及数据来源

SAS系统全称为Statistics Analysis System最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS 软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能限于统计分析,至今,统计分析功能也仍是它的重要组成部分和核心功能。

SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身

所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调

度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各

模块的安装及更新都可通过其安装程序非常方便地进行。

本文利用SAS软件进行描述性统计、聚类分析等统计分析方法,将学生按照多指标综合考虑进行聚类。

数据来源:选取2010—2011第一学期统计学选教课成绩单,选取性别系别等变量进行考察。将中文名称改为英文。

数据类型如下所示:

当输入字符型的变量时,需要加上符号$在该变量的后面,用于区分数值型

变量,所以用$来作为后缀。删除缺考错误分数等异常值。命名为2010stat.xls

】、描述性统计分析

(一) 导入数据

首先建立永久磁盘路径,导入数据集

stat

libn ame path "D:\sas\"; run ;

(二) 描述性统计分析

然后进行描述性统计对性别、平时成绩、期末成绩、总评成绩进行计算,代 码如下:

proc means data=path.stat;

var sex s1 s2 s3; run ;

输出结果如下:

MEANS PROCEDURE

吏星 标签

N

均值 标准差 垢小值

援大值

从结果可以分析出,总体学生平时成绩平均分为

86.28分,总评成绩均分为

77.15 分。

按照系别分类,每个系进行描述性统计,代码如下:

proc means data=path.stat;

var sex si s2 s3; class dept; run ;

运行的输出结果如下所示:

6

123s s s S

6123S S S S

4969 2080

665B C.3706897 0.4831382 86.2S52704 15.8409394 74.2894073 18J641766

77.1490367 IB.5374497

il 0

5,0000000

1.0000000 100.0000000 100.0000000 100.0000000

0.4634146 0.5017284 0 1.0000000 81.0731707 18.9103019 0

100.0000000 65.8510519 22.8057619

17.0000000

99.0000000 69.8609756

21.5164178

99.8000000

e 1 2--3 s s s s

e 1 23 s s s s

从结果可以分析得出, 各个系别学生成绩的均值、 观测值、标准差及最大值 d@pt

观测的亍数 变量 标签

N 均值 标准差 摄小值 摄犬值

财政丢

221

sex sex 221 0.3800905 0.4865108 0 1.0000000 si si 221 87.5610360 15.5391625 0

100.0000000 s2

s2 221

75.6515037 19.8630745

5.0000000

100.0000000

s3

s3

221

78.2821267

17.8623447

11.2000000

100.0000000

管理科学与工程系

105

sex sex 105 0.4380952 0.4985326 0

1.0000000 si

si

105 88.9714206 11.1091241 50.0000000 100.0000000

或 或 105

77.8380952

16.2977041

12.0000000

100.0000000

s3

s3

105 01.1000000 14.2162380

81.8000000

100.0000000

国际经济贸易系.

142

sex sex 142

0.3073239

0.4883631 0

1.0000000 si §1

142 85.2464739

15.9022665

100.0000000

£2 £2

140 72.8500000

19.1333544

17.0000000

100.0000000

s3 s3

142 75.8584507

18.7036206

0 100.0000000 会计系

429

sex sex

429 0.3240093 0.4685499 0

1.0000000 si si

429 89.1165501 11.9393104 33.0000000 100.0000000

s2 s2

429 77.6011666

18.1890094 8.0000000 100.0000000

s3 虏

429 80.9867133 15.6030996 27.8000000

100.0000000

35

sex

sex

35

0.3423571

0.4815940 n

1.0000000

si

si

35 84.2285714

14.4834301 37.0000000

100.0000000 s2 s2

35 72.2571429

21.0116314 12.0000000

97.0000000

53

s3

35 75.8571429 18,5197079

28.4000000

97.9000000 留学生

56

sex

sex

56

0.8085714

0.4689609

1.0000000

si si

56 77.4642057 16.1627679 0

95.0000000

£

55 61.9810182 8.1114709 47.0000000

80.0000000

s3

s3

56 65.8517057 11.4553519 0 83.0000000

101

sex sex

101 0.2071207 0.4546786 U 1.0000000 si

si

101 82.2079208 23.4500318 0

100.0000000 或

s2

90 75,0777778 18.0260908 16.0000000

100.0000000

101

71.9970297 26.7744298 0 100.0000000

市场営销系

207

sex §1

sex si s2 s3 237 237 279 237 0.3067596 85.3972125 72.4695341 74.9414634 0.48785S5 17.8710139 18.7183101 19.9953278 0 0

16.0000000

0 1.0000000 100.0000000 100.0000000 IUU.UUUUUUU 数学丢

36 sex

sex

36 0,3611111 0.4871361 0

1.0000000 创 创

36 34.3611111 7.7317630 75.0000000 100.0000000 s2

s2 36 83.166BBB7 16.9073108 31.0000000 100.0000000

s3 s3 36 86.5130009 13.6230928 47.0000000

100.0000000 体育生

15

Sgx

15 0.3333333

0.4879500

0 1.0000000

si

si 0 -

-

-

-

s2 s3

s2 s3

0 0

和最小值。其中,会计系、财政系和市场营销系人数众多,除了经济系、市场营 销系和留学生以外,各系都有100分

(三)统计图

绘制频率直方图,直方图可以良好的反映各系的人数和性别比例。 代码如下

所示:

proc gchart data=path.stat;

vbar dept/type=sum subgroup=sex; run ;

统计直方图如下所示:

相关文档
最新文档