实验报告二-SAS的描述统计功能
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验报告
实验项目名称SAS的描述统计功能所属课程名称统计分析及SAS实现实验类型验证性实验
实验日期2016-10-20
班级数学与应用数学
学号
姓名
成绩
⑴利用INSIGHT模块画出直方图:
图2.1 INSIGHT模块绘制频数直方图⑵利用“分析家”绘制频数直方图:
图2.2“分析家”绘制频数直方图
⑶编程绘制频数直方图:
proc gchart data=lmf.p21;
vbar grade;
run;
图2.3 编程绘制频数直方图
②求出上述数据的平均值、中位数、四分之一分位点及四分之三分位点:
⑴利用INSIGHT模块求平均值、中位数、四分之一分位点及四分之三分位点:
图2.4 利用INSIGHT模块求统计量
表2.1 利用INSIGHT模块求矩统计量:
矩统计量(moment)
表2.2 利用INSIGHT模块求分位数:
分位数(quantiles)
由表2.1、表2.2得出,均值(mean)为77.7167,中位数(med)为81.0000,四分之一分位点(Q1)为72.0000,四分之三分位点(Q3)为86.0000。
⑵利用“分析家”求平均值、中位数、四分之一分位点及四分之三分位点:Ⅰ. 利用Summary Statistics菜单计算描述性统计量:
图2.5 Summary Statistics菜单计算描述性统计量
Ⅱ. 利用Distributions菜单计算描述性统计量:
表2.3 利用“分析家”模块求矩统计量:
矩统计量(moment)
表2.4 “分析家”求基本统计测度:
基本统计测度(Basic Statistical Measure)
表2.5 “分析家”求分位数:
分位数(quantiles)
由表2.3、表2.4、表2.5得出,均值(mean)为77.71667,中位数(med)为81.00000,四分之一分位点(Q1)为72.0,四分之三分位点(Q3)为86.0。
⑶利用编程求平均值、中位数、四分之一分位点及四分之三分位点:
proc means data=lmf.p21 mean median Q1Q3;
var grade;
run;
表2.6 编程求数据的平均值、中位数、四分之一分位点及四分之三分位点:
由表2.6得出,均值(mean)为77.7166667,中位数(med)为81.0000000,四分之一分位点(Q1)为72.0000000,四分之三分位点(Q3)为86.0000000。
【练习2-2】掷一枚均匀子42次,记录朝上一面的点数,画出记录的频数和频率
直方图,并说明记录的分布规律。
3 2
4 1
5 1
5 3 4 3 5 6
4 2
5 3 1 3
4 1 4
5 1 6
3 3 1 2
4 2
6 3 4 6 6 1
6 2 4 5 2 6
【解答】
①利用编程计算频数:
proc freq data=lmf.p22;
table dice;
run;
表2.7 编程计算频数
频数(freq)
由表得出出现点数1的次数为7;出现点数2的次数为6;出现点数3的次数为8;出现点数4的次数为8;出现点数5的次数为6;出现点数6的次数为7。
②利用编程绘制频率直方图:
proc gchart data=lmf.p22;
vbar dice;
run;
图2.4 编程绘制频数直方图
表2.7、图2.4可以说明,骰子的数字分布是均匀的,每点掷出的概率计划一样,而在这42次中,3、4两点概率值最高且一样,2、5两点出现概率最低且一样,1、6两点出现概率适中且一样。
【练习2-5】某高校对本校财经类学科硕士毕业生的收入状况进行调查,抽查了
30位毕业生,得到他们的年收入数据如下(单位:千元):
30.7 30.7 31.1 30.5 32.2
29.9 30.2 30.3 32.3 31.8
29.7 29.1 30.6 31.2 32.7
30.3 28.9 30.3 30.9 33.3
28.8 30.0 30.1 32.2 32.1
29.3 30.4 30.6 32.9 30.3
①求年收入的均值、中位数和四分位数;
②求年收入的极差和标准差;
③绘制年收入的盒形图,并概括年收入的分布情况。
【解答】
①利用编程求年收入的均值、中位数和四分位数:
proc means data=lmf.p23 mean median Q1Q3;
var income;
run;
表2.8求描述年收入位置的统计量:
由表2.8得出,均值(mean)为30.7800000,中位数(median)为30.5500000,下四分位数(Q1)为30.1000000,上四分位数(Q3)为31.8000000。
②利用编程求年收入的极差和标准差:
proc means data=lmf.p23 range std;
var income;
run;
表2.9求描述年收入离散程度的统计量:
③
⑴利用INSIGHT绘制年收入的盒形图:
图2.5 INSIGHT绘制年收入盒形图