实验一:描述性统计量计算与正态性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一、描述性统计量计算与正态性检验实验
(验证性实验)
1、实验目的:数据分析的目的是从数据中提取有用的信息,而提取信息的首要任务是了解数据,认识数据,描述性统计量是最基本的。所以设立这个实验,让学生掌握使用SAS 系统计算数据的一些基本描述性统计量和正态性检验。
2、实验要求及学时:实验形式(个人);实验学时数4。
3、实验环境及材料:(使用的软件系统、实验设备、主要仪器、材料等)
装有版本为8.1以上的SAS系统的个人电脑(每人一台)
4、实验内容:用SAS软件进行描述性统计量计算与正态性检验实验。
5、实验方法和操作步骤
1)导入数据(数据来源于2009年10月29日股市交易数据)
PROC IMPORT OUT= WORK.sj
DATAFILE= "D:\work\example one.xls"
DBMS=EXCEL2000 REPLACE;
GETNAMES=YES;
RUN;
2)整理数据
data lwh;
set sj;
sum=average_price*volume;
run;(在数据表sj中增设sum变量形成新的数据表lwh)
data lwh;
set lwh;
if price>0;
run; (从数据表lwh剔除那些在2009年10月29日没有交易的股票)
3)练习tabulate过程输出统计量表
proc tabulate data=lwh;
class region;
var sum price;
table region, (sum price)*(mean var);
run;(此处是对数据表lwh中深圳和上海的市场的股票分别汇总统计它们的数据)
4)练习gplot过程输出统计图表
proc gplot data=lwh;
symbol1i=join v=+ color=red;
symbol2i=rq v=& color=black;
plot speed*low Level_Change*high/overlay;
run;
proc gplot data=lwh;
symbol i=rqcli95 v=* color=blue;
plot (Level_Change speed)*(low high);
run;
这步的结果如下:图中的实线是两个变量的回归曲线,虚线是它们95%的置信线。
图1-1:Level_Change和low的散点图
图1-2:speed和和igh的散点图
图1-3:speed和low, Level_Change和high的叠加散点图
5)练习gchart过程输出柱状图。
proc gchart data=lwh;
vbar price/levels=18modpoints=579111315171921232527 293134384255;
run;
这步的结果如下:
图1-4:price的直方图
6)练习univariate过程输出描述性统计量和正态性检验。
proc univariate data=lwh normal;
var Level_Change;
histogram Level_Change;
probplot Level_Change;
run;
这步的结果如下:
表1-1:Level_Change的描述性统计量
表1-2:Level_Change的正态性检验结果
图1-5:Level_Change的直方图
图1-6:Level_Change的QQ图
分析: 表1-2中的p-value都是小于0.05的,从检验的数量结果显示变量Level_Change是不服从正态分布的,从直方图和QQ图我们也可以看到,在数据的尾部明显不服从正态分布。如果变量服从正态分布,直方图应该是对称的,而QQ图应该是一条直线。
6、实验报告要求
1)实验报告要以事实为依据,推理要合乎逻辑,不可无根据地臆断。
2)在写作实验报告时,要按照一定的格式,不能忽视最基本的规范要求。要根据事物的结构特点和逻辑顺序,来考虑表达的形式和表述的方法。
3)实验报告的表述应具有可读性。语言阐述必须精确、通俗,在不损害规范性的前提下,尽可能使用简洁的语言。
7、练习实验
分析数据表lwh中其它的变量,计算它们的描述性统计量并作正态性检验。