应用数理统计学课程实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用数理统计学课程实验报告
201330170078 学生学号实验课成绩
学生实验报告书
应用数理统计学课程实验实验课程名称
土木与交通学院开课学院
胡郁葱指导教师姓名
邓艳辉学生姓名
交通运输学生专业班级
学年第 1 学期 2014 2015 --
上机实验一
实验项目名称上机实验1 实验日期 2014.12.26 实验者邓艳辉专业班级交通运输组别第二组一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:掌握SPSS的基本操作(认识SPSS、变量定义、变量属性理解、数据录入等) 二、实验任务:设计“交通量调查表”的相关变量及属性,便于将纸质调查表转换为电子调查表,并导入数据。
三、实验基本原理和方法:
一、定义变量
启动SPSS后,出现如图1-1所示数据编辑窗口。
由于目前还没有输入数据,因此显示的是一个空文件。
输入数据前首先要定义变量。
定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。
1(定义变量名Name
SPSS默认的变量为Var00001、Var00002等。
用户也可以根据自己的需要来命名变量。
SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下: (1)变量名必须以字母、汉字或字符,开头,其他字符可以是任何字母、数字或_、
@、#、$等符号。
(2)变量最后一个字符不能是句号。
(3)变量名总长度不能超过8个字符(即4个汉字)。
4
(4)不能使用空白字符或共他待殊字符(如“~”、“?”等)。
(5)变量命名必须唯一,不能有两个相同的变量名。
(6)在SPSS中不区分大小写,例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名
称。
(7)SPSS的句法系统中表达逻辑关系的字符串不能作为变量的名称,如ALL、AND、
WITH、OR等
2(定义变量类型Type
单击Type相应单元中的按钮,出现如图1-2所示的对话框,在对话框中选择合适的变量类型并单击OK按钮,即可定义变量类型。
SPSS的常用变量类型如下:
(1)Numeric:数值型。
定义数值的宽度(Width),即“整数部分,小数点,小数部分”的位数,默认为8位;定义小数位数(Decimal Places),默认为2位。
(2)Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型,也需要定义数值的宽度和小数位数。
(3)Scientific notation:科学记数型。
同时定义数值宽度(width)和小数位数(Decimal),在数据编辑窗口中以指数形式显示。
如定义数值宽度为9,小数位数为2,345.678就显示为3.46E+02。
(4)Custom currency:用户自定义型,如果没有定义,则默认显示为整数部分每3位加一逗号。
用户可定义数值宽度和小数位数。
如12345.678显示为
12,345.678。
(5)String:字符型,用户可定义字符长度(Characters)以便输入字符。
3(变量长度Width
设置变量的长度,当变量为日期型时无效。
4(变量小数点位数Decimal
设置变量的小数点位数,当变量为日期型时无效。
5(变量标签Label 5
变量标签是对变量名的进一步说明或注释,变量只能由不超过8个字符组成,而8个字符经常不足以说清楚变量的含义。
而变量标签可长达120个字符、可显示大小写,需要时可借此对变量名的含义加以较为清晰地解释。
6(变量值标签Values Labels
变量值标签是对变量的每一个可能取值的进一步描述。
当变量是称名变量或顺序变量时,这是非常有用的。
例如,在统计中经常用不同的数字代表被试的性别是男或女;被试的职业是教师、警察、……,还是公务员;被试的教育程度是高中以下、本科、硕士、博士等信息。
为避免以后对数字所代表的类别发生遗忘,就可以使用变量值标签加以说明和记录。
比如用1代表“male”(男)、2代表
“female”(女),其设置方法为:单击values相应单元,出现如图1-3所示的对话
框;在第一个Value文本框内输入l,在第二个Value文本框内输入“male”;单击Add按钮;再重复这一过程完成变量值2的标签,
就完成了该变量所有可能取值的标签的添加。
7(变量的显示宽度Columns
输入变量的显示宽度,默认为8。
8(变量的测量尺度Measure
前一章已经介绍,变量按测量水平可被划分称名变量、顺序或等级变量、等距变量和等比变量几种。
这里可根据测量量表的不同水平设置对应的变量测量尺度,设置方式为:称名变量选择Nominal,顺序或等级变量选择Ordinal,等距或等比变量均选择Scale。
二、导入数据
SPSS支持多种文件数据的导入,且方便简单易行
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、实验步骤
1\
2、如图。
3、如图。
4、定义各变量。
5\保存。
二、实验过程发现的问题或遇到的问题:
1、Excel表格给出的表格格式不是如上图所见的那样,所以应该对表格的范围有取舍,舍
去A1:F2的区域,只取A3:F39
2、由于在打A3:F39时在输入法中没将中文转换为英文,导致导入数据错误
第三部分实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
通过操作成功地将“交通量调查表”的数据导入到IBM SPSS Staticstics 20中并保存成为.sav文件。
二、小结、建议及体会
对于第一个实验,是比较基础的,是进行数据分析的第一步,对于我们熟悉SPSS的操作有很大的意义,虽说比较简单,但还是有一些细节要谨记,比如在上述遇到的问题。
上机实验二
实验项目名称上机实验2 实验日期 2014.12.26 实验者邓艳辉专业班级交通运输组别第二组一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:掌握SPSS描述性特征变量计算操作(频数分布分析过程等)
二、实验任务:根据实验1的数据,分析交通量(总计进出人数)特性,获取交通量(总计进出人数)与时间变化趋势图;对交通量(总计进出人数)进行探索分析(直方图、概率分布图、箱线图等);结合专业知识得出交通量变化的相关规律。
三、实验基本原理和方法:
频数分析:频数分析可以计算一个或多个变量值的频数,百分数或各种描述统计量,能够产生条形图和直方图,揭示数据分布的特征,
2、探索分析:探索分析是对统计数据进行进一步考察的过程。
对数据分析的首要一步是对数据进行初步的考察,具体是:(1)检查数据是否有误,特别是奇异值。
(2)数据的分布特征。
(3)对数据的特点和规律性的初步考察,以尽可能地发现一些内在的规律。
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、频数分析
1、“分析”?“描述分析”?“统计”。
2、选择进行频数分析的变量。
3、选择是否输出频数表格。
4、选择输出的统计量。
5、获取交通量(总计进出人数)与时间变化趋势图。
二、探索分析
1、分析”?“描述统计”?“探索”。
2、选择进行探索分析的变量。
3、选择是否输出统计描述和统计图。
4、设置统计图输出。
第三部分实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分
析等)
结合专业知识得出交通量变化的相关规律。
1、频数分析
统计量 (1)根据统计量表格可以看到,样本个数为36个,均值
总计进出人数是64.42,中位数是63.00,众数是50。
标准差是19.390.方差有效 36 N 是375.964,偏度是0.434,峰度是-0.297,缺失 0 均值 64.42 (2)从总计进出人数与时间变化趋势图可以看到,总计中值 63.00 a进出人数分布比较分散,众数 50
标准差 19.390
方差 375.964
偏度 .434
偏度的标准误 .393
峰度 -.297
峰度的标准误 .768
a. 存在多个众数。
显示最小值
2、探索分析
(1)直方图
(2)概率分布图
(3)箱图。
二、小结、建议及体会
一开始对这个数据的分析有点弄不明白,看着参考教程呆呆地十几分钟没有进展,但经过师兄的指点逐渐掌握了一点操作步骤,但后面的分析还是花了一些时间。
经过这个实验体验到了SPSS软件在构图分析方面的方便,在一些选择输出项的选择要根据自己所需的分析数据选择。
上机实验三
实验项目名称上机实验3 实验日期 2014.12.26 实验者邓艳辉专业班级交通运输组别一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:掌握SPSS参数估计和假设检验操作(单个样本T检验和独立样本T检验等) 二、实验任务:对教材例5.2.5和例4.2.7进行操作,阐述检验的结论。
三、实验基本原理与方法
1、单样本T检验:SPSS单样本T检验是检验一个数据样本所在总体平均数与某特定值之间的差异性,统计检验的前提是样本所在的总体服从正态分布。
2、两独立样本T检验:独立样本平均值的差异T检验的前提是:(1)两个样本相互独立。
(2)样本所来自的两个总体服从正态分布。
具体步骤如下: 第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、单样本T检验:以“参考教程三例5”为例
1、定义变量,输入数据。
2、“分析?比较均值?单样本T检验”。
3、“确定”。
二、独立样本T检验:以课本例4.2.7为例 1、定义变量、输入数据。
2、“分析?比较均值?独立样本T检验”。
单击继续,回到独立样本T检验对话框,点击确定,输出结果。
第三部分实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
1、单样本T检验的结论:
单个样本统计量
N 均值标准差均值的标准误
分数 45 76.7333 8.69796 1.29662
单个样本检验
检验值 = 80
t df Sig.(双侧) 均值差值差分的 95% 置信区间
下限上限
分数 -2.519 44 .015 -3.26667 -5.8798 -.6535
2、两独立样本T检验:
组统计量厂家 N 均值标准差均值的标准误
1.00 5 87.8000 4.32435 1.93391 得分
2.00 5 91.2000 2.77489 1.24097
二、小结、建议及体会
之前做作业的时候都是用EXCEL做的觉得也挺方便的,接触这个软件之后发现简便也不亚于EXCEL,但操作这个软件还是需要一些重复的操作来记住这些步骤。
但由于显示的时候可以中文显示分析结果,这一点比EXCEL方便。
上机实验四
实验项目名称上机实验4 实验日期 2014.12.26 实验者邓艳辉专业班级交通运输组别第二组一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:SPSS方差分析(单因素、双因素方差分析等)
二、实验任务:单因素方差分析在教材P158复习思考题5和6任选一题进行操作;双因素方差分析可尝试对“案例讨论题”进行操作(时间充分可做)。
三、实验基本原理和方法:
1、利用spss进行方差分析的一般过程:
(1)建立正确的数据文件;
(2)选择正确的方法分析类型;
(3)对话框结构与变量配置;
(4)功能设置;
(5)结果的输出与选择。
2、单因素方差分析:
3、多因素方差分析。
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、单因素方差分析:以教材复习思考题5为例
1、定义变量、输入数据。
2、“分析?比较均值?单因素”将“机器类型”设置为“因子”,“厚度”设置为“因变量”。
3、如图。
4、
5、单击确定,输入结果。
第三部分实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
实验输出结果如下:
描述
厚度
N 均值标准差标准误均值的 95% 置信区间极小值极大值
下限上限
1.000 5 .24200 .004950 .002214 .23585 .24815 .236 .248
2.000 5 .25600 .003162 .001414 .25207 .25993 .253 .261
3.000
5 .26200 .003674 .001643 .25744 .2665
6 .258 .26
7 总数
15 .25333 .009431 .002435 .24811 .25856 .236 .267
方差齐性检验
厚度
Levene 统计量 df1 df2 显著性
.945 2 12 .416。
单因素方差分析
厚度
平方和 df 均方 F 显著性
组间 .001 2 .001 32.917 .000
组内 .000 12 .000
总数 .001 14
F=32.917,故拒绝原假设,即每台机器生产的薄板厚度有显著差
异. ,3.89,F(2,12)0.05
多重比较
因变量: 厚度
LSD
(I) 机器类(J) 机器类型均值差标准误显著性 95% 置信区间型 (I-J) 下限上限
*2.000 -.014000 .002530 .000 -.01951 -.00849 1.000 *3.000 -
.020000 .002530 .000 -.02551 -.01449
*2.000 1.000 .014000 .002530 .000 .00849 .01951
*3.000 -.006000 .002530 .035 -.01151 -.00049
*1.000 .020000 .002530 .000 .01449 .02551 3.000
*2.000 .006000 .002530 .035 .00049 .01151 *. 均值差的显著性水平为 0.05。
二、小结、建议及体会
小结:通过定义变量,输入数据,正确选择分析选项,分析变量和因子,勾选正确的输出选项,得出分析结果,对比得出答案。
这个跟EXCEL 很相似,操作也差不多,所以还是比较容易操作和记住步骤的。
上机实验五
实验项目名称上机实验5 实验日期 2014.12.26 实验者邓艳辉专业班级交通运输组别第二组一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:掌握SPSS回归分析操作(一元线性回归分析、多元线性回归分析等) 二、实验任务:操作教材第6章的案例讨论题,并完成讨论题中的任意3个问题。
三、实验基本原理和方法
1、相关分析。
(1)准备数据。
(2)根据问题需要,进行相关性分析。
2、一元线性回归
3、多元线性回归
在SPSS中,多元线性回归和一元线性回归采用相同的命令。
区别在于,多元线性回归在选择自变量时要选择多个自变量。
4、曲线估计
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等) 多元线性回归:以教材第六章案例讨论题为例
1、定义变量、输入数据
2、如图。
3、单击“确定”按钮。
第三部分实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
实验所得结果如下:
a输入,移去的变量
模型输入的变量移去的变量方法
步进:准则:
F-to-enter 的1 各项贷款余额x1 . 概率 <= .050,
F-to-remove 的
概率 >= .100:。
步进:准则:
F-to-enter 的本年累计应收贷2 . 概率 <= .050,款x2 F-to-remove 的概率 >= .100:。
a. 因变量: 不良贷款y
模型汇总
模型 R R 方调整 R 方标准估计的误
差
a1 .846 .715 .703 1.9657
b2 .873 .762 .740 1.8364 a. 预测变量: (常量), 各项贷款余额x1。
b. 预测变量: (常量), 各项贷款余额x1, 本年累计应收贷款x2。
aAnova
模型平方和 df 均方 F Sig.
b回归 222.979 1 222.979 57.707 .000
1 残差 88.871 23 3.864
总计 311.850 24
c 回归 237.657 2 118.828 35.235 .000
2 残差 74.194 22 3.372
总计 311.850 24
a. 因变量: 不良贷款y
b. 预测变量: (常量), 各项贷款余额x1。
c. 预测变量: (常量), 各项贷款余额x1, 本年累计应收贷款x2。
a系数
模型非标准化系数标准系数 t Sig.
B 标准误差试用版
(常量) -.679 .734 -.925 .365 1 各项贷款余额x1 .038 .005 .846
7.597 .000
(常量) -1.358 .759 -1.790 .087 2 各项贷款余额x1 .029 .006 .646
4.564 .000
本年累计应收贷款x2 .169 .081 .295 2.086 .049 a. 因变量: 不良贷款y a已排除的变量
模型 Beta In t Sig. 偏相关共线性统计量
容差
b本年累计应收贷款x2 .295 2.086 .049 .406 .541
b1 贷款项目个数x3 -.103 -.480 .636 -.102 .277
b本年固定资产投资额x4 -.342 -2.051 .052 -.401 .391
c贷款项目个数x3 -.094 -.468 .645 -.102 .277 2 c本年固定资产投资额x4 -.305 -1.932 .067 -.388 .386 a. 因变量: 不良贷款y
b. 模型中的预测变量: (常量), 各项贷款余额x1。
c. 模型中的预测变量: (常量), 各项贷款余额x1, 本年累计应收贷款x2。
讨论题:
(1)绘制得到散点图如下:
从以上四图可以看到。
贷款余额x、本年累计应收贷款x的点较为集中,可以用一条直线12
进行拟合,说明它们和不良贷款之间是线性相关关系。
但是可以看到它们也并不是密切集中到一条线的两侧而是比较分散,故线性相关强度应该是中度。
而贷款项目x、本年固定资产投资3
额x的分布则更加分散,可以认为它们与不良贷款之间没有线性相关关系。
而实验中这两个因4
素被剔除也证明了这一一点。
(2)由系数表格可以得到线性回归方程为:。
回归系数y,0.029x,
0.169x,1.35812
0.029表示贷款余额x对不良资产的影响程度,回归系数0.169表示本年累计应收贷款x对不12良资产的影响程度。
二、小结、建议及体会
操作比较简单,但是分析结果比较繁杂,理解还要花一点时间,得出的结论和线性回归方程能对所给的数据比较好地模拟,从散点图看出它与模型的相关程度从而佐证软件的分析结果。