SPSS案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某道路弯道处53车辆减速前观测到的车辆运行速度,试检验车辆运行速度是否服从正态分布。
这道题目的解答可以先通过绘制样本数据的直方图、P-P图和Q-Q图坐车粗略判断,然后利用非参数检验的方法中的单样本K-S检验精确实现。
一、初步判断
1.1绘制直方图
(1)操作步骤
在SPSS软件中的操作步骤如图所示。
(2)输出结果
通过观察速度的直方图及其与正态曲线的对比,直观上可以看到速度的直方图与正太去线除了最大值外,整体趋势与正态曲线较吻合,说明弯道处车辆减速前的运行速度有可能符合正态分布。
1.2绘制P-P图
(1)操作步骤
在SPSS软件中的操作步骤如图所示。
(2)结果输出
根据输出的速度的正态P-P图,发现速度均匀分布在正态直线的附近,较多部分与正态直线重合,与直方图的结果一致,说明弯道处车辆减速前的运行速度可能服从正态分布。
二、单样本K-S检验
2.1单样本K-S检验的基本思想
K-S检验能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优的检验方法,适用于探索连续型随机变量的分布。
单样本K-S检验的原假设是:样本来自的总体与指定的理论分布无显着差异,即样本来自的总体服从指定的理论分布。SPSS的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。
单样本K-S检验的基本思路是:
首先,在原假设成立的前提下,计算各样本观测值在理论分布中出现的累计概率值F(x),;其次,计算各样本观测值的实际累计概率值S(x);再次,计算实际累计概率值与理论累计概率值的差D(x);最后,计算差值序列中的最大绝对值差值,即
通常,由于实际累计概率为离散值,因此D修正为:
D统计量也称为K-S统计量。
在小样本下,原假设成立时,D统计量服从Kolmogorov分布。在大样本下,原假设
成立时,D
n近似服从K(x)分布:当D小于0时,K(x)为0;当D大于0时,容易理解,如果样本总体的分布与理论分粗的差异不明显,那么D不应较大。如果D统计量的概率P值小于显着性水平α,则应拒绝原假设,认为样本来自的总体与指定的分布有显着差异如果D统计量的P值大于显着性水平α,则不能拒绝原假设,认为,样本来自的总体与指定的分布无显着差异。在SPSS中,无论是大样本还是小样本,仅给出大样本下的和D
n对应的概率P值。
2.2软件操作步骤
单样本K-S检验的操作步骤如图所示
2.3输出结果并分析
SPSS的输出结果如表所示.
单样本Kolmogorov-Smirnov 检验
速度
N 98
正态参数a,b
均值47.988 标准差11.6310
最极端差别绝对值.090 正.050 负-.090
Kolmogorov-Smirnov Z .888
渐近显着性(双侧) .409
a. 检验分布为正态分布。
b. 根据数据计算得到。
该表表明,速度的均值为47.988,标准差为11.6310。最大绝对差值为0.090,最大正差值为0.050,最大负差值为-0.090。本例应采用大样本下D统计量的精确概率值,输出了根号nD值0.888和概率P值0.409,如果显着性水平为0.05,由于概率P值大于显着性水平,因此不能拒绝原假设,可以认为弯道处车辆减速前的运行速度服从正态分布。
第13题
表中数据为某条公路上观测到的交通流速度与密度数据,试用一元线性回归模型分析两者的101关系。 一、一元线性回归的基本原理 1.1一元线性回归模型:
上述模型可分为两部分:(1)01ββχ+是非随机部分;(2)ε是随机部分。β0和β1为回归常熟和回归系数该式被称为估计的一元线性回归方程。 1.2模型参数估计
用最小二乘法估计参数,是在关于随机误差的正态性、无偏性、同方差性、独立性这四个假设的基础上进行的。
为了求回归系数,0β,1β,令一阶导数为0 ,得: 从中解出: 二、一元线性回归分析的假设检验:
其中:SST 称为总体离差平方和,代表原始数据所反映的总偏差的大小。 SSR 称为回归离差平方和,它是由变量x 引起的偏差,反应x 的重要程度
SSE 称为剩余离差平方和,它是由实验误差以及其它未加控制因素引起的偏差,反映了试验误差及其它随机因素对试验结果的影响。 2.1回归方程优度检验的
相关系数反映了由于使用Y 与X 之间的线性回归模型来估计y 的均值,而导致总离差平方和减少的程度。它与SSR 成正比,R 2 的取值在0-1之间,其值越接近1,说明方程对样本数据点的拟合度越高;反之,其越接近0说明,明模型的拟合度越低。
2.2回归方程的显着性检验 假设01:0,H β= 11:0H β≠。 在0H 成立的条件下,有:
上式中,n 1 =1,n 2=n-2,F 服从自由度为(1,n-2)的F 分布。给定显着水平
α,若12(,)F F n n α>,拒绝原假设,表明回归效果显着。 2.3回归系数的显着性检验
在
H成立的条件下,有:
当
2(2)
t t n
α
>-时,拒绝原假设,回归显着。
注意:注意回归方程的显着性检验与回归系数的显着性检验的的区别:回归系数的显着性检验是用于检验回归方程各个参数是否显着为0的单一检验,回归方程的显着性检验是检验所有解释变量的系数是否同时为0的联合检验,分别为t检验FF检验。对于一元线性回归模型,F检验与t检验是等价的,而对于二元以上的多元回归模型,解释变量的整体对被解释变量的影响是显着的,并不表明每一个解释变量对它的影响都显着,因此在做完F检验后还须进行t检验。
2.4残差均值为零的正态性分析,
进行一元线性回归建模的前提是残差ε~N(0,δ2)。而结实变量x去某个特定的值是,对应的残差必然有证有负,但总体上应服从已领为君值得正态分布。可以通过绘制残插图对该问题进行分析。残插图是一种散点图,途中横坐标是结实变量,纵坐标为残差。如果残差的均值为零,则残插图中的点应在纵坐标为零的横线上、下随机散落。
三、软件操作
一元线性回归的软件操作步骤如图所示。
四、输出结果
SPSS的输出结果如表所示。
该表中格列数据的含义(从第二列开始)依次是:被解释变量和解释变量的负相关系数、判定系数R2 、调整的系数R2 、回归方程的估计标准误差。依据该表可以进行拟合优度检验。由于判定系数R2 较接近1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,不能被模型解释的部分较少。