第五章 spss的参数检验
第五章SPSS参数检验
假设检验的基本原理
• 基本信念:利用小概率原理进行反证明。小概率事 件在一次实验中不可能发生。
例如:对人民大学男生平均身高进行推断
– H0:平均身高为173
– 样本平均身高为178,由于存在抽样误差,不能直接拒绝H0。 而需要考虑:在H0成立的条件下,一次抽样得到平均身高为178的可 能性有多大。如果可能性较大,是个大概率事件(与相比较),则不 能认为H0不正确。否则,如果可能性较小,是个小概率事件, 但确实发生了,则只能认为H0不正确。
SPSS两配对样本t检验
(一) 含义: 根据配对样本对两总体均值是否有显著差异进行推断.
例如: 某种减肥茶是否有效 (二)要求:
• 两样本数据必须两两配对,即:样本个数相同,个案顺序相同.如:减 肥茶的效果、不同广告形式对销售额的影响.(控制了个案自身的 影响)
• 两总体服从正态分布
SPSS两配对样本t检验
在test后的框中输入检验值
SPSS单样本t检验
(五)option选项
• confidence interval:指定输出-0的置信区间.默认值为 95%.
• Missing values: 缺失值的处理(单样本检验时以下选项没有差别)
– exclude cases analysis by analysis:当分析时涉及到有缺失 值变量时再剔除相应的个案
(三)基本思路
• H0:两总体均值无显著差异,差值序列的均值u0 =0.
• 构造统计量:同单样本均值检验
t D
– D=X- u0 S为差值序列的标准差
S/ n
– 实质是先求出每对测量值的差值;然后检验差值序列的均值
是否与0有显著差异.
SPSS 教程 第五章 方差分析
目录1、单因素方差分析1)准备分析数据2)启动分析过程3)设置分析变量4)设置多项式比较5)多重比较6)提交执行7)结果与分析2、多因素方差分析1)准备分析数据2)调用分析过程3)设置分析变量4)选择分析模型5)选择比较方法6)选择均值图7)选择多重比较8)保存运算值9)选择输出项10)提交执行11)结果分析方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。
(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。
总偏差平方和 SS t = SS b + SS w。
组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。
第5章 SPSS 20.0均值检验
对总体特征的推断一般采用参数估计(点估计 和区间估计)和假设检验两类方法实现。SPSS兼顾 了这两类方式,由于其核心原理基本类似,这里仅以 对假设检验的基本思想做重点讨论。 假设检验的基本思想是首先对总体参数提出假设, 然后利用样本告之的信息去验证提出的假设是否成立。 如果样本数据不能充分证明和支持假设,则在一定的 概率条件下,应拒绝该假设;相反,如果样本数据不 能够充分证明或者支持假设是不成立的,则不能推翻 假设。上述假设检验推断过程所依据的基本信息是小 概率原理,即发生概率很小的随机事件,在某一次特 定的实验中是几乎不可能发生的。
表5-1 单个样本统计量
N 钢管内径 10
均值 100.1040
标准差 .47596
均值的标准误 .15051
表5-1给出了单一样本均值检验的描述性统 计量、标准差和均值标准误差。钢管内径 均值为100.1040,接近总体100
表5-2是单一样本均值检验的结果列表,给 出了t统计量、自由度、双尾概率以及显著 性水平及置信区间。双尾概率P=0.507>显 著性水平0.05,接受原假设,说明钢管内径 与平均值100无显著差异。
表5-6 独立样本检验 方差方程的 Levene 检验 均值方程的 t 检验 差分的 95% 置 Sig.( F 电池使用 假设方差 时间 相等 假设方差 不相等 5.456 20.17 2 .000 .100 Sig. .755 t 5.484 df 21 双侧) .000 均值 差值 1.133 33 1.133 33 .20771 标准误 差值 .20665 信区间 下限 .7035 9 .7003 0 上限 1.563 08 1.566 36
0
其中
第5章 SPSS的参数检验-t检验练习题N
第5章SPSS的参数检验-t检验练习题1、给出配对T检验和两组独立样本分别适用的条件,并叙述其主要操作流程。
2、思考在工作学习中,还有哪些问题与本章案例相似?将它写成本书的案例形式,并给出操作过程和输出结果说明。
3、某学校想要测试一个英语新教学方案的效果,从一个班级中随机抽取15名学生,经过一个学期的教学,其测试前后成绩如下表所示,问该方案是否引起学生成绩的显著变化。
表15名学生测试前后的成绩第5章t检验(参数假设检验)应用练习以数据文件“gd95.xls”(1995年广州市中小学生体质原始数据)的数据为依据。
1、试比较广州市城乡男女7岁学生血红蛋白差异,并说明因此而得到的结果。
【以下是参考案例】复杂格式1(城乡男女7岁学生血红蛋白)男(150人) 女(150人) t值P值城乡13.221±1.05912.130±1.28413.077±1.02712.088±1.1071.195.303P=0.233>0.05P=0.762>0.05t值-8.030 -8.023P值P=0.000<0.05 P=0.000<0.0186说明:由于城市男女7岁学生血红蛋白均值T检验结果P= .23>0.05,差异没有显著性意义,可认为城市男女7岁学生血红蛋白没有差异;同时乡村男女7岁学生血红蛋白均值T检验结果P= .76>0.05,差异没有显著性意义,可认为乡村市男女7岁学生血红蛋白没有差异。
但,城乡7岁男生血红蛋白均值T检验结果P= .00<0.05,有显著性意义,可认为城乡7岁男生血红蛋白有差异;城乡7岁女生血红蛋白均值T检验结果P= .00<0.05,没有显著性意义,可认为城乡7岁男生血红蛋白有差异。
综上所述,7岁学生血红蛋白方面仅仅存在城乡差别而没有性别差异,而且城市学生优于乡村学生。
营养……2、试比较广州市城乡男女8岁、18岁学生下列指标的差异,并说明因此而得到的结果。
《统计分析与SPSS的应用(第五版)》课后练习答案(第5章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->compare means->one-samples T test;)采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异);分析:指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS对上表数据进行描述统计,并绘制相关的图形。
(2)基于上表数据,请利用SPSS给出大学生每周上网时间平均值的95%的置信区间。
(1)分析描述统计描述、频率(2)分析比较均值单样本T检验每周上网时间的样本平均值为27.5,标准差为10.7,总体均值95%的置信区间为23.8-31.2.3、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。
第五章 SPSS参数检验1
作出决策
拒绝假设!
别无选择.
☺☺ ☺
☺☺ ☺☺
☺☺
抽取随机样本
☺X均=值20☺
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假设,用 H0表示
2. 所表达的含义总是指参数没有变化或变量之间没有关系 3. 最初被假设是成立的,之后根据样本数据确定是否有足够
的证据拒绝它
假设检验的理论依据
假设检验所以可行,其理论背景为 实际推断原理,即“小概率原理”
人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生 .
小概率原理及实际推理方法
1、小概率事件 如果在某次试验或观测中,某事件出现
的概率很小,这样的事件叫小概率事件。
2、小概率原理
小概率事件在一次试验或观测中几乎是不可能发 生的。
至此,SPSS将自动计算t统计量和对应的概 率p值。
• 推断储户一次平均存(取)款金额是否为2000 • 推断家庭人均住房面积的均值是否为20平方米
练习
根据各保险公司人员构成情况数据,对我国目 前保险公司从业人员的受高等教育的程度和年轻化 的程度进行推断:
• 保险公司具有高等教育水平的员工比例的平均值不 低于0.8;
解:研究者想收集证据予以证明的假设应该是“ 生产过程不正常”。建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
提出假设
(例题分析)
• 【例】某品牌洗涤剂在它的产品说明书中声称 :平均净含量不少于500克。从消费者的利益 出发,有关研究人员要通过抽检其中的一批产 品来验证该产品制造商的说明是否属实。试陈 述用于检验的原假设与备择假设
3. 在一次试验中小概率事件一旦发生,我们就有 理由拒绝原假设
SPSS的参数检验和非参数检验
SPSS的参数检验和非参数检验SPSS是一种非常常用的统计分析软件,可以用于参数检验和非参数检验。
参数检验是假设检验的一种方法,用于判断统计样本是否代表总体。
而非参数检验则是用于检验数据是否满足一些分布假设,或判断两个或多个群体是否具有差异。
参数检验主要有t检验、方差分析和回归分析等。
其中,t检验用于比较两个样本均值是否有显著差异,包括独立样本t检验和相关样本t检验。
方差分析用于比较三个或更多样本均值是否有显著差异,可以进行单因素方差分析或多因素方差分析。
回归分析用于建立预测模型,可以通过线性回归或多项式回归进行。
非参数检验通常适用于数据不满足正态分布或方差齐性的情况,如Wilcoxon符号秩检验、Kruskal-Wallis H检验、Mann-Whitney U检验等。
Wilcoxon符号秩检验用于比较两个配对样本的差异是否有显著差异,Kruskal-Wallis H检验用于比较三个或更多独立样本的差异是否有显著差异,Mann-Whitney U检验用于比较两个独立样本的差异是否有显著差异。
在SPSS中进行参数检验和非参数检验一般需要进行以下步骤:1.导入数据:将数据导入SPSS软件,可以通过选择文件-导入功能进行操作。
2.设定分析变量:定义需要进行分析的变量,并将其添加到分析列表中。
3.选择统计方法:根据实验设计和数据分布情况,选择合适的参数检验或非参数检验方法。
4.执行分析:点击运行按钮进行分析,在分析结果中可以查看得到显著性水平、均数、方差等指标。
5.结果解释:根据分析结果进行假设检验,判断是否存在显著差异,并解释其结果。
无论是参数检验还是非参数检验,在进行分析前需要注意数据的合理性、样本的选择和实验设计的合理性等,以保证分析结果的可靠性。
同时,还应根据不同的研究目的和数据特点选择适当的方法,并合理解释分析结果。
在SPSS软件中,可以通过图表、表格和描述性统计等形式展示和解释结果,并通过结果进行科学判断和相关推断。
统计分析与Spss应用第五章(描述性统计分析)
选入需要描述的 变量,可选入多个
确定是否将原始数 据的标准正态变换 结果存为新变量。
变量列表顺序 字母顺序 均数升序 均数降序。
Descriptive Statistics N 血清总胆固醇 Valid N (listwise) Minimum Maximum 101 2.70 7.22 101 Mean Std. Deviation 4.6995 .86162
5.1.1 对话框界面及 各部分选项说明 【Display frequency tables复选框】确定是 否在结果中输出频数 表。 【Statistics钮】单击 后弹出Statistics对话 框,用于定义需要计 算的其他描述统计量。
集中趋势指标
百分位数指标
计算百分数时选此项
离散趋势指标 分布指标
1
.002
.000
Hale Waihona Puke .006.002b
.000
.005
639 61.974 d 65.957 55.621 9.398
e
40 40
.014 .006
.016b .009b .011b .003
b
.008 .003 .004 .000
.025 .016 .018 .006 .001
b
1
.002
.000
.002
descriptive statistics菜单主要内容
(1)频数分布表分析(Frequencies):其特色就是产生 频数表,对分类数据和定量资料都适用。 (2)统计描述分析(Descriptive)进行一般性描述,适 用于服从正态分布的定量资料。 (3) Explore 过程:用于对数据分布状况不清楚时的 探索性分析,它会杂七杂八给出一大堆可能用到的 统计指标和统计图,让研究者参考。 (4)Crosstabs 过程则完成计数资料和等级资料的统计 描述和一般的统计检验我们常用的X2 检验也在其中 完成 (5)Ratio过程;用于对两个连续性变量计算相对比指 标,它可以计算出一系列非常专业的相对比描述指 标。
SPSS统计分析参数估计与假设检验
(四)某商品的零售商要求总代理增加广告费支 出,认为如此每星期平均销售量可达20000箱。 总代理增加广告费三个月后想了解平均销售情 况,随机抽取16家零售店调查,发现每星期平 均销售量只有15000箱,标准差为6000箱。假设 销售量服从正态分布,试问平均销售量的下降 是否因偶然因素所致(α=0.01)?
2020/3/2
6
(二)以[04-7]的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋 白平均值是否与另一地区的平均值相等。
1、操作步骤 1)(打开数据文件“04-7血红蛋白.sav”。) 按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
s
2 1
s
2 2
n1 n2
2020/3/2
13
两个总体均值之差的检验 (s12、 s22 未知,大样本)
• 检验统计量为
2020/3/2
10
第二节 独立样本T检验
一、 简介
用于检验对于两组来自独立总体的样本,
其独立总体的均值或中心位置是否一样。如果 两组样本彼此不独立,应使用配对T检验 (Paired -Sample T Test )。如果分组不止一 个,应使用One-Way ANOVA 过程进行单变量 方差分析。如果想比较的变量是分类变量,应 使用Crosstabs功能。
(一) [05-1] 某校在对一项教学改革措施的评价 中,随机抽取了60位学生进行态度调查,他们的 10项态度7级量表的态度反应资料见下表:
第五章 参数估计与假设检验的SPSS过程 实验
实验:参数估计与假设检验的SPSS过程
一、实验目的与要求
1.熟悉区间估计的概念与操作方法
2.熟练掌握T检验的SPSS操作
3.学会利用T检验方法解决身边的实际问题
4. 学会对运行结果进行统计分析说明。
二、实验原理
1.参数估计的基本原理
参数估计就是利用样本信息去估计未知的总体参数,基本原理包括极大似然原理及最大二乘估计原理等。
2.假设检验的基本原理
假设检验的基本思路是先对总体特征做出某种假设,然后利用样本提供的信息去验证前面提出的假设是否成立。
如果样本数据不能充分证明和支持假设的
成立,则在一定的概率条件下,应拒绝该假设;反之,如果样本数据不能充分证
明和支持假设是不成立的,则不能推翻原假设。
小概率事件原理是假设检验的基
本原理。
三、实验内容与步骤
分析某班级学生的高考数学成绩是否存在性别上的差异。
(显著性水平为0.01)
数据如表所示:
某班级学生的高考数学成绩
性别数学成绩
男(n=18)85 89 75 58 86 80 78 76 84 89 99 95 82 87 60 85 75 80
女(n=12)92 96 86 83 78 87 70 65 70 65 70 78 72 56
(1)对题目的分析:
(2)数据组织:
(3) 主要设置步骤:
(4)主要结果及分析:。
第五章spss的参数检验
第五单元 spss 的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值 即u=u0=75步骤:生成spss 数据→分析→比较均值→单样本t 检验→相关设置→输出结果 表5-1设,且置信区间为(67.31,80.14),表中从置信区间上也可以看出73.73在此区间,更加证明 一般六级成绩为75 ,即认为该总经理的话可信。
2、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。
然而心理学家则倾向于认为提出事实的方式是有关系的。
为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。
原假设:决策与提问方式无关,即u-u0=0步骤:生成spss 数据→分析→比较均值→两独立样本t 检验→相关设置→输出结果 表5-3策者的决策与提问方式有关。
由表5-4看出,独立样本在0.05的检验值为0,小于0.05,故拒绝原假设,认为决策者对事实所作出的反应与提问方式有关,心理学家的观点更站得住脚。
3、一种植物只开兰花和白花。
按照某权威建立的遗传模型,该植物杂交的后代有75%的几率开兰花,25%的几率开白花。
现从杂交种子中随机挑选200颗,种植后发现142株开了兰花,请利用SPSS进行分析,说明这与遗传模型是否一致?原假设:开蓝花的比例是75%,即u=u0=0.75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果表5-5),0.75不在此区间内,进一步说明原假设不成立,故认为与遗传模型不一致。
4、给幼鼠喂以不同的饲料,用以下两种方法设计实验:方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下:方式2:甲组有12只喂饲料1,乙组有9只喂饲料2所测得的钙留存量数据如下请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。
第五章 SPSS的参数检
置信区间
• 也称置信间距,是指在某一置信度 是,总体参数所在区域距离或区 域长度。 • 置信区间的上下二端点值称为置 信界限。 • 1-α为置信度或置信水平。
练习
利用居民储蓄调查数据 • 推断储户总体一次平均存 (取)款金额是否为2500元。
二、两独立样本T检验 (indepent-sample T test )
误差
• 误差是指实际观察值与客观真值之差、样本 指标与总体指标之差。 • 误差可分为系统误差和抽样误差。 • 系统误差在实际观测过程中,由于仪器未校 正、测量者感官的某种障碍、掌握疗效标准 偏高或偏低等原因,使观察值不是分散在真 值两侧,而是有方向性、系统性或周期性地 偏离真值。这类误差可以通过实验设计和技 术措施来消除或使之减弱,但不能靠概率统 计办法来消除或减弱。 _问卷设计不合理
单尾检验与双尾检验
(one-tailed test and two tailed test) • 方向性的研究假设与无方向性的研究假 设的检验方式有所不同,一个采用单尾 检验,一个采用双尾检验。 • 单尾检验用于检验方向性的研究假设, 如:城市人的收入水平比农村人高。双 尾检验用于检验无方向性的研究假设, 如:城市人的收入水平与农村人的收入 水平有差异。
• 上述这些零假设例子有一个共 同的特征,它们都包含着这样 一个判断陈述:两个事物是相 同的(equality)或无差异, 或者相互之间没有关联。
零假设(null hypothesis)
• 什么是零假设: • 零假设代表的意思是“你所 研究的两个变量之间无关联”
零假设的目的 1
• 零假设是我们研究的一个始点,因为,当我 们对这个事物没有什么了解或没有获得相关 信息时,它是一个可以接受的对这个事物的 基本陈述。 • 无关联(lack of a relationship)作为研 究始点是假设检验的一个特点,在某种程度 上,也通常是定量研究(采取统计分析技术 进行研究)的一个特点。这也就是说,在你 没有拿出证据证明这两个群体之间存在系统 差异时,你只能假定,你所观查到的差异只 是偶然现象或偶然因素的作用(机遇或偶然 chance)。
《统计分析与SPSS的应用(第五版)》课后练习答案(第5章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5 章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下:80, 81, 72, 60, 78, 65, 56, 79,77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss 数据→分析→比较均值→单样本t 检验→相关设置→输出结果(Analyze->compare means->one-samples T test ;)采用单样本T 检验(原假设H0:u=u0=75, 总体均值与检验值之间不存在显著差异);单个样本统计量N 均值标准差均值的标准误成绩11 73.73 9.551 2.880单个样本检验检验值= 75差分的95% 置信区间t df Sig.( 双侧) 均值差值下限上限成绩-.442 10 .668 -1.273 -7.69 5.14分析:指定检验值:在test 后的框中输入检验值(填75),最后ok!分析:N=11 人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean) 为2.87.t 统计量观测值为-4.22,t 统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14), 由此采用双尾检验比较 a 和p。
T 统计量观测值的双尾概率p-值(sig.(2-tailed) )为0.668>a=0.05 所以不能拒绝原假设;且总体均值的95% 的置信区间为(67.31,80.14), 所以均值在67.31~80.14 内,75 包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35 名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS 对上表数据进行描述统计,并绘制相关的图形。
SPSS统计分析第五章方差分析
例题
用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增 加数据如下。比较四种饲料对猪体重增加的作用有无不同。
4.因素的主效应和因素间的交互效应
有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是:第一组用一 般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基础上加用B药,第 四组在一般疗法基础上A、B两药同时使用。一个月后观察红细胞增加数。要求分析 两种药物的疗效(数据下表)。
实验数据
2.水平
因素的不同等级称作水平。 例如,性别因素在一般情况下只研究两个水平:男、女。化学实验或生物实验中的“剂 量”必须离散化为几个有限的水平数。如:1ml、2ml、4ml三个水平。 应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能是字符型变量,必须 是数值型变量。例如性别变量SEX,定义为数值型,取值为0、1。换句话说,因素变量 的值实际上是该变量实际值的代码,代码必须是数值型的。可以定义值标签F、M(或 Fema1e、ma1e)来表明0、1两个值的实际含义,以便在打印方差分析结果时使用。使 结果更加具有可读性。
1、单因素方差分析
单因素方差分析也称作一维(元)方差分析。它检验由单一因素影响的一个(或几 个相互独立的)因变量按因素各水平分组的均值之间的差异是否具有统计意义。还 可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析 即进行均值的多重比较。
One-way ANOVA过程适用情况
三、方差分析过程
SPSS提供的方差分析过程有: One-way过程
第五章 SPSS参数检验
配对样本的 t 检验 (数据形式)
观察序号
样本1
样本2
差值
1 2 M i M n
x 11 x 12 M x 1i M x 1n
x 21 x 22 M x 2i M x 2n
D1 = x 11 - x 21 D1 = x 12 - x 22 M D1 = x 1i - x 2i M D1 = x 1n- x 2n
1
2 2
总体2
抽取简单随机样 样本容量 n1 计算X1
计算每一对样本 的X1-X2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
抽样分布
1 2
两个总体均值之差的检验 (12、 22 已知)
•
1.假定条件 (1)两个样本是独立的随机样本 (2)两个总体都是正态分布 (3)若不是正态分布, 可以用正态分布来近似(n130和 n230) 2.检验统计量为
1 2 0
5.5 两配对样本的T检验
5.5.1 两配对样本T检验的目的 (1)利用来自两个总体的配对样本,推断两个总体 的均值是否存在显著性差异。 (2)配对样本:个案在“前”“后”两种状态下, 或事物两个不同侧面的描述。 (3)要求: ①两配对样本的样本容量应该相等,两组样本观察 值的顺序一一对应,不能随意改变; ②样本来自的总体服从或近似服从正态分布。
5.2.2 单样本T检验的实现思路 • (1)提出原假设: H0 : 0
• (2)计算检验统计量和概率P值
X 0 t S n
(3)给定显著性水平与p值做比较:如果p值小于 显著性水平,小概率事件在一次实验中发生,则我 们应该拒绝原假设,反之就不能拒绝原假设。
5.2.3 单样本t检验的基本操作步骤
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
spss的参数检验第五单元
分。
、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为751请76 56, 79, 77,87, 80, 人参加考试,得分如下:81, 72, 60, 78, 65, 现从雇员中随机选出11 问该经理的宣称是否可信。
u=u0=75
即原假设:样本均值等于总体均值t检验→相关设置→输出结果步骤:生成spss数据→分析→比较均值→单样本5-1
表
表
,故不能拒绝原假设,且0.668>0.050.05的检验值下得到双侧检验值为分析:由上表可以看出,在在此区间,更加证明73.73一般六级成置信区间为(67.31,80.14),表中从置信区间上也可以看出绩为75 ,即认为该总经理的话可信。
2、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。
然而心理学家则倾向于认为提出事实的方式是有关系的。
为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。
原假设:决策与提问方式无关,即u-u0=0
步骤:生成spss数据→分析→比较均值→两独立样本t检验→相关设置→输出结果
表5-3
组统计量
提问方式 N 均值标准差均值的标准误
.035 200 .46 丢票再买 .500 决策
.024
183
.88
丢钱再买 .326
表5-4
分析:由表5-3可以看出,提问方式不同所做的相同决策的平均比例是
46%和88%,认为决策者的决策与提问方式有关。
由表5-4看出,独立样本在0.05的检验值为0,小于0.05,故拒绝原假设,认为决策者对事实所作出的反应与提问方式有关,心理学家的观点更站得住脚。
3、一种植物只开兰花和白花。
按照某权威建立的遗传模型,该植物杂交的后代有75%的几率开株开了兰花,请利142颗,种植后发现200的几率开白花。
现从杂交种子中随机挑选25%兰花,
SPSS 进行分析,说明这与遗传模型是否一致?用u=u0=0.75
75%,即原假设:开蓝花的比例是 t 检验→相关设置→输出结果步骤:生成spss 数据→分析→比较均值→单样本5-5 表
5-6 表
0.75,1.23,1.35)值为0,小于0.05,故拒绝原假设,由于检验区间为(sig 分析:由于检验的结果 不在此区间内,进一步说明原假设不成立,故认为与遗传模型不一致。
:同一鼠喂不同的饲料所测得的体1 给幼鼠喂以不同的饲料,用以下两种方法设计实验:方式4、所测得的钙留存量数29只喂饲料12只喂饲料1,乙组有内钙留存量数据如下: 方式2:甲组有请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙据如下 的留存量有显著不同。
原假设:不同饲料使幼鼠体内钙的留存量无显著不同。
1方式 t 检验
→相关设置→输出结果步骤:生成spss 数据→分析→比较均值→配对样本5-7 表
5-8 表
5-9
表
方式2步骤:生成spss数据→分析→比较均值→独立样本t检验→相关设置→输出结果
表5-10
组统计量
5-11
表
配对样本的分析结果可以看出两组的所示,检验法所得结果如表5-7,5-8,5-9分析:采用配对样本
t不应该拒绝原假设。
采0.153>0.05 sig值为1.8752)同时在置信区间内(平均差是1.789-5.2529,值为在置信区间内 sig5-115-10,所示,可以看出均值差为0.892用独立样本t检验法所得结果
如表 0.05 ,故不能拒绝原假设。
所以,两种饲料使用后的钙存量无显著差异。
0.405,大于题的数据看作是来自总体的样本,试分析男生和女生的课程平均分是否存在、如果将习题二第45显著差异?原假设:男女生课程平均分无显著差异步骤:分析→比较均值→单因素分析→因变量选择课程,因子选择性别进行→输出结果:5-12
表描述poli
置信区间 95% 均值的均值标准差标准误下限上限极小值N 极大值
94.00 10.41793 30 82.7568 1.90205 78.8667 female 56.00 74.9765
96.00 83.7639 30 male 3.42126 69.7694 76.7667 .00 18.73901
96.00
总数 73.9240
77.8167
.00
1.94537
81.7093
60
15.06876
表5-13
ANOVA
poli
平方和 df 均方 F 显著性
.594
66.150 1 .288
组间 66.150
229.842
组内58 13330.833
59
总数13396.983
分析:由表5-12和5-13可以看,出男生和女生成绩平均差为1.4021在置信区间内sig值为0.307,大于0.05,故不能拒绝原假设,即认为男生和女生的平均成绩没有显著差异
5-14
表成对样本检验成对差分置信区差分的 95% 间双均值的标准Sig.() 上限下限误 t df 侧标准差均值
106.041
.041
30.611
-138.20培 1 培训前 - 11
-3.458
-70.833 -2.314
对9
训后
、6 如果将习题二第4题的数据看作是来自总体的样本,试分析哪些课程的平均分差异不显著。
:步骤:计算出各科的平均分转换→计算变量→相关的设置组统计量均值的标准误标准差 sex N 均值
1.65848 average
9.08385 female 67.5208 30
1.79868
9.85179
male
68.9229
30
Tukey方法进行检验。
数据→分析→比较均值→单因素→进行方差齐性检验→选择重新建立SPSS 试分析该培训是否产生了显著效果。
7、以下是对促销人员进行培训前后的促销数据:原假设:培训前后效果无显著差异t检验→相关设置→输出结果步骤:生成spss数据→分析→比较均值→配对样本5-15
表成对样本统计量均值的标准误 N 标准差均值22.545 12 78.098 489.17 对 1
培训前17.880
培训后 61.938
12
560.00
表5-16
成对样本相关系数
N 相关系数 Sig.
.675
& 培训后 -.135
12
对 1
培训前表5-17
成对样本检验
成对差分
差分的 95% 置信区间 Sig.(双均值的标准侧) t
误标准差均值上限 df 下限-70.833 106.041 -138.209 -3.458 11
-2.314
- 1 对培训前培30.611
0.41训后分析:由表5-15,5-16,5-17可以看出,培训前与培训后的均值差为70.83 ,由sig值为0.041,小于0.05,故拒绝原假设,认为培训前后有显著差异即培训产生了显著效果。