薛薇第四版SPSS第五章
最新《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在地职业年龄N Valid 282 282 282Missing 0 0 0户口所在地Frequency Percent ValidPercentCumulativePercentValid 中心城市200 70.9 70.9 70.9 边远郊区82 29.1 29.1 100.0 Total 282 100.0 100.0职业Frequency Percent ValidPercentCumulativePercentValid 国家机关24 8.5 8.5 8.5 商业服务业54 19.1 19.1 27.7 文教卫生18 6.4 6.4 34.0公交建筑业15 5.3 5.339.4 经营性公司18 6.4 6.445.7学校155.3 5.351.1一般农户3512.4 12.4 63.5 种粮棉专业户4 1.4 1.4 64.9 种果菜专业户10 3.5 3.5 68.4 工商运专业户34 12.1 12.1 80.5 退役人员17 6.0 6.0 86.5 金融机构35 12.4 12.4 98.9现役军人 3 1.11.1 100.0Total 282 100.0 100.0年龄Frequency Percent ValidPercent Cumulative PercentValid 20岁以下 4 1.4 1.4 1.4 20~35岁146 51.8 51.8 53.2 35~50岁91 32.3 32.3 85.5 50岁以上41 14.5 14.5 100.0 Total 282 100.0 100.0分析:本次调查的有效样本为282份。
薛薇SPSS统计分析方法及应用基本统计分析共87页文档
2、要冒一次险!整个生命就是一场冒险。走得最远的人,常是愿意 去做,并愿意去冒险的人。“稳妥”之船,从未能从岸边走远。-戴尔.卡耐基。
梦 境
3、人生就像一杯没有加糖的咖啡,喝起来是苦涩的,回味起来却有 久久不会退去的余香。
薛薇SPSS统计分析方法及应用基本统计 4、守业的最好办法就是不断的发展。 5、当爱不能完美,我宁愿选择无悔,不管来生多么美丽,我不愿失 去今生对你的记忆,我不求天长地久的美景,我只要生生世世的轮 回里有你。 分析
Thank you
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)
WORD 格式整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282 份。
《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)
《统计分析与S P S S的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在地职业年龄N Valid 282 282 282Missing 0 0 0户口所在地Frequency Percent ValidPercentCumulativePercentValid 中心城市200 70.9 70.9 70.9 边远郊区82 29.1 29.1 100.0Total 282 100.0 100.0职业Frequency Percent ValidPercentCumulativePercentValid 国家机关24 8.5 8.5 8.5 商业服务业54 19.1 19.1 27.7 文教卫生18 6.4 6.4 34.0 公交建筑业15 5.3 5.3 39.4 经营性公司18 6.4 6.4 45.7 学校15 5.3 5.3 51.1 一般农户35 12.4 12.4 63.5 种粮棉专业户4 1.4 1.4 64.9 种果菜专业户10 3.5 3.5 68.4 工商运专业户34 12.1 12.1 80.5 退役人员17 6.0 6.0 86.5 金融机构35 12.4 12.4 98.9 现役军人 3 1.1 1.1 100.0Total 282 100.0 100.0年龄Frequency PercentValid PercentCumulative PercentValid20岁以下 4 1.4 1.4 1.4 20~35岁146 51.8 51.8 53.2 35~50岁 91 32.3 32.3 85.5 50岁以上 41 14.5 14.5 100.0Total282100.0100.0分析:本次调查的有效样本为282份。
《统计分析与SPSS的应用(第五版)》课后练习答案(第5章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->compare means->one-samples T test;)采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异);分析:指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS对上表数据进行描述统计,并绘制相关的图形。
(2)基于上表数据,请利用SPSS给出大学生每周上网时间平均值的95%的置信区间。
(1)分析描述统计描述、频率(2)分析比较均值单样本T检验每周上网时间的样本平均值为27.5,标准差为10.7,总体均值95%的置信区间为23.8-31.2.3、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。
统计分析与Spss应用第五章(描述性统计分析)
选入需要描述的 变量,可选入多个
确定是否将原始数 据的标准正态变换 结果存为新变量。
变量列表顺序 字母顺序 均数升序 均数降序。
Descriptive Statistics N 血清总胆固醇 Valid N (listwise) Minimum Maximum 101 2.70 7.22 101 Mean Std. Deviation 4.6995 .86162
5.1.1 对话框界面及 各部分选项说明 【Display frequency tables复选框】确定是 否在结果中输出频数 表。 【Statistics钮】单击 后弹出Statistics对话 框,用于定义需要计 算的其他描述统计量。
集中趋势指标
百分位数指标
计算百分数时选此项
离散趋势指标 分布指标
1
.002
.000
Hale Waihona Puke .006.002b
.000
.005
639 61.974 d 65.957 55.621 9.398
e
40 40
.014 .006
.016b .009b .011b .003
b
.008 .003 .004 .000
.025 .016 .018 .006 .001
b
1
.002
.000
.002
descriptive statistics菜单主要内容
(1)频数分布表分析(Frequencies):其特色就是产生 频数表,对分类数据和定量资料都适用。 (2)统计描述分析(Descriptive)进行一般性描述,适 用于服从正态分布的定量资料。 (3) Explore 过程:用于对数据分布状况不清楚时的 探索性分析,它会杂七杂八给出一大堆可能用到的 统计指标和统计图,让研究者参考。 (4)Crosstabs 过程则完成计数资料和等级资料的统计 描述和一般的统计检验我们常用的X2 检验也在其中 完成 (5)Ratio过程;用于对两个连续性变量计算相对比指 标,它可以计算出一系列非常专业的相对比描述指 标。
《统计分析与spss的应用(第五版)》课后练习答案(第章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第2章SPSS数据文件的建立和管理1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么?SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。
●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标。
●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的数据。
2、什么是SPSS的个案?什么SPSS的变量?个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。
变量:数据编辑器窗口中的一列。
3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明?默认的变量名:VAR------;默认的变量类型:数值型。
变量名标签和变量值标签可增强统计分析结果的可读性。
4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料?体重变化情况产品类型明显减轻无明显变化第一种产品27 19第二种产品20 33问:在SPSS中应如何组织该数据?数据文件如图所示:5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值?缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing Value)。
用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。
用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。
系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“•”。
在变量视图中定义。
6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。
《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在地职业年龄N Valid 282 282 282Missing 0 0 0户口所在地Frequency Percent ValidPercentCumulativePercentValid 中心城市200 70.9 70.9 70.9 边远郊区82 29.1 29.1 100.0 Total 282 100.0 100.0职业Frequency Percent ValidPercentCumulativePercentValid 国家机关24 8.5 8.5 8.5 商业服务业54 19.1 19.1 27.7 文教卫生18 6.4 6.4 34.0 公交建筑业15 5.3 5.3 39.4 经营性公司18 6.4 6.4 45.7 学校15 5.3 5.3 51.1 一般农户35 12.4 12.4 63.5 种粮棉专业户4 1.4 1.4 64.9种果菜专业户10 3.5 3.5 68.4 工商运专业户34 12.1 12.1 80.5 退役人员17 6.0 6.0 86.5 金融机构35 12.4 12.4 98.9 现役军人 3 1.1 1.1 100.0 Total 282 100.0 100.0年龄Frequency Percent ValidPercent Cumulative PercentValid 20岁以下 4 1.4 1.4 1.4 20~35岁146 51.8 51.8 53.2 35~50岁91 32.3 32.3 85.5 50岁以上41 14.5 14.5 100.0 Total 282 100.0 100.0分析:本次调查的有效样本为282份。
《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在地职业年龄N Valid 282 282 282Missing 0 0 0户口所在地Frequency Percent ValidPercentCumulativePercentValid 中心城市200 70.9 70.9 70.9 边远郊区82 29.1 29.1 100.0 Total 282 100.0 100.0职业Frequency Percent ValidPercentCumulativePercentValid 国家机关24 8.5 8.5 8.5 商业服务业54 19.1 19.1 27.7 文教卫生18 6.4 6.4 34.0 公交建筑业15 5.3 5.3 39.4 经营性公司18 6.4 6.4 45.7 学校15 5.3 5.3 51.1 一般农户35 12.4 12.4 63.5 种粮棉专业户4 1.4 1.4 64.9种果菜专业户10 3.5 3.5 68.4 工商运专业户34 12.1 12.1 80.5 退役人员17 6.0 6.0 86.5 金融机构35 12.4 12.4 98.9 现役军人 3 1.1 1.1 100.0 Total 282 100.0 100.0年龄Frequency Percent ValidPercent Cumulative PercentValid 20岁以下 4 1.4 1.4 1.4 20~35岁146 51.8 51.8 53.2 35~50岁91 32.3 32.3 85.5 50岁以上41 14.5 14.5 100.0 Total 282 100.0 100.0分析:本次调查的有效样本为282份。
spss数据统计分析(共42张PPT)
二 spss数据文件的建立和管理
键在于确定合适的分组数目。 三 绘制散点图的基本操作(教材235)
(b)是否将分析结果保存到磁盘上,扩展名
(1) 提出假设: HO :a1=a2=a3…=ak=0
最后整理数据中,成绩变量) ( 4 基本操作:data sort cases(最后整理数据)
少transform Automatic Recode (数据5中年龄)
据库(方向键使用)
⑥检查数据录入是否正确(是否存在非法值)
3.4 数据的编辑
①数据的定位:
人工定位(数据较少时使用)
(方法;拖动滚动钮或单击page up键或page down键) 自动定位(数据较多) a 按个案号码定位:
定位单元; Data---go to case; 输入要定位的个案号码。 b 按变量值定位:
职称 1 1 1 2 2 2 3 3 3 4 4 4
年龄段 1 2 3 1 2 3 1 2 3 1 1 1
人数 0 15 8 10 20 2 20 10 1 35 2 0
3.2 spss数据的结构和定义方法
①变量名(Name)
②变量类型(Type)、宽度(Width)、列宽度( Columns)
分析多个变量不同取值下的分布,掌握多变量的联合 分布特征,进行分析变量之间的相互影响和关系 (2)基本任务
根据收集到的样本数据,产生交叉列联表;在交叉 列联表的基础上,对两两变量间是否存在一定的相关 性进行分析。
职称
年龄段
35岁以下 36-49岁
50岁以上 Total
教授(1)
Count
0
%within职称 0
指定目标单元(单击鼠标右键,选择paste)
《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第5章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5 章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下:80, 81, 72, 60, 78, 65, 56, 79,77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss 数据→分析→比较均值→单样本t 检验→相关设置→输出结果(Analyze->compare means->one-samples T test ;)采用单样本T 检验(原假设H0:u=u0=75, 总体均值与检验值之间不存在显著差异);单个样本统计量N 均值标准差均值的标准误成绩11 73.73 9.551 2.880单个样本检验检验值= 75差分的95% 置信区间t df Sig.( 双侧) 均值差值下限上限成绩-.442 10 .668 -1.273 -7.69 5.14分析:指定检验值:在test 后的框中输入检验值(填75),最后ok!分析:N=11 人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean) 为2.87.t 统计量观测值为-4.22,t 统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14), 由此采用双尾检验比较 a 和p。
T 统计量观测值的双尾概率p-值(sig.(2-tailed) )为0.668>a=0.05 所以不能拒绝原假设;且总体均值的95% 的置信区间为(67.31,80.14), 所以均值在67.31~80.14 内,75 包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35 名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS 对上表数据进行描述统计,并绘制相关的图形。
第五章 spss的参数检验 人大薛薇版
第五单元spss的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->comparemeans->one-samples T test;)分析:分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
2、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。
然而心理学家则倾向于认为提出事实的方式是有关系的。
为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。
原假设:决策与提问方式无关,即u-u0=0步骤:生成spss数据→分析→比较均值→两独立样本t检验→相关设置→输出结果决策与提问方式有关。
由表5-4看出,独立样本在0.05的检验值为0,小于0.05,故拒绝原假设,认为决策者对事实所作出的反应与提问方式有关,心理学家的观点更站得住脚。
3、一种植物只开兰花和白花。
按照某权威建立的遗传模型,该植物杂交的后代有75%的几率开兰花,25%的几率开白花。
统计分析与SPSS的应用第五版课后练习答案第章
统计分析与S P S S的应用第五版课后练习答案第章Company number:【0089WT-8898YT-W8CCB-BUUT-202108】《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
薛薇SPSS统计分析方法及应用数据录入与数据获取48页PPT
61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿
薛薇SPSS统计分析方法及应用数据 录入与数据获取
1、战鼓一响,法律无声。——英国 2、任何法律的根本;不,不成文法本 身就是 讲道理 ……法 律,也 ----即 明示道 理。— —爱·科 克
3、法律是最保险的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克Fra bibliotek谢谢!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS中的参数检验方法
单样本t检验 两独立样本t检验 两配对样本t检验
单样本t检验
目的:对某个总体的均值与指定的检验值之间是 否存在显著差异进行检验
例:大学毕业生的月平均工资与3500元是否有显著差异
手段:利用单个样本的均值对总体均值进行检验 理论依据:样本均值的抽样分布 抽样分布:样本统计量的概率分布 结果来自容量相同的所有可能样本 提供了有关样本统计量的概率信息,是推断的 理论基础,是抽样推断科学性的重要依据
两配对样本t检验
基本步骤: D H0:差值样本的均值 u0=0. t S/ n 构造统计量:同单样本均值检验 如果差值的均值与0有显著差异,认为两总体均值 存在显著差异;否则,与0无显著差异,则认为两总 体均值不存在显著差异
两配对样本t检验
基本操作步骤
(1)菜单选项:分析->比较均值->配对样T检验
两独立样本t检验
理论依据:两独立样本均值差的抽样分布
理论依据:两独立样本均值差的抽样分布 两总体方差已知: ( X X ) ( )
Z
1 2 1 2
2 1
n1
2 2
~ N (0,1)
n2
两总体方差未知且相等:
2 2 ( X 1 X 2 ) ( 1 2 ) ( n 1 ) S ( n 1 ) S 1 2 2 t ~ t (n1 n2 2) S 2 1 p 1 1 n1 n2 2 Sp n1 n2
假设检验的基本原理
基本信念:利用小概率原理进行反证明。小概率 事件在一次实验中不可能发生。
例如:对大学男生平均身高进行推断 H0:平均身高为173 样本平均身高为178,由于存在抽样误差,不能直接拒 绝H0。而需要考虑:在H0成立的条件下,一次抽样得到 平均身高为178的可能性有多大。如果可能性较大,是 个大概率事件(与相比较),则认为H0正确。否则, 如果可能性较小,是个小概率事件,但确实发生了, 则只能认为H0不正确。 概率P值即为观测结果或更极端现象在零假设成立时出 现的概率
H0:两总体方差无显著差异.
方法:计算各观测与所属组均值之差的绝对值; 对绝对离差进行单因素方差分析.
两独立样本t检验
结论:
首先,如果F检验的P≤α,则拒绝F检验的H0,认为方 差不齐性;其次看方差不齐行的t检验概率.如果 ≤α,则拒绝t检验的H0,认为两总体均值有显著差 异;如果>α,则不拒绝t检验的H0.
首先,如果F检验的P >α,则不能拒绝F检验的H0,认 为方差齐性;其次看方差齐行的t检验概率.其余同 上
两独立样本t检验
基本操作步骤 (1)菜单选项:分析->比较均值->独立样本T检验 (2)选择若干变量作为检验变量到检验变量框 (3)选择代表不同总体的变量作为分组变量到分组变 量框 (4)定义分组变量的分组情况: 定义分组变量的分组标志值分别是什么 若分组变量为连续变量.输入一个数字,将大于 等于该值的分成一组,小于该值的分成另一组.
(2)选择一对或若干对配对变量作为检测变量到成 对变量框.
基本步骤: H0:u=u0,总体均值与检验值之间不存在显著差异 选择检验统计量 计算t统计量的观测值和概率P值 结论:P≤α,拒绝H0,认为总体均值与检验值之间 有显著差异.P>α,不能拒绝H0
•注意:SPSS给出的 双侧检验的概率P值
单样本t检验
基本操作步骤
(1)菜单选项:分析->比较均值->单样本T检验 (2)指定检验值: 在检验值框中输入原假设值
两总体方差未知且相等:
t ( X 1 X 2 ) ( 1 2 ) S S n1 n2
2 1 2 2
~ t( f )
2 S12 S 2 ( )2 n1 n2 f 2 S12 2 S2 ( ) ( )2 n1 n 2 n1 1 n2 1
基本步骤: H0:u1-u2=0,两总体均值不存在显著差异 选择检验统计量 计算t统计量的观测值和概率P值 SPSS给出方差齐性和异方差下的两个检验结果 首先判断方差是否齐性;然后对t检验做决策 SPSS方差齐性F检验:Levene F检验
单样本t检验
SPSS中的选项
置信区间:指定输出-0的置信区间.默认值为 95%. 缺失值的处理策略 当涉及缺失值变量的计算时剔除包含缺失值 的样本
剔除所有含缺失值的个案后再计算
两独立样本t检验
目的:对两总体的均值是否有显著差异进行推断 例:男女生的月平均工资是否存在显著差异 手段:利用两个独立样本的均值差对两总体的均值 差进行检验 独立样本:抽取一个样本对抽取另一个没有影响 理论依据:两独立样本均值差的抽样分布
第五章
SPSS的参数检验
主要内容
单个总体的均值检验 两个总体的均值比较 利用两个独立样本 利用两个配对样本
统计学的范畴:推论统计 根据样本数据推断总体的分布或均值方差等总体 统计参数 方法: 参数检验 非参数检验
统计方法
描述统计 推断统计
参数估计 假设检验
假设检验概述
假设检验是一种根据样本数据推断总体的分布或 均值、方差等总体统计参数的方法。 根据样本来推断总体的原因: 总体数据不可能全部收集到。如:质量检测问 题 收集到总体全部数据要耗费大量的人力和财力 假设检验包括: 参数检验 非参数检验
假设检验的基本步骤
提出基本假设H0 构造服从某种理论分布的检验统计量 利用样本数据和基本假设计算检验统计量的观测 值,并得到概率P值(检验统计量在特定极端区域 取值在H0成立时的概率) 如果概率P值小于用户给定的显著性水平a,则拒 绝H0;否则,不拒绝H0
•当总体服从正态分布 N~(μ,σ2) 时,来自该总体的所 有容量为 n 的样本的均值 X也服从正态分布 , X的 数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n) •设从均值为,方差为 2的一个任意总体中抽取容 量为n的样本,当n充分大时,样本均值的抽样分布 近似服从均值为μ、方差为σ2/n的正态分布
两配对样本t检验
目的:对两总体的均值是否有显著差异进行推断 例:研究某减肥产品的减肥效果,对比减肥前与 减肥后的体重总体 手段:利用两配对样本的均值差对两总体的均值差 进行检验 配对样本:抽取一个样本对抽取另一个有影响
理论依据:均值差的抽样分布实质:先求出每对测量值的差值;然后检验差值 样本的均值是否与0有显著差异.