第四章假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x 0 s n
z z / 2
z z
z z
P值决策
P 拒绝H0
总体方差的检验
(检验方法的总结)
假设 假设形式 统计量
2 2 2 (n 1)
双侧检验
左侧检验
右侧检验
H0 : 2= 02 H0 : 2 02 H0 : 2 02 H1 : 2 02 H1 : 2< 02 H1 : 2> 02
第四章 参数检验
学习目标:
1、明确SPss提供了哪几种参数检验的方法 2、掌握Spss单样本t检验 3、掌握Spss两独立样本的t检验,理解t检 验和F检验的不同
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设 第Ⅰ类错误的概率记为 被称为显著性水平 2. 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设 第 Ⅱ 类 错 误 的 概 率 记 为 (Beta)
习题2
某电脑公司2005年前4个月每天的销售量数据: 台)
234 143 187 161 159 198 160 152 187 141 214 149 155 167 168 211 172 194 173 196 183 225 178 234 182 177 184 185 177 189 209 189 163 196 176 196 158 203 188 206
《2012年中秋节国庆节假日旅游统 计报告》游客人均花费支出495元。 学生的考试成绩服从正态分布.现在 从某次《概率论与数理统计》课程 的考试中随机抽取36位学生的考试 试卷,计算得到平均成绩为65分, 标准差为15分.问在显著性水平 α=0.05下,是否可以认为这次考试 全体考生的平均成绩为70分?
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你不能同时减 少两类错误!
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0
/2
1-
/2
0 临界值
临界值
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
拒绝H0
1-
0 临界值 观察到的样本统计量
样本统计量
假设检验的五个基本步骤
例如:比尔为什么开始系安全带了? ——直觉假设检验
1、开始陈述你相信存在于总体的事实,即总体均值和百分率。
(如比尔相信只有10%的司机系安全带。)
t
x 0 s n
总体均值的检验
(大样本检验方法的总结)
假设 假设形式 双侧检验 左侧检验 右侧检验
H0 : =0 H1 : 0
已知:
统计量
H0 : 0 H0 : 0 H1 : <0 H1 : >0 x 0 z n
未知:
拒绝域
z
单个样本的t检验的结果
两个总体参数的检验
两个总体参数的检验 均值
独立样本 配对样本
比例
方差
z 检验
(大样本)
t 检验
(小样本)
t 检验
(小样本)
ห้องสมุดไป่ตู้
z 检验
F 检验
两独立样本的T检验
目的: 两独立样本的T检验是用来自两个总 体的独立样本,推断两个总体的均值是 否存在显著差异。 前提: 1、样本来自的总体应该服从或者近 似服从正态分布; 2、两样本相互独立
独立样本t检验的步骤
1、提出假设 2、选择检验统计量 3、计算统计量观测值和概率值 4、给出显著性水平,并作出决策 第一步,利用F检验判断两总体的方差是 否相等 第二步,利用t检验判断两总体均值是否 存在显著差异
分析——比较均值——独立样本的T检验 选择检验变量到检验变量框中 选择总体标识变量到分组变量框中
54 53 43
53
52 46 47
44
48 57 46
47
46 49 48
51
54 55
59
47 53
45
48 57
45
44 49
46
57 56
52
47 56
55
53 57
47
58 53
49
52 41
50
48 48
要求:
(1)构建数据的频数分布表 (2)绘制频数分布的直方图 (3)这品产品是合格品吗?
例二
尽管存在争议,但是大多数科学家认为,食 用含高纤维的谷类食物有助于降低癌症发生 的可能性,然而一个科学家提出,如果人们 在早餐中食用高纤维的谷类食物,与没有食 用的人相比,食用者在午餐中摄取的热量将 会减少。为了验证这个假设,随机抽取了35 人,询问他们早餐和午餐的通常食谱,并将 其分为两类:经常食用谷类者,非经常食用 谷类者
153
179 144 179 188 172 181 182
186
186 178 187 237 187 205 188
190
175 191 173 194 189 195 195
160
197 197 174 198 200 201 202
171
208 192 210 168 211 172 213
2、抽取一个随机样本,然后测定样本统计量。 (比尔发现他的朋友中有80%的人系安全带。) 3、将统计量与假设的参数进行比较。 (比尔注意到80%和10%有很大区别。) 4、决定样本是否支持最初的假设。
(观察到80%的司机系安全带的事实并不支持只有10%的人系安全带的假设。)
5、如果样本不支持假设,修正假设使得他与样本统计量一致。 (驾驶员系安全带的事实事件发生率约为80%。)
n
0为假设的总体比例
例题1
某公司经理宣称他的雇员的英语水平 很高,如果按照英语6级考试的话, 一般评价得分为75分,现在从雇员中 随机选出11人参加考试,得分如下, 80 81 72 60 78 65 56 79 77 87 76 请问,该经理的宣称是否正确?
单个样本的t检验
目的:是利用来自总体样本的数据,推 断该总体的均值是否与指定的检验值之 间存在显著的差异。 操作过程: 分析——比较均值——单个样本的T检验 选择检验变量到检验变量框(学生成绩) ,在检验值框中输入75,
一个总体参数的检验
一个总体
均值
比例
方差
z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
z 检验
(单尾和双尾)
2检验
(单尾和双尾)
总体均值的检验
大 小
样本容量n
是
是否已 知
否
是
是否已 知
否
z 检验
x 0 z n
z 检验
z 检验
z
x 0 s n
z
x 0 n
t 检验
方式2:甲组有12只喂饲料1,乙组有9只饲料 2,所测得的钙留存量数据如下:
29.7 26.7 28.9 31.1 26.8 26.3 39.5 30.9 33.4 33.1 28.6
甲组饲料
乙组饲料
28.7
28.3
29.3
31.1
30
36.2
36.8
30
请选用恰当方法对上述两种方式所获得的数据进行分 析,研究不同饲料是否使幼鼠体内的钙留存量有显著 不同。
1、对数据进行分组 2、制作频数分布表
习题3
给幼鼠喂不同的饲料,用以下两种方法设 计实验: 方式一:同一鼠喂不同的饲料所测得的体 内钙留存数据如下:
鼠号 饲料1 饲料2 1 33.1 36.7 2 33.1 28.8 3 26.8 35.1 4 36.3 35.2 5 39.5 43.8 6 30.9 25.7 7 33.4 36.5 8 31.5 37.9 9 28.6 28.7
46 0
50 0
490
440
480
540
600
500
590
640
430
580
510
620
320 470
590 620
分析—比较均值—配对样本的t检验 选择一对或者若干对检验变量到配对框 中
习题1
1、一种袋装食品用生产线自动装填,每袋重量 大约为50g,但由于某些原因,每袋重量不恰好是 50g。随机抽取100袋食品,测得的重量数据如 下:
57 51 53 46 60 51 49 52 48 54 54 53 55 51 50 58 55 52 49 60 40 61 56 45 51 47 57 49 47 53
52
50 49 49
51
52 52 44
46
53 59 57
48
47 53 52
47
45 50 42
53
48 43 49
47
假设检验中的两类错误
(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判 实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 未拒绝H0 拒绝H0 决策
H0 检验 实际情况
H0为真
H0为假
正确决策 第Ⅱ类错 误() (1 – ) 第Ⅰ类错 正确决策 误() (1-)
定义组变量
配对样本的t检验
利用来自两个总体的配对样本,推断两 个总体的均值是否存在差异。 配对样本通常具有两个特征:第一,两 组样本的样本量相同;第二,两组样本 的观察值的先后顺序一一对应,不能随 便更改。
例
三
以下是对促销人员进行培训前后的促销数据:
580
550
培训前 440 50 0
培训后 620 52 0
传统的观念被颠覆了吗?
雪儿.海蒂在1987年出版的《女性与爱情:前进中的文化 之旅》一书中,给出了大量的数据: 84%的女性“在情感上对两性关系不满意” 70%的女性“在结婚5年或者更久后发生了婚外性关系” 95的女性“在恋爱时会因为男友会出现情感及心理上的 烦恼 84%的女性“在与男友的恋爱中有屈尊感 海蒂的数据真的颠覆了人们的传统观念吗?
总体1 总体2
568 539 650 617 651
681 529 569 624 569
636 562 622 563 709
607 589 630 580 632
555 646 596 711
496 596 637 480
540 617 628 688 584 706 723
试以a=0.05的显著性水平进行检验
2
2
(n 1) s 2
2 0
2 1 2
拒绝域 P值决策
2
2 1 2
(n 1)
(n 1)
2 2 2 (n 1)
P 拒绝H0
总体比例检验
1.
假定条件
总体服从二项分布 可用正态分布来近似(大样本)
2.
检验的 z 统计量 p 0 z ~ N (0,1) 0 (1 0 )
150
228 153 166 154 174 156 203
161
162 163 196 164 226 165 165
178
223 218 179 215 180 175 196
168
170 180 171 233 172 210 172
174
165 175 233 175 190 207 176