第九章心理统计学假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总体均值的检验
1.
(大样本)
假定条件
正态总体或非正态总体大样本(n30)
2. 使用z检验统计量

2 已知:
z

x 0
~
N (0,1)
n
2 未知:z x 0 ~ N (0,1)
sn
总体均值的检验( 2 已知)
【例】一种罐装饮料采用自动
生产线生产,每罐的容量是
H0 : 500 H1 : < 500
500g
提出假设
【例】一家研究机构估计,某城市中家庭拥有 汽车的比例超过30%。为验证这一估计是否正确, 该研究机构随机抽取了一个样本进行检验。试 陈述用于检验的原假设与备择假设
解:研究者想收集证据予以支持的假设是“该 城市中家庭拥有汽车的比例超过30%”。建立的 原假设和备择假设为
双侧检验
255ml,标准差为5ml。为检验
每罐容量是否符合要求,质检
人员在某天生产的饮料中随机
抽取了40罐进行检验,测得每
罐平均容量为255.8ml。取显著
性水平=0.05 ,检验该天生产
绿色 绿色
健康饮品
的饮料容量是否符合标准要求? 健康饮品 255
255
总体均值的检验( 2 已知)
H0 :0 = 1 =255 H1 : 0 1 = 0.05
心理统计学
南昌大学教育学院心理 李力
第 九 章 假设检验
假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
学习目标
1. 假设检验的基本思想和原理 2. 假设检验的步骤 3. 一个总体参数的检验 4. 两个总体参数的检验 5. P值的计算与应用
显著性水平
(significant level) 1. 是一个概率值
2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域
3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
思考题:
绘图解释说明在样本容量和 显著水平都不变的条件下,
混在一起,难以分辨,因此只有引进假设检验才能去推断。
思想方法:是一种有概率值保证的反证法。
从原假设出发,采用统计量,放入抽样统计量分布去考察,如发生 小概率事件,则推翻原假设。
统计假设与数学反证法的区别:
——假设检验的结果只是小概率事件说假设有问题,数学结果百分 百一定是荒谬的;
——统计假设有两种可能结果,推翻或支持原假设;数学结果一定 是荒谬的,推翻原假设;
H0 : 10cm H1 : 10cm
提出假设
【例】某品牌洗涤剂在它的产品说明书中声称: 平均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
解:研究者抽检的意图是倾向于 证实这种洗涤剂的平均净含量并 不符合说明书中的陈述 。建立的 原假设和备择假设为
假设检验中的小概率原理
什么小概率?
1. 小概率事件在一次试验中,不可能发 生的事件发生;
2. 在一次试验中小概率事件一旦发生, 我们就有理由拒绝原假设
3. 小概率由研究者事先确定,
为显著性水平

什么是小 概率?
假设检验的原因和思想方法
原因:
(1)要研究总体却无总体数据 (2)用样本去研究总体存在误差,该抽样误差与真正的误差(系统)
20
= 50
H0
样本均值
总体


假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
抽取随机样本
均x =值20
原假设与备择假设
原假设
(null hypothesis)
1. 研究者想收集证据予以反对的假设
2. 又称“0假设”
3. 总是有符号 , 或
4.
表示为 H0
H0 : = 某一数值
指定为符号 =, 或
例如, H0 : 10cm
备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
H1 : <某一数值,或 某一数值 例如, H1 : < 10cm,或 10cm
降低? (=0.01)
左侧检验
备择假设的方向为“>”,称为右侧检 验
双侧检验与单侧检验
(假设的形式)
假设
单侧检验 双侧检验
左侧检验 右侧检验
原假设 H0 : = 0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : < 0 H1 : > 0
两类错误与显著性水平
假设检验中的两类错误
(大样本) (小样本) (小样本)
z 检验
F 检验
总体均值的检验
总体均值的检验
(作出判断)

样本容量n



是否已


是否已


z 检验
z x 0 n
z 检验
z x 0 sn
z 检验
z x 0 n
t 检验
t x 0 sn
总体均值的检验
(大样本)
利用 P 值 进行决策
什么是P 值?
(P-value)
1. 在原假设为真的条件下,检验统计量的观察 值大于或等于其计算值的概率
双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一 致的程度
3. 被称为观察到的(或实测的)显著性水平
4. 决策规则:若p值<, 拒绝 H0
显著性水平和拒绝域
(双侧检验 )
抽样分布
置信水平
拒绝H0
拒绝H0
/2
1-
/2
0 临界值
样本统计量 临界值
显著性水平和拒绝域
(双侧检验 )
抽样分布
置信水平
拒绝H0
/2
1-
拒绝H0
/2
0 临界值
样本统计量 临界值
显著性水平和拒绝域
(双侧检验 )
抽样分布
置信水平
拒绝H0
/2
1-
(单双)总体均值的检验 (单双)总体比例的检验 (单双)总体方差的检验 (单双)总体相关系数的检验
一个总体参数的检验
一个总体
均值
比例
方差
z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
z 检验
(单尾和双尾)
2 检验
(单尾和双尾)
两个总体参数的检验
两个总体参数的检验
均值
独立样本 配对样本
比例
方差
z 检验 t 检验 t 检验
单侧检验犯 错误的概率比
双侧检验要小。
统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量
2. 对样本估计量的标准化结果
原假设H0为真
点估计量的抽样分布
3. 标准化的检验统计量
标准化检验统计量

点估计量 — 假设值 点估计量的抽样标准差

H0 : 30% H1 : 30%
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设 必有一个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
双侧检验的P 值
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值 0
临界值
Z
计算出的样本统计量
计算出的样本统计量
左侧检验的P 值
抽样分布
置信水平
拒绝H0

P值
1-
临界值
0
计算出的样本统计量
样本统计量
右侧检验的P 值
抽样分布
置信水平
1-
拒绝H0

P值
0 临界值
计算出的样本统计量
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
抽样分布
(右侧检验 )
置信水平
1-
拒绝H0

0 观察到的样本统计量
样本统计量 临界值
决策规则
1. 给定显著性水平,查表得出相应的临界
值z或z/2, t或t/2
2. 将检验统计量的值与 水平的临界值进
行比较 3. 作出决策
双侧检验:统计量 > 临界值,拒绝H0 左侧检验:统计量 < 临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
1. 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设
第Ⅰ类错误的概率记为
被称为显著性水平

2. 第Ⅱ类错误(取伪错误)

原假设为假时未拒绝原假设
第Ⅱ类错误的概率记为
(Beta)
假设检验中的两类错误
(决策结果)
H : 无罪 假设检验就好像一场审判过程 0
统计检验过程
陪审团审判
提出假设
【例】一种零件的生产标准是直径应为10cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于10cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
解:研究者想收集证据予以证明的 假设应该是“生产过程不正常”。 建立的原假设和备择假设为
双侧检验与单侧检验
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验 或单尾检验(one-tailed test)
备择假设的方向为“<”,称为左侧检 验
假设检验步骤
1. 建立原假设和备择假设 2. 从所研究的总体中抽出一个随机样本 3. 确定一个适当的检验统计量,并利用样本数据
算出其具体数值
4. 确定一个适当的显著性水平,并计算出其临界 值,指定拒绝域
5. 将统计量的值与临界值进行比较,作出决策 统 拒绝计H量0的值落在拒绝域,拒绝H0,否则不 也可以直接利用P值作出决策
总体均值的检验( 2 未知)
【例】一种机床加工的零件尺
寸绝对平均误差允许值为
1.35mm。生产厂家现采用一种
新的机床进行加工以期进一步
降低误差。为检验新机床加工
的零件平均误差与旧机床相比
是否有显著降低,从某天生产
的零件中随机抽取50个进行检
验。利用这些样本数据,检验
新机床加工的零件尺寸的平均
误差与旧机床相比是否有显著
假设检验的基本问题
假设的陈述 两类错误与显著性水平 统计量与拒绝域 利用P值进行决策
什么是假设?
(hypothesis)
对总体参数的具体 数值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体 均值、比例、方差 等
分析之前必需陈述
什么是假设检验?
(hypothesis test)

影响 错误的因素
1. 总体参数的真值 随着假设的总体参数的减少而增大
2. 显著性水平 当 减少时增大 +1
3. 总体标准差 当 增大时增大
4. 样本容量 n
当 n 增大 、 减少
5、真伪值的距离。 距离越短 越大,犯Ⅱ类错误越大
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程
2. 有参数检验和非参数检验
3. 逻辑上运用反证法,统计上依据小概率 原理
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
... 因此我们拒
绝假设 = 50
... 如果这是总 体的真实均值
n = 40
临界值:Z /21.96
拒绝 H0
拒绝 H0
0.025
0.025
-1.96 0 1.96 z
检验统计量:
z x 0 255.8 255 1.01 n 5 40
决策:
|Z|=1.01<1.96,即接受原假设H0
结论:
样本提供的证据表明:该天生 产的饮料符合标准要求
拒绝H0
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
置信水平
拒绝H0
/2
1-
拒绝H0
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(单侧检验 )
抽样分布
置信水平
拒绝H0

1-
临界值
0
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0

1-
H0 检验
裁决 无罪 有罪
实际情况
无罪
有罪
正确
错误
错误
正确
决策
实际情况 H0为真 H0为假
未拒绝H0
正确决策
(1 – )
第Ⅱ类错
误( )
wk.baidu.com拒绝H0
第Ⅰ类错 正确决策
误( ) (1- )
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小

你不能同时减 少两类错误!
相关文档
最新文档