统计学分布及假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(检验统计量)

总体 是否已知 ?

小 样本容量 n
用样本标 准差S代替

z 检验
z 检验
t 检验
Z
X 0

n
Z
X 0 S n
t
X 0 S n
总体均值的检验
(2 已知或2未知大样本)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布, 可用正态分布来近似 (n30)
2. 原假设为真时,拒绝原假设的概率
– 被称为抽样分布的拒绝域
3. 表示为 (alpha)
– 常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
作出统计决策
1. 计算检验的统计量 2. 根据给定的显著性水平,查表得出相应 的临界值z或z/2, t或t/2 3. 将检验统计量的值与 水平的临界值进 行比较 4. 得出拒绝或不拒绝原假设的结论
正态分布的应用与背景
正态分布是最常见最重要的一种分布,例如
测量误差; 人的生理特征尺寸如身高、体重等 ;
正常情况下生产的产品尺寸:直径、长度、重量
高度等都近似服从正态分布.

2
分布
定义: 设 X 1 , X 2 ,, X n 相互独立,都服从正 态分布N(0,1), 则称随机变量:
所服从的分布为自由度为 n 的 2 分布. 记为
结论:
不能认为该厂生产的元件寿命 显著地高于1200小时
0
1.645
Z
总体均值的检验
(2未知小样本)
1. 假定条件
– 总体为正态分布 2未知,且小样本
2. 使用t 统计量
wk.baidu.comt
X 0 S n
~ t (n 1)
2 未知小样本均值的检验
(例题分析)
【例】某鱼塘水中的含氧量多年 平均为4.5mg/L。现在该鱼塘设 10个点采集水样,测定水中含氧 量分别为: 4.33,4.62,3.89,4.14,4.78,4.64,4.5 2,4.55,4.48,4.26(mg/L)。试检验 该次抽样测定的水中含氧量与多 年平均值有无显著差别? 双侧检验
X1 X 2 X n
2 2 2
2
~ (n)
2 2
的密度函数为 一般 自由度为 n x n 1 1 2 2 e x , x0 n2 n n=2 f ( x ) 2 ( 2 ) n=3 n=5 n = 10 0, x 0 其中, x 1 t ( x) 0 t e dt
2 已知均值的检验
(例题分析)
•H0: = 300g •H1: 300g = 0.05 •n = 9 检验统计量: x 0 308 300 z 2.526 n 9.5 9 决策:
在 = 0.05的水平上拒绝H0
•临界值(s):
拒绝 H0
.025
拒绝 H0
提出原假设和备择假设
什么是原假设?(null hypothesis) 0 1. 待检验的假设,又称“0假设” 为什么叫 假设? 2. 研究者想收集证据予以反对的假设 3. 表示为 H0
– – –
H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克)
提出原假设和备择假设
n1 1 n1 n 2 n1 / 2 2 )( n1 / n2 ) y ( 2 , h( y ) n1 n2 n1 ( n1 n2 ) / 2 ( ) ( )( 1 y ) 2 2 n2 0, y0
y0
第 1章 假设检验
§1.1 假设检验的基本问题 §1.2 一个正态总体参数的检验
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑
– 是大样本还是小样本 – 总体方差已知还是未知
3. 检验统计量的基本形式为 X 0 Z n
规定显著性水平
(significant level) 什么显著性水平? 1. 是一个概率值
正态分布
定义 设连续型随机变量 X 的概率密度为
1 2σ 2 p( x ) e , x , 2 πσ 其 中 μ , σ ( σ 0) 为 常 数 ,则 称X 服 从 参 数 为 μ, σ ( x μ )2
的 正 态 分 布 或 高 斯 分, 布 记 为 X ~ N ( μ, σ 2 ).
总体比例的检验
(Z 检验)
一个总体比例检验
1. 假定条件
– 有两类结果 – 总体服从二项分布 – 可用正态分布来近似
2. 比例检验的 Z 统计量
Z p p0 ~ N (0,1) p 0 (1 p0 ) p0为假设的总体比例 n
一个总体比例的检验
(例题分析)
【例】有一批蔬菜种子 的平均发芽率p0=0.85。 现随机抽取500粒种子, 用种衣剂进行浸种处理, 结果445粒发芽。试检验 种衣剂对种子发芽有无 效果?
H0: 1500
H1: 1500
双侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 /2 置信水平
拒绝域 1- /2
临界值
H0值
临界值
样本统计量
左侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 置信水平

1-
临界值
H0值
样本统计量
观察到的样本统计量
右侧检验
(显著性水平与拒绝域)
抽样分布
双侧检验
一个总体比例的检验
(例题分析)
•H0: p= 0.85 •H1: p 0.85 = 0.05 •n = 500 •临界值(s):
拒绝 H0
.025
检验统计量:
z 0.89 0.85 2.50 0.85 (1 0.85) 500
拒绝 H0
.025
决策:
在 = 0.05的水平上拒绝H0
结论:
-1.96
0
1.96
Z
种衣剂对种子发芽率有显著提高 的效果(0.89>0.85)
方差的卡方 (2) 检验
1. 检验一个总体的方差或标准差 2. 假设总体近似服从正态分布 3. 检验统计量
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 对实际问题作假设检验
§1.1 假设检验的基本问题
基本概念 根据样本的信息检验关于总体的某个命题 是否正确. 这类问题称作假设检验问题 .
有参数假设检验和非参数假设检验
假设检验的步骤

提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策
2 未知小样本均值的检验
(例题分析)
•H0: = 4.5 •H1: 4.5 = 0.05 •df = 10 - 1 = 9 •临界值(s):
拒绝 H0
.025
检验统计量:
x 0 4.421 4.5 t -0.940 s n 0.267 10
决策:
在 = 0.05的水平上接受H0
置信水平 拒绝域 1-

H0值
观察到的样本统计量
临界值
样本统计量
§1.2 一个正态总体参数的检验
1. 总体均值的检验 2. 总体比例的检验 3. 总体方差的检验
一个总体参数的检验
一个总体
均值
比例
方差
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
总体均值的检验
2. 使用Z-统计量


2
2
已知: Z
未知: Z
X 0

X 0 S n
n
~ N (0,1) ~ N (0,1)
2 已知均值的检验
(例题分析)
【例】已知某种玉米平均穗重u0=300g,标准差 =9.5g。喷施某种植物生长调节剂后,随机抽取9个果 穗,重量分别308,305,311,298,315,300,321,294,320 (g)。问这种调节剂对果穗重量是否有影响?(= 0.05)
.025
结论:
认为喷施调节剂能够显著增加 玉米果穗的重量
-1.96
0
1.96
Z
2 未知大样本均值的检验
(例题分析)
【例】某电子元件批量生产的 质量标准为平均使用寿命1200 小时。某厂宣称他们采用一种 新工艺生产的元件质量大大超 过规定标准。为了进行验证, 随机抽取了 100 件作为样本, 测得平均使用寿命1245小时, 标准差 300 小时。能否说该厂 生产的电子元件质量显著地高 于规定标准? (=0.05)
0.4 0.3 0.2 0.1 5 10
2 的 (n)
n = 15
20 25
15
在x > 0时收敛,称为函数
t 分布 (Student 分布) 2 定义 设 X ~ N (0,1) , Y ~ (n), X ,Y相互独立,
T X Y n
t ~ t ( n) 则称 T 服从自由度为 n 的t 分布.记为 其密度函数为
.025
拒绝 H0
结论:
认为该次抽样测定的含氧量 与多年平均含氧量没有显著 差别。
-2.262
0
2.262
t
在R软件中,函数t.test()提供了t检验的功能,使用 格式如下: t.test(x,y=NULL,alternative=c("two.sided","less","gr eater"),mu=0,paired=FALSE,var.equal=FALSE,c onf.level=1-α) 其中x,y是由数据构成的向量(如果只提供x,则作单个 正态总体的均值检验,否则作两个总体的均值检 验);alternative表示备择假设,less表示单边检 验(H1:u<u0);mu表示原假设u0;var.equal=FALSE 表示认为两总体方差不同,conf.level是置信水平, 通常是0.95,即 α=0.05
-3
0.2 0.1
n= 1
n=20
-2
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
F 分布
定义 若X~2(n1),Y~2(n2) ,X,Y相互独立, 则称随机变量
X n1 F Y n2
~ F (n1 , n2 )
为第一自由度为n1 ,第二自由度为n2的F分布 (或自由度为(n1 , n2 )),其概率密度为
双侧检验与单侧检验
(假设的形式)
研究的问题
假设 双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
0 < 0
0 > 0
单侧检验
(原假设与备择假设的确定)
1. 将研究者想收集证据予以支持的假设作为备择 假设H1
例如,一个研究者总是想证明自己的研究结论是正 确的 一个销售商总是想证明供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致
二项分布
• 共同特征(抛硬币) 1.每次试验只有两个结果. 2.试验具有重复性和独立性. 以x表示在n次试验中事件A出现的次数,x是 一个离散型随机变量,它的所有取值为 0,1,2,…,n,其概率分布函数为 (q=1-p) P( x) Cnx p x qn x 称P(x)为随机变量x的二项分布,记作B(n,p)
单侧检验
2 未知大样本均值的检验
(例题分析)
•H0: 1200 •H1: >1200 = 0.05 •n = 100 •临界值(s):
拒绝域 0.05
检验统计量:
x 0 1245 1200 z 1.5 S n 300 100
决策:
在 = 0.05的水平上不拒绝H0
什么是备择假设?(alternative hypothesis) 1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设总是有不 等号: , 或 3. 表示为 H1
– –
H1: <某一数值,或 某一数值 例如, H1: < 3910(克),或 3910(克)
n 1 n 1 Γ 2 2 2 t f (t ) 1 n n n Γ 2 t
t 分布的性质
0.4 0.3
t2 2
1°f n(t)是偶函数,
1 n , f n (t ) (t ) e 2
2. 将研究者想收集证据证明其不正确的假设作为 原假设H0 3. 先确立备择假设H1
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到 1500 小 时以上。检验这一结论是否成立
– 研究者总是想证明自己的研究结论(寿命延 长)是正确的
– 备择假设的方向为“>”(寿命延长) – 建立的原假设与备择假设应为
相关文档
最新文档