第五章 统计推断-1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:
H0:μ=μ0 已知这批动物实际饲养的时间比根据以往 经验所需饲养的时间长的多,因此,μ不可 能小于μ0 (10.00g) H1:μ>μ0 ,为单侧检验
取α=0.05,查表得临界值uα=u0.05=1.645
拒绝域:u>1.645
根据样本计算统计量
x 0 10.23 10.00 u 1.82 / n 0.4 / 10
t检验-2 (t-test for pooled data) 成组设计的两样本均数比较
前提条件:从σi 未知的两个正态或近似 正态总体中,独立地抽取含量分别为n1 和n2的样本
H0:μ1=μ2 H1: 1 2 ,若已知μ1不可能小于μ2 or: 1 2 ,若已知μ1不可能大于μ2 or: 1 2 ,包括μ1>μ2和μ1<μ2
比较:u=0.57<μα ,落入拒绝域外,应在 0.05的显著性水平下接受H0 结论:第一号渔场的马面鲀体长并不显著 高于第二号渔场的
四、t检验(t-test)-1 在σ未知的情况下,单样本均数检验
前提条件:从σ未知的正态或近似正态总 体中,随机抽取含量为n的样本 H0:μ=μ0
H1:
or:
( x x
1
称为平均数差数的标准误差 2)
U检验应用举例2
问题:调查两个不同渔场的马面鲀体长, 每一渔场调查20条。
平均体长分别为 x1 19.8cm, x 2 18.5cm
已知
1 2 7.2cm
问在α=0.05水平上,第一号渔场的马面 鲀体长是否显著高于第二号渔场的马面鲀 体长?
0 ,若已知μ不可能小于μ0
0 ,若已知μ不可能大于μ0
or:
0 ,包括μ>μ0和μ<μ0
检验统计量:
x 0 t n 1 s/ n 显著性水平:
α=0.05 或α=0.01
确定各种备择假设所对应的拒绝域:
t t
或
t t
或
t t / 2
临界值Critical value:
接受域/拒绝域的端点
单侧检验 One-sided test
拒绝域分布在检验统计量概率密度曲线某 一侧的假设检验类型 上尾检验 Upper tailed test:右侧拒绝域
下尾检验 Lower tailed test:左侧拒绝域
双侧检验 two-sided test
确定各种备择假设所对应的H0的拒绝域:
u u 或
u u
或
u u / 2
临界值可由正态分布表查出
比较u的计算值与临界值的相对大小,确定其是
否落入拒绝域内,得出统计推断结论
针对具体问题,给出与之相对应的明确说明
U检验应用举例1
问题:用实验动物做实验材料,要求动物平均 体重μ= 10.00g。若μ<10.00g则需再饲养,若 μ>10.00g 则应淘汰。动物体重是服从正态分布 N(μ, σ2)的随机变量。已知总体标准差σ =0.40g, 但总体均数是未知的。为了得出对总体均数的 推断,从动物群体中随机抽出含量n=10的样本, 并计算出该样本均数 =10.23g。试根据这个 x 样本的测定结果推断这批动物的体重是否合乎 实验要求?
为了同时降低α和β ,就需增加样本含量。当样本 含量增加后,样本标准误差变小,这时曲线变 “瘦”,其结果是犯两种错误的概率都变小。
二、显著性检验的基本程序
根据具体问题建立假设
原假设H0的提出可根据: 以往的经验或者某些实验结果 依据某种理论或某种模型 依据事先所作的某种规定 备择假设H1的来源: 除原假设以外的可能取值 担心或希望出现的值 有重要经济意义或其他意义的值
解:
马面鲀体长是服从正态分布的随机变量, 两样本是独立获得的 H0: μ1=μ2
H1: μ1>μ2
α=0.05,临界值uα=u0.05=1.645
拒绝域:u>1.645
统计量的值:
u
x1 x 2
2 1 2 2
/ n1 / n2
x1 x 2 19.8 18.5 0.57 2 / n 7.2 2 / 20
H1: 0 ,若已知μ不可能小于μ0 or: 0 ,若已知μ不可能大于μ0 or:
0
,包括μ>μ0和μ<μ0
检验统计量:
x 0 u / n
显著性水平:
习惯上,规定在α=0.05水平上拒绝H0,称为
“差异显著”;
在α=0.01水平上拒绝H0,称为“差异极显著”
检验统计量:
t f t n1 n2 2
x1 x 2 fs f s 1 1 ( ) f1 f 2 n1 n2
2 1 1 2 2 2
x1 x 2 2 s s (1 / n1 1 / n2 )
x1 x 2
n1n2 n1 n2
其中, s
称为两样本的并合标准方差
d
为样本中各对差
值的均数,sd为样本差值的标准差
统计推断的内容
统计推断所涉及的内容非常广泛,包括
总体分布特征的估计
特定类型的统计推断方法
方差分析
回归分析
§5.2 假设检验
一、基本原理和有关概念
假设
零假设(原假设)H0:在总体未知的情况下,为 了得到对总体特征的推断,对总体特征所作的假 设。是针对实验考察的内容提出来的
备择假设H1:与H0相对立的假设,是在拒绝原假 设的情况下可供选择的假设。 H1的提出需视情况 而定
解:
H0: μ1=μ2 H1:
1 2
双侧检验
α=0.05,临界值tα=t0.05,17=2.110
拒绝域:t>2.110
或 t<-2.110
计算统计量
n1=12,n2=7
x1 120, x 2 101
x1 x 2
2 f1s12 f 2 s2 1 1 ( ) f1 f 2 n1 n2
确定统计检验的显著性水平 确定应该使用的检验方法,选择合适的检验 统计量,并根据样本值计算统计量值 确定临界值,给出建立在α水平上H0的拒绝 域 比较统计量的计算值和临界值的相对大小, 进行统计判断,并对 单样本均数检验
前提条件:从σ已知的正态或近似正态总 体中,随机抽取含量为n的样本 H0:μ=μ0
II型错误 Type II error 受伪错误
在H0实际并不成立的情况下,由于抽样 的随机性,仍可能有一部分由样本计算的 检验统计量值落入接受域内。一旦抽到这 样的样本,根据小概率原理,仍将接受H0, 但这样的接受是错误的
II型错误的发生概率为β
在总体特征和样本大小均固定的情况下,降低α 则必然增加β ,反之亦然。
拒绝域同时涵盖检验统计量概率密度曲线 两侧的假设检验类型
统计判断所犯的两类错误
I型错误 Type I error:拒真错误
在H0是真实的情况下,由于抽样的随机 性,仍可能有一部分由样本计算的检验统 计量值落入拒绝域内。一旦抽到这样的样 本,根据小概率原理,将拒绝H0,但这样 的拒绝是错误的 I型错误的发生概率为α
T检验应用举例2
问题:一批雄性大鼠,随机分为两组,分 别饲以高蛋白和低蛋白饲料,8周后记录各 鼠体重增加的克数如下。问不同饲料对大 鼠体重增加是否有显著影响?
高蛋白组(X1):134 146 104 119 124
161 107 83 113 129 97 123 低蛋白组(X2):70 118 101 85 107 132 94
配对设计资料t检验的基本思路
首先计算各对数据的差值di
计算差值的均数 d 当两种处理结果无差别,或某种处理不 起作用时,理论上,配对数据差值的总 体均数μd应该为0或某一规定值 可将配对设计资料的t检验视为样本均 数与给定的总体均数的比较
检验统计量
d d t sd / n
其中,n为对子数,
第五章 统计推断
§5.1 §5.2 概述 假设检验
1. 基本原理和有关概念
2. 统计假设检验的基本程序
3. u检验
4. t检验
5. Х 2检验
6. F检验
§5.3 参数估计
1. 点估计
2. 区间估计 §5.4 拟合优度检验
§5.1 概述
总体与样本之间的关系
从总体到样本的研究 随机变量的统计分布率 抽样分布 从样本到总体的研究 统计推断Statistical inference 以各种样本统计量的抽样分布为基础, 由样本推断总体
比较:u=1.82>uα(1.645),落入拒绝域内 结论:应该在0.05的显著性水平上拒绝H0 而接受H1,即这批动物的饲养时间过长, 体重超标,不宜用于实验。
U检验 (u-test)-2
成组设计的两样本均数比较
前提条件:从σi 已知的两个正态或近似正 态总体中,独立地抽取含量分别为n1和n2 的样本
s12=454.75 , s 22=425.33
t f t n1 n2 2
120 101 1.891 11 457.45 6 425.33 1 1 ( ) 11 6 12 7
比较:t=1.891<2.110,落入拒绝域外 结论:在0.05的显著性水平下,可以认
小概率原理
基本内容:小概率的事件在一次试验中几 乎是不会发生的。若根据一定的假设计算 出来该事件发生的概率很小,而在一次试 验中它竟然发生了,则可以认为假设的条 件不成立,应否定假设 检验统计量 Test statistic:在统计假设检 验中使用的统计量。如统计量u, t, F, х2 等
显著性检验 Significance test
H0:μ1=μ2
H1: 1 2 ,若已知μ1不可能小于μ2
or: 1 2 ,若已知μ1不可能大于μ2
or:
1 2
,包括μ1>μ2和μ1<μ2
检验统计量:
x1 x 2 u 2 2 1 / n1 2 / n2 ( x1 x 2 )
x1 x 2
根据小概率原理所建立起来的统计检验方法
显著性水平Significance level
在统计假设检验中所规定的小概率,记为α
究竟小到什么程度算是小概率,要根据 实际情况或实验要求而定 通常规定为5%或1%
单侧检验与双侧检验
拒绝域与接受域 Rejection/Acceptance region
在H0成立的情况下,检验统计量取值概率 为α的取值区间称为拒绝域;拒绝域以外的 取值区间相应地称为接受域
统计推断的两条途径
统计假设检验 Statistical test of hypothesis 对所估计的总体提出一个假设 通过样本数据推断该假设是否可以接受 若可以接受,样本很可能来自这个总体 否则,很可能不是来自这个总体
总体参数估计 Estimation of population parameter 通过样本统计量估计总体参数
为两组大鼠的增重差别无统计学意义,
即两种饲料对大鼠体重增加无显著性
差别
t检验-3 (t-test for matched data) 配对设计的显著性检验
配对设计试验的三种情况
将受试对象按一定条件配成对子(如同种属、同 体重、同年龄、同性别等),再随机分配每对中 的两个受试对象到不同的处理组 同一受试对象分别接受两种不同处理,其目的是 推断两种处理的效果有无差别 同一受试对象处理前后的比较,其目的是推断某 种处理有无作用
临界值tα可由t分布表查出
比较统计量的计算值与临界值的相对大 小,作出统计结论
T检验应用举例1
问题:某单位26名男性司机的脉搏平均数是73.7 次/min,标准差为8.8次/min。可否据此认为男性 汽车司机的脉搏数高于一般男性脉搏数(72次 /min)? 解:H0:μ=μ0
H1:μ>μ0 ,单侧检验
取α=0.05,查表得单侧临界值
tα,f=t0.05,25=1.708
拒绝域:t>1.708
根据样本计算统计量
x 0 73.7 72.0 t 0.985 s/ n 8.8 / 26
比较:t=0.985<tα(1.708),落入拒绝域外
结论:应该在0.05的显著性水平上接受H0, 根据本资料尚不能认为男性汽车司机的脉 搏数显著高于一般男性。