第7章思考与练习-假设检验
统计基础试题——参数估计和假设检验
第七章参数估计和假设检验一、填空题1.在抽样推断中,常用的总体指标有、和。
2.在抽样推断中,按随机原则从总体中抽取的部分单位叫,这部分单位的数量叫。
3.整群抽样是对总体中群内的进行的抽样组织形式。
4.若总体单位的标志值不呈正态分布,只要,全部可能样本指标也会接近于正态分布。
5.抽样估计的方法有和两种。
6.扩大误差范围,可以推断的可靠程度,缩小误差范围则会推断的可靠程度。
7.对总体的指标提出的假设可以分为和。
8.如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为。
二、单项选择题1.所谓大样本是指样本单位数在()及以上。
A.50个B.30个C.80个D.100个2.总体平均数和样本平均数的关系是()。
A.总体平均数是确定值,样本平均数是随机变量B.总体平均数是随机变量,样本平均数是确定值C.总体平均数和样本平均数都是随机变量D.总体平均数和样本平均数都是随机变量3.先对总体按某一标志分组,然后再在各组中按随机原则抽取一部分单位构成样本,这种抽样组织方式称为()。
A.简单随机抽样B.机械抽样C.类型抽样D.整群抽样4.用样本指标对总体指标作点估计时,应满足4点要求,其中无偏性是指()。
A.样本平均数等于总体平均数B.样本成数等于总体成数C.样本指标的平均数等于总体的平均数 D.样本指标等于总体指标5.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将()。
A.保持不变B.随之扩大C.随之缩小D.无法确定6.在抽样估计中,样本容量()。
A.越小越好B.越大越好C.有统一的抽样比例D.取决于抽样估计的可靠性要求。
7.假设检验中的临界区域是指()。
A.接受域B.拒绝域C.检验域D.置信区间三、多项选择题1.在抽样推断中,抽取样本单位的具体方法有()。
A.重复抽样B.不重复抽样C.分类抽样D.等距抽样E.多阶段抽样2.在抽样推断中,抽取样本的组织形式有()。
概率论与数理统计教程习题(第七章假设检验)
习题18(假设检验)一.填空题1. 假设检验的基本原理是2. u 检验、t 检验都是关于 的假设检验。
当 未知时,用t 检验。
3. 设),,,(21n X X X 为来自正态总体),(2σμN 的样本,μ未知,现要检验假设2020:σσ=H ,则应选取的统计量是 ;当0H 成立时,该统计量服从 分布。
二、选择题1. 在假设检验中,0H 表示原假设,1H 表示备择假设,则称为犯第二类错误的是( )①1H 不真,接受1H ②0H 不真,接受1H③0H 不真,接受0H ④0H 为真,接受1H2. 设总体),(~2σμN X ,2σ已知,对于假设00:μμ=H ,01:μμ≠H ,下面结论正确的是( )① 若0μ落入μ的置信水平为α-1的置信区间,则在著性水平α下接受0H ; ② 若0μ落入μ的置信水平为α-1的置信区间,则在著性水平α下接受1H ; ③ 若0μ落入μ的置信水平为α的置信区间,则在著性水平α下接受0H ;④ 以上都不对。
3. 设),,,(21n X X X 为来自正态总体),(2σμN 的样本,μ已知,现在显著性水平05.0=α下接受了2020:σσ=H . 若将α改为0.01时,下面结论中正确的是( )① 必拒绝0H ; ② 必接受0H ;③ 犯第一类错误概率变大; ④ 犯第二类错误概率变小。
三.解答题1. 某厂生产的某种铝材的长度X 服从正态分布,其均值设定为240cm. 现从该厂抽取9件产品,测得5.239=x cm ,16.02=s ,试判断该厂此类铝材的长度是否满足设定要求?(取05.0=α)2. 某种导线的质量标准要求其电阻X 的标准差不得超过0.005(Ω)。
今从一批导线中随机抽取11根,测得样本标准差为007.0=s , 设总体为正态分布。
问在显著性水平05.0=α下能否认为这批导线的标准差显著的偏大?3. 从某锌矿的东、西两支矿脉中,各抽取容量分别为9和8的样本进行测试,得样本含锌平均值及样本方差如下:东支:230.01=x , 1337.021=s ;西支:269.02=x , 1736.022=s 。
第7章假设检验
拒绝域( 拒绝域(α/2) P值的 值的1/2 值的
00
Zα/2 Z Zα/2 Z
临界值的计算: 临界值的计算: P值的计算: 值的计算: 值的计算
zα
2
= NORM SINV (1 − α ) 2
P = 2×[1− NORMSDIST( ABS(Z))]
右单侧Z假设检验示意图 右单侧 假设检验示意图
(5)确定检验准则 (6)进行决策 0.05的水平上应拒绝 的水平上应拒绝H 在α= 0.05的水平上应拒绝H0 即不能认为铁水的平均含碳量 仍然为4.55 仍然为4.55
拒绝 H0
0.025
-1.96
0
1.96
总体均值的检验( 总体均值的检验(二)
正态总体但方差已知 检验统计量与分布
t= X − µ0 S/ n ~ t (n − 1)
假设检验的基本类型
双侧 假设检验 左单侧 假设检验 右单侧 假设检验
假设
H0 H1
µ =k
µ≠k
µ ≥k
µ≤k
µ >k
µ<k
双侧假设检验示意图
拒绝域
接受域
拒绝域
µ=k
单侧假设检验示意图
拒绝域 接受域 µ=k = 接受域 µ=k =
拒绝域
左单侧假设检验
右单侧假设检验
假设检验中的两类错误
第一类错误——弃真错误: 弃真错误: 第一类错误 弃真错误 当零假设H 为正确时,却作出拒绝H 的决定。 当零假设 0为正确时,却作出拒绝 0的决定。 第二类错误——纳伪错误: 纳伪错误: 第二类错误 纳伪错误 当零假设H 为错误时,却作出接受H 的决定。 当零假设 0为错误时,却作出接受 0的决定。
例题分析: 例题分析:总体均值的右单假设检验
统计学课件讲义 第7章 假设检验
第7章假设检验一、假设检验概述1.概念:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
2.主要目的:在于判决原假设的总体和当前抽样所取自的总体是否发生了显著的差异。
3.假设检验的检验法则假设检验过程就是比较样本观察结果与总体假设的差异。
差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。
4.假设检验中的两类错误:“弃真”、“取伪”在假设检验中,在一定样本容量下,不能同时做到犯这两类错误的概率都很小。
因为减少α会引起β增大,减少β会引起α增大。
5.基本思想:反证法思想、小概率原理6.假设检验的步骤:根据题意合理地建立原假设和备择假设→选择适当的检验统计量,并确定其分布形式→选定显著性水平,并根据相应统计量的统计分布表查出临界值→根据样本观察值计算检验统计量的观察值→根据检验规则作出接受或拒绝原假设的判断二、单个正态总体的假设检验(显著水平为α)三、两个正态总体的假设检(显著水平为α)注:2221212222212121211s s n n f s s n n n n ⎛⎫+ ⎪⎝⎭=⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭+-- 四、总体比率的假设检验1、根据中心极限定理,在大样本条件下,若np 和nq 都大于5时,样本比率的抽样分布近似服从正态分布,因此,我们可用Z =作为检验统计量2、对于两总体比率之差的概率分布,可证明其近似地服从正态分布。
若总体比率未知,且1111,(1)n p n p -和 2222,(1)n p n p -都大于5时,我们可用样本比率1p 和2p 来替代。
因此,我们可用Z =五、假设检验中的其他问题1、区间估计与假设检验的关系:两者推断的角度不同、两者立足点不同、两者的主要决策参考点不同。
两者都属于统计推断方法,根据样本统计量对总体参数进行推断 对相同条件的推断问题,其推断的理论依据——抽样分布理论相同都是建立在概率基础上的推断,推断结果都具有一定的可靠程度或风险 利用置信区间可以进行假设检验2、假设检验中的p -值假设检验的p -值就是拒绝原假设的最小显著性水平。
第7章-假设检验例题与习题课件PPT
统计学
(第二版)
【例】某机器制பைடு நூலகம்出的肥
皂厚度为5cm,今欲了解机 器性能是否良好,随机抽 取 10 块 肥 皂 为 样 本 , 测 得 平均厚度为5.3cm,标准差 为0.3cm,试以0.05的显著 性水平检验机器性能良好 的假设。
8 - 19
双侧检验
统计学
(第二版)
H0: = 5
H1: 5
?( = 0.05)
统计学
(第二版)
均值的单尾 t 检验
(计算结果)
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19 临界值(s):
拒绝域
.05
-1.7291 0
t
8 - 23
检验统计量:
t = x 0
sn
= 41000 40000 = 0.894 5000 20
学习交流ppt假设检验在统计方法中的地位描述统计推断统计参数估计假设检验学习交流ppt学习目标学习交流ppt双侧检验原假设与备择假设的确定都必需采取相应的行动措施例如某种零件的尺寸要求其平均长度为10cm大于或小于10cm均属于不合格我们想要证明检验大于或小于这两种可能性中的任何一种是否成立学习交流ppt单侧检验原假设与备择假设的确定将研究者想收集证据予以支持的假设作为备择假设h将研究者想收集证据证明其不正确的假设作为原假设h学习交流ppt单侧检验原假设与备择假设的确定一项研究表明采用新技术生产后将会使产品的使用寿命明显延长到1500小时以上
8 - 36
双侧检验!
香脆 蛋卷
统计学
(第二版)
用置信区间进行检验
(例题分析)
H0: = 1000
H1: 1000
应用统计学第7章 假设检验
•
μp
(1 )
σp
n
7.3 几种常见的假设检验
• p的抽样分布接近于 正态分布,所以检
验统计量是ZSTAT 值:
p的假设检验
Z STAT
pπ
nπ 5和 n(1-π) 5
π(1 π)
n
nπ < 5或 n(1-π) < 5
本章不讨论
7.3 几种常见的假设检验
关于总体比例,可建立如下假设:
提出原假设和备择假设 选择显著性水平 确定检验统计量 建立决策准则 做出决策
7.2 假设检验的五个步骤
7.2.1提出原假设和备择假设 原假设,H0
检验的声称或断言
例:在美国每个家庭平均有3台电视机
(H0 : μ 3)
是总体参数,不是样本统计量
H0 : μ 3
H0 : X 3
7.2 假设检验的五个步骤
的假设检验
σK已n知own (Z 检验)
检验统计量是:
σ Un未kn知own (t 检验)
7.3 几种常见的假设检验
根据抽样分布原理,当总体服从正态分布N(μ,2)时,那
么从中抽取(重复抽样)容量为n 的样本,其样本均值
服从正态分布
N , 2 / n ,而统计量
Z
x
服从标
准正态分布。
n
对于双侧检验,对给定的显著性水平α,当
解:由题意知,这是左单侧检验问题,可建立如下假设:
H0 : 0.9
H1 : 0.9
样本比例
p 82 0.82 ,检验统计量的值为:
100
Z
p
= 0.82 0.9 2.67
(1 )
0.9 0.1
n
100
第7章 假设检验
双侧检验与单侧检验
(假设的形式)
单侧检验
左侧检验
H0 : 0
假设
双侧检验
H0 : = 0 H1 : ≠0
右侧检验
H0 : 0
原假设
备择假设
H1 : < 0 H1 : > 0
什么是假设检验?
(hypothesis test) 1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的过程 2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原理
原假设
(null hypothesis) 1. 2. 3. 研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 , 或 4. 表示(0,1)
总体均值的检验( 2 已知)
(例题分析)
【例】一种罐装饮料采用自动生 产线生产,每罐的容量是 255ml, 标准差为 5ml 。为检验每罐容量 是否符合要求,质检人员在某天 生产的饮料中随机抽取了40罐进 行检验,测得每罐平均容量为 255.8ml。取显著性水平 =0.05 ,检验该天生产的饮料 容量是否符合标准要求?
两类错误与显著性水平
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设 第Ⅰ类错误的概率记为
被称为显著性水平
2. 第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设 第Ⅱ类错误的概率记为 (Beta)
假设检验中的两类错误
(决策结果)
H0: 无罪
0
临界值
样本统计量
决策规则
1. 给定显著性水平,查表得出相应的临界值 z或z/2, t或t/2 2. 将检验统计量的值与 水平的临界值进行比 较 3. 作出决策
(罗良清)统计学(第二版)思考与练习答案:第七章假设检验习题答案
1习题答案计算题:(1)假设考生成绩服从正态分布,在某地一次数学统考中随机抽取了36位考生的成绩,算得平均成绩为66.5分,标准差为15分。
问在显著性水平α=0.05下,是否可以认为这次考试全体考生的成绩为70分?解:建立假设 H 0:0μ=70, H 1:0μ≠70x =66.5,s=15,n=360718/1536x t s n === 另一方面查表得,t(14)=2.1448>t故应接受零假设,即不认为0μ≠70(2)某种导线的质量标准要求其电阻的标准差不得超过σ=0.005Ω,今在一批导线中随机抽取样品9根,测得样本标准差为s=0.007Ω。
设总体为正态分布,问在显著性水平α=0.05下能否认为这批导线的标准差显著地增大了?解:建立假设 H 0:0σ=0.005, H 1: 0σ>0.005n=9,s=0.0072222220(1)80.00715.680.005n s χσ-⨯=== 另一方面查表得,20.05(8)15.5χ=>15.68故应接受原假设,即不认为0σ>0.005(但已经相当接近于拒绝零假设的边缘了)(3)两台车床生产同一种滚珠,其直径服从正态分布。
从中分别抽取8个和9个产品,测得各自的直径为:甲车床:15.0 14.5 15.2 15.5 14.8 15.1 15.2 14.8;乙车床:15.2 15.0 14.8 15.2 15.0 15.0 14.8 15.1 14.8。
比较两台车床生产的滚珠直径的方差是否有明显差别(α=0.05)?解:建立假设 H 0:12μμ=, H 1: 12μμ≠经计算后得:x =15.0125,y =14.9889;20.095536x s =,20.026111y s =1n =8,29n =合并方差 22x y 2xy (m 1)s (n 1)s 0.058509m n 2s -+-=+-=20.095536x s =自由度 m+n-2=15旗开得胜 3 xy x y mnt s mn -=+=0.200884 另一方面查表得,0.025(15) 2.1315t =>0.200884故应接受原假设,即不认为12μμ≠。
第七章假设检验
或者对立假设,用表示 H1
。
第二,希望通过已经获得的一个样本实现
x1 , x2 ,, xn ,
对 H 0 做出成立还是不成立的判断(或者决策)。
© 概率统计教研室
2012
概率论与数理统计 The Probability Theory and Mathematical Statistics
上述各例的零假设与备择假设
这类问题称作假设检验问题 .
假设检验
参数假设检验 非参数假设检验
总体分布已 知,统计假设 仅涉及未知参 数
对总体分布类型做的统计假设
© 概率统计教研室
2012
概率论与数理统计 The Probability Theory and Mathematical Statistics
统计假设
例7.1 某车间生产的滚球直径X服从正态分布 N (15.1,(0.05)2 ) 。 现从某天生产的滚球中随机抽取6个,测得直径(单位:mm)为 14.6, 15.1, 14.9, 14.8, 15.2, 15.1,
所谓小概率原理是指“概率很小的事件在一次试验中 几乎不可能发生”。通常认为概率为0.05或0.01的事件为小 概率事件,有时也把概率为0.10的事件当作小概率事件。小 概率的标准在假设检验中又称之为显著水平,记为
小概率事件在一次试验中并非绝对不能发生,只不过是发 生的概率很小,以至于我们在实际统计推断中认为小概率事件 在一次抽样(试验)中不会发生。所以建立在小概率原理基础 上的带有概率性质的反证法所得结论是有一定风险的,即有可 能犯错误。
由于样本的随机性,可能发生两种类型的错误。 客观上零假设H 是正确的,而由于样本的随机性, 0 做出了拒绝零假设的决策,因而犯了错误,在统计学上 称为第一类错误,也称为“弃真”错误。显然,犯第一
第7章 假设检验基础
S
2 X1
S
2 X2
2
S
4 X1
S
4 X2
n1 1 n2 1
34
第七章 假设检验基础
H0:1 2 H1 : 1 2 0.05
n1 8, X1 13.7, S1 4.21, n2 12, X 2 6.5, S2 1.34
t X1 X2
S12
S
2 2
n1 n2
13.7 6.5 4.6817 4.212 1.342
31
第七章 假设检验基础
H0
:
2 1
2 2
H1
:
2 1
2 2
,
0.05
F
S12 S22
1.022 0.562
3.3176,
1 10 1 9,
2 10 1 9
查F 临界值表3.2:F0.05,(9,9)=4.03,F < F0.05,(9,9) ,得P>0.05
按α=0.05水准不拒绝H0,故还不能认为两法检测结 果精度不同。
7
第七章 假设检验基础
2、确定检验水准: 亦称为显著性水准,符号为α,是预
先给定的概率值。它是当前研究中约定的 小概率事件的概率水平。
8
第七章 假设检验基础
3、选择检验方法并计算统计量: 要根据所分析资料的类型和统计推断的
目的要求选用不同的检验方法。
4、确定P 值: 目的是明确当前抽样结局是否为原假
已知:0 14.1 X 14.3 s 5.08 n 36
4
第七章 假设检验基础
从统计学角度考虑东北某县与北方儿童 前囟门闭合月龄有差别有两种可能: 1)差别是由于抽样误差引起。 2)差异是本质上的差异,即二者来自不同 总体。
统计 习题课件 CH07
第一节 假设检验的概念与原理
一,假设检验的思维逻辑 基本推断原理: 基本推断原理:小概率事件在一次随机试验中不(大) 可能发生. 特点: 特点:从研究总体中抽取大小合适的随机样本,应用假 设检验理论和方法,依据样本提供的有限信息对总体做推 断. 二,假设检验的基本步骤 基本概念: 基本概念:假设检验就是首先根据设计和研究目的提 出某种假设,然后根据现有资料提供的信息,推断此假设 应当拒绝还是不拒绝. 假设检验的基本步骤: 假设检验的基本步骤: 分为三步: 1.建立检验假设,确定检验水准 2. 计算统计量 3. 确定值,做出推断
思考与练习
2. 为探讨习惯性流产与 为探讨习惯性流产与ACA(抗心磷抗体)的lgG的关 (抗心磷抗体) 的关 研究人员检测了33例不育症 流产史>2次 妇女ACA 例不育症( 系,研究人员检测了 例不育症(流产史 次)妇女 单位, 单位; 的lgG,得样本均数为 ,得样本均数为1.36单位,标准差为 单位 标准差为0.25单位;同时 单位 检测了40例正常 例正常( 胎正常足月产史) 检测了 例正常(有1胎正常足月产史)育龄妇女 胎正常足月产史 育龄妇女ACA的 的 lgG,相应样本均数为 单位, 单位. ,相应样本均数为0.73单位,标准差为 单位 标准差为0.06单位.习惯 单位 性流产者与正常妇女lgG水平是否不同? 水平是否不同? 性流产者与正常妇女 水平是否不同 解答:本研究为通过不同群体的小样本数据比较定量指 标lgG的平均水平,故本题属于两独立样本设计资料的t检验. 首先检验两样本方差是否具有齐性(参见教材例7-6方法), 求得F=17.36,P<0.05,方差不齐;选用t'检验(参见教材 ν 例7-5方法)求得t'=14.14, =35,P<0.05,有统计学意义. 说明习惯性流产者与正常妇女lgG水平是不同的.
第7章思考与练习
第七章 假设检验【思考与练习】一、思考题1.解释零假设与备择假设的含义。
2.简述假设检验的基本步骤。
3.举例说明单侧检验与双侧检验的选择。
4.解释I 型错误、II 型错误和检验效能,并说明它们之间的关系。
5.简述假设检验与置信区间估计的联系。
二、案例辨析题为了比较非洛地平与常规药物治疗高血压的疗效差异,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其21.5X =mmHg ,8.0S =mmHg 。
现已知常规药能使高血压患者的血压平均下降20mmHg 。
该医生对其进行了t 检验,零假设是μμ0=,备择假设是μμ0≠,检验水准0.05α=。
计算得 1.875t =,按100ν查t 界值表,得0.10P 0.05<<,故接受0H ,认为非洛地平与常规药物治疗高血压的疗效无差别。
你认为该结论正确吗?请说明理由。
三、最佳选择题1.比较两药疗效时,下列可作单侧检验的情形是A .已知A 药与B 药均有效 B .已知A 药与B 药均无效C .已知A 药不会优于B 药D .已知A 药与B 药差不多好E .不知A 药好还是B 药好 2.假设检验的基本步骤是A .计算检验统计量、确定P 值、做出推断结论B .建立无效假设、建立备择假设、确定检验水准C .建立无效假设、计算检验统计量、确定P 值D .确定单侧检验或双侧检验、选择t 检验或Z 检验、估计I 型错误概率和II 型错误概率E.建立检验假设和确定检验水准、计算检验统计量、确定P值并做出统计推断3.假设检验时,若检验水准α=0.05,则下列关于检验结果的说法正确的是A.若P<0.05,则不拒绝H,此时可能犯II型错误B.若P<0.05,则拒绝H,此时可能犯II型错误C.若P<0.05,则不拒绝H,此时可能犯I型错误D.若P>0.05,则拒绝H,此时可能犯I型错误E.若P>0.05,则不拒绝H,此时可能犯II型错误4.假设检验时,所犯II型错误概率最小的检验水准α为A.0.01 B.0.025 C.0.05D.0.10 E.0.205.有关两样本均数的比较,检验统计量t越大A.说明总体参数差别越大B.说明总体参数差别越小C.说明样本统计量差别越大D.说明样本统计量差别越小E.越有理由认为两总体参数不等6.在样本均数与已知总体均数比较的t检验中,结果 3.24t=,0.05/2,2.086tν=,0.01/2,2.845tν=,按检验水准0.05α=,可认为此样本均数A.与该已知总体均数不同B.与该已知总体均数差异很大C.所对应的总体均数与已知总体均数差异很大D.所对应的总体均数与已知总体均数相同E.所对应的总体均数与已知总体均数不同7.下列关于单侧检验和双侧检验的说法正确的是A.采用单侧检验更好B.采用双侧检验更好C.采用单、双侧检验都无所谓D.根据专业知识确定采用单侧检验还是双侧检验E.根据检验统计量的计算结果确定采用单侧检验还是双侧检验8.样本均数与已知总体均数比较的t检验时,P值越小说明A.样本均数与已知总体均数差别越小B.样本均数与已知总体均数差别越大C.样本所对应的总体均数与已知总体均数差别越大D.越有理由认为样本均数与已知总体均数不同E.越有理由认为样本所对应的总体均数与已知总体均数不同9.下列关于I型错误概率α和II型错误概率β的说法不正确的是A.当样本量确定时,α越小,β越大B.当样本量确定时,α越大,β越小C.欲减小犯I型错误的概率,可取较小αD.欲减小犯II型错误的概率,可取较大αE.若样本含量足够大,可同时避免犯这两型错误四、综合分析题1.已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。
假设检验练习题-(答案)
假设检验练习题1. 简单回答下列问题:1)假设检验的基本步骤?答:第一步建立假设 (通常建立两个假设,原假设H0 不需证明的命题,一般是相等、无差别的结论,备择假设H1,与H0对立的命题,一般是不相等,有差别的结论)有三类假设第二步选择检验统计量给出拒绝域的形式。
根据原假设的参数检验统计量:对于给定的显著水平样本空间可分为两部分:拒绝域W 非拒绝域A拒绝域的形式由备择假设的形式决定H1: W为双边H1: W为单边H1: W为单边第三步:给出假设检验的显著水平第四步给出零界值C,确定拒绝域W有了显著水平按照统计量的分布可查表得到临界值,确定拒绝域。
例如:对于=0.05有的双边 W为的右单边 W为的右单边 W为第五步根据样本观测值,计算和判断计算统计量 Z 、 t 、当检验统计量的值落在W内时能拒绝,否则接受(计算P值 227页 p值由统计软件直接得出时拒绝,否则接受计算1-a的置信区间置信区间由统计软件直接得出统计量落入置信区间接受,否则接受)2)假设检验的两类错误及其发生的概率?答:第一类错误:当为真时拒绝,发生的概率为第二类错误:当为假时,接受发生的概率为3)假设检验结果判定的3种方式?答:1.计算统计量 Z 、 t 、当检验统计量的值落在W内时能拒绝,否则接受2.计算P值 227页 p值由统计软件直接得出时拒绝,否则接受3.计算1-a的置信区间置信区间由统计软件直接得出,落入置信区间接受,否则接受4)在六西格玛A阶段常用的假设检验有那几种?应用的对象是什么?答:连续型(测量的数据):单样本t检验 -----比较目标均值双样本t检验 -----比较两个均值方差分析 -----比较两个以上均值等方差检验 -----比较多个方差离散型(区分或数的数据):卡方检验 -----比较离散数2.设某种产品的指标服从正态分布,它的标准差σ=150,今抽取一个容量为26 的样本,计算得平均值为1 637。
问在5%的显著水平下,能否认为这批产品的指标的期望值μ = 1600。
《假设检验习题答案》课件
论语(节选)(一)颜渊问仁。
子曰:"克己复礼为仁。
一日克己复礼,天下归仁焉。
为仁由己,而由人乎哉?"颜渊曰:"请问其目?"子曰:"非礼勿视,非礼勿听,非礼勿言,非礼勿动。
"颜渊曰:"回虽不敏,请事斯语矣。
" ——《论语·颜渊》翻译:颜渊问什么是仁。
孔子告诉他:"严格要求自己按照礼的要求去做就是仁。
一旦做到克己复礼,天下就回到仁上了。
修养仁德靠自己,难道还能依靠别人吗?"颜渊接着问:"请问实践仁德的具体途径?"孔子告诉他说:"不符合礼制的东西不看,不符合礼制的信息不听,不符合礼制的话不说,不符合礼制的事情不做。
"颜渊说:"我虽然不聪明,但我一定照着您的话去做。
(二)仲弓问仁。
子曰:"出门如见大宾,使民如承大祭。
己所不欲,勿施于人。
在邦无怨,在家无怨。
"仲弓曰:"雍虽不敏,请事斯语矣。
" ——《论语·颜渊》翻译:仲弓问什么是仁。
孔子告诉他:"出门在外要像接见贵宾那样敬慎,治理百姓要像承担重大祭祀那样严肃谨慎。
自己不喜欢做的事情,不要强加给别人。
这样在朝廷和家族中都不会招致怨恨。
"仲弓说:"我虽然不聪明,但我一定照着您的话做。
"(三)子贡问曰:“有一言而可以终身行之者乎?”子曰:“其恕乎!己所不欲,勿施于人。
”——《论语·卫灵公》翻译:子贡问孔子:“有没有一个字可以终身奉行的呢?”孔子回答说:“那就是‘恕’吧!自己不愿意的,不要强加给别人。
”(四)有子曰:“其为人也孝弟,而好犯上者,鲜矣;不好犯上,而好作乱者,未之有也。
君子务本,本立而道生。
孝弟也者,其为仁之本与?”——《论语·学而》翻译:有子说:”孝顺父母,顺从兄长,而喜好触犯上层统治者,这样的人是很少见的。
统计学第七章、第八章课后题答案
统计学复习笔记第七章一、思考题1.解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、 练习题1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
社会统计学第7章假设检验的基本概念
•小概率 原理:
如果对总体的某种假设是真实的,那么不利于 或不能支持这一假设的事件A(小概率事件)在 一次试验中几乎不可能发生的;要是在一次试 验中A竟然发生了,就有理由怀疑该假设的真实 性,拒绝这一假设。
总体
抽样
(某种假设)
检验
(接受)
小概率事件 未发生
样本 (观察结果)
H0:μ≤μ0,H1:μ>μ0(右端检验)
右端检验与左端检验
右端检验:临界值和显
著性水平有如下的关系式:
P(Z>Z)= 左端检验:临界值和显著
性水平有如下关系式:
P(Z<-Z)=
注意:相同的情况下,
接受域
否定域
Z
一端检验比二端检验功效高些,
也就是说二端检验更难否定研
接受域
究假设。
否定域-Z
四、假设检验的检验规则
第七章
假设检验的基本概念
一、什么是假设检验
所谓假设检验,就是先成立一个关于 总体情况的假设,然后抽取一个随机样本, 以样本的统计值来验证对总体的假设。
假设检验的意义:由于我们难以完全 知道所关心的总体的数量特征与变化情况, 因此常常需要对其进行假设,而假设是否 成立,需要进行检验。
假设在社会科学中可以用于不同的层次。最高 层次是理论假设,而理论层次的假设一般是无法加 以直接验证的。为了能从理论上证实这些假设,必 须概念操作化,把理论假设转变为可操作的经验性 假设。再通过社会调查证明原有的假设是否合理。
显著性水平
显著性水平,一般是指在原假设成立
条件下,统计检验中所规定的小概率的标
准,即规定小概率的数量界线,常用的标
准有=0.10,=0.05或=0.01(即否定
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 假设检验【思考与练习】一、思考题1.解释零假设与备择假设的含义。
2.简述假设检验的基本步骤。
3.比较单侧检验与双侧检验的区别。
4.解释I 型错误、II 型错误和检验效能,并说明它们之间的关系。
5.简述假设检验与置信区间估计的联系。
二、案例辨析题为了比较非洛地平与常规药物治疗高血压的疗效差异,现已知常规药能使高血压患者的血压平均下降20 mmHg ,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其21.5X =mmHg ,8.0S =mmHg 。
该医生进行了t 检验,零假设是μμ0=,备择假设是μμ0≠,检验水准0.05α=。
计算得 1.875t =,按100ν=查t 界值表,得0.10P 0.05<<,故接受0H ,认为非洛地平与常规药物治疗高血压的疗效无差别。
你认为该结论正确吗?请说明理由。
三、最佳选择题1.比较两药疗效时,下列哪种情况可作单侧检验 A .已知A 药与B 药均有效 B .已知A 药与B 药均无效 C .已知A 药不会优于B 药 D .已知A 药与B 药差不多好 E .不知A 药好还是B 药好 2.假设检验的步骤是A .计算检验统计量、确定P 值、作出推断结论B .建立无效假设、建立备择假设、确定检验水准C .建立无效假设、计算检验统计量、确定P 值D.确定单侧检验或双侧检验、选择t检验或Z检验、估计I型错误概率和II型错误概率E.建立检验假设和确定检验水准、计算检验统计量、确定P值并作出统计推断3.假设检验时,下列关于检验结果的说法正确的是A.若P值小于0.05,则不拒绝H,此时可能犯II型错误B.若P值小于0.05,则拒绝H,此时可能犯II型错误C.若P值小于0.05,则不拒绝H,此时可能犯I型错误D.若P值大于0.05,则拒绝H,此时可能犯I型错误E.若P值大于0.05,则不拒绝H,此时可能犯II型错误4.假设检验时,取以下何种检验水准时可能犯II型错误的概率最小A.0.025α=B.0.01α=C.0.05α=D.0.10α=E.0.20α=5.下列有关检验统计量t的说法中正确的是A.t越大,说明总体参数差别越大B.t越大,说明总体参数差别越小C.t越大,说明样本统计量差别越大D.t越大,说明样本统计量差别越小E.t越大,越有理由认为两总体参数不等6.在样本均数与已知总体均数比较的t检验中,结果 3.24t=,0.05/2,2.086tν=,0.01/2,2.845tν=,按检验水准0.05α=,正确的结论是A.可认为此样本均数与该已知总体均数不同B.可认为此样本均数与该已知总体均数差异很大C.可认为此样本均数所对应的总体均数与已知总体均数差异很大D.可认为此样本均数所对应的总体均数与已知总体均数相同E.可认为此样本均数所对应的总体均数与已知总体均数不同7.下列关于单侧检验和双侧检验的说法正确的是A.采用单侧检验更好B.采用双侧检验更好C.采用单、双侧检验都无所谓D.根据专业知识确定采用单侧检验还是双侧检验E.根据检验统计量的计算结果确定采用单侧检验还是双侧检验8.样本均数与已知总体均数比较的t检验时,P值越小说明A.样本均数与已知总体均数差别越小B.样本均数与已知总体均数差别越大C.样本所对应的总体均数与已知总体均数差别越大D.越有理由认为样本均数与已知总体均数不同E.越有理由认为样本所对应的总体均数与已知总体均数不同9.下列关于I型错误概率α和II型错误概率β的说法不正确的是A.当样本量确定时,α越小,β越大B.当样本量确定时,α越大,β越小C.欲减小犯I型错误的概率,可取较小αD.欲减小犯II型错误的概率,可取较大αE.若样本含量足够大,可同时避免犯这两型错误四、综合分析题1.已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。
一家研究所对该营养素进行改进后,随机抽取服用新产品一个疗程的受试者36名,测得该生化指标平均增加了52.75个单位,标准差为2.0个单位。
问该营养素新产品是否比旧产品的效果好?2.经研究显示,汉族正常成年男性无名指长度的均数为10.1cm。
某医生记录了某地区12名汉族正常成年男性无名指长度(cm)资料如下:10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.3710.11 10.27问该地区正常成年男性无名指长度是否大于一般汉族成年男性?3.将18名某病患者随机分成两组,分别用药物A 或药物B 治疗,观察治疗前后血色素变化,结果见表7-1。
表7-1 某病患者经A 、B 两药治疗前后血色素的变化结果A 药 病人号 1 2 3 4 5 6 7 8 9 治疗前 36 44 53 56 62 58 45 43 26 治疗后 47 62 68 87 73 58 69 49 50B 药病人号 1 2 3 4 5 6 7 8 9 治疗前 56 49 67 58 73 40 48 36 29 治疗后818670628476584960问:(1) A 、B 两药是否都有效? (2) A 、B 两药的疗效有无差别?【习题解析】一、思考题1.零假设又称无效假设或无差异假设,记为0H ,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为1H ,表示目前的差异是因为比较的对象之间存在本质不同造成的。
2.假设检验的基本步骤如下:(1) 建立检验假设,确定检验水准; (2) 计算检验统计量; (3) 确定P 值,作出统计推断。
3.选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。
例如,在临床试验中,比较甲、乙两种治疗方法的疗效有无差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。
如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。
若从专业角度无法确定的情况下,一般应采用双侧检验。
4.拒绝实际成立的0H 所犯的错误称为I 型错误,记为α。
不拒绝实际不成立的0H 所犯的错误称为II 型错误,记为β。
如果两个总体参数间确实存在差异,即1H :0μμ≠成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝0H )的能力被称为检验效能,记为(1β-)。
三者的关系为:当样本量确定时,α与β成反比,与(1β-)成正比。
如果把α设置得很小,势必增加犯II 型错误的概率,从而降低检验效能;反之,如果把重点放在减少β上,势必增加犯I 型错误的概率,从而降低了置信度。
要同时减小α和β,只有通过增加样本含量来实现。
5.假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结论是等价的。
此外,置信区间在回答差别有无统计学意义的同时,还能提供一些假设检验不能提供的信息,并可以提示差别是否具有实际意义。
因此,置信区间与假设检验的作用是相辅相成的,将两者结合起来,可以提供更为全面的统计推断信息。
二、案例辨析题该结论是错误的。
因为在进行两均数比较的假设检验时,当0.05P ≤时,说明两总体均数无差别是一个小概率事件,我们认为在一次试验中几乎不会发生,于是得出拒绝0H ,接受1H 的结论,即使犯错误,概率也小于5%;但是当0.05P >时,对两总体均数无差别即接受0H 这一结论无任何概率保证,得出错误结论的概率可能很大。
故本例正确的结论应该是:按0.05α=水准,不能拒绝0H ,差异无统计学意义,尚不能认为非洛地平与常规药物治疗高血压的疗效有差异。
三、最佳选择题1.C 2.E 3.E 4.E 5.E 6.E 7.D 8.E 9.E四、 综合分析题1.解:本题是单样本均数与已知总体均数的比较,用单样本资料的t 检验,具体步骤如下:(1) 建立检验假设,确定检验水准0H :0μμ==52 1H :0μμ>=52 单侧0.05α=(2) 计算检验统计量52.75X =,2.0S = X X t S μ-=2.25=,36135ν=-= (3) 确定P 值,作出统计推断查t 界值表,得0.010.025P <<。
按0.05α=水准,拒绝0H ,差别有统计学意义,故可认为该营养素新产品比旧产品的效果好。
2.解:本题是样本均数与总体均数的比较,用单样本资料的t 检验,具体步骤如下:(1) 建立检验假设,确定检验水准0H :0μμ= 1H :0μμ> 单侧0.05α= (2) 计算检验统计量 X =10.1392,S =0.2595 X X t S μ-==12/2595.01.101392.10-=0.523,12111ν=-= (3) 确定P 值,作出统计推断查t 界值表,得0.25P >。
按0.05α=水准,不拒绝0H ,差别无统计学意义,尚不能认为该地区正常成年男性无名指长度大于一般汉族成年男性。
SPSS 操作 数据录入:打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,x 表示该地区正常成年男性中指长度(cm);再点击Data View 标签,录入数据(见图7-1,图7-2)。
图7-1Variable View窗口内定义要输入的变量x分析:Analyze →Compare Means →One Sample T TestTest Variable(s)框:xTest Value框:10.10输出结果3.解:A 药、B 药两组均为配对设计资料,故用配对t 检验进行分析。
(1) A 药:设治疗前后血色素的差值为d 1) 建立检验假设,确定检验水准0H :0=d μ,即A 药治疗前后患者血色素的差值的总体均数为0 1H :0≠d μ,即A 药治疗前后患者血色素的差值的总体均数不为00.05α= 2) 计算检验统计量15.5556d =,9.7610d S =, 3.2537d S = 15.55564.7813.2537dd t S ===,918ν=-=3) 确定P 值,作出统计推断查t 界值表,得0.05/28 2.306t =,,4.718 2.306t =>,0.05P <。
按0.05α=水准,拒绝0H ,接受1H ,差别有统计学意义,可认为A 药治疗前后患者血色素不同,即A 药有效。
B 药:同理,对B 药可得到治疗前后该指标差值的样本均数为18.8889,标准差为13.4856,标准误为4.4952, 4.202t =,8ν=,0.05P <,拒绝0H ,接受1H ,差别有统计学意义,可认为B 药治疗前后患者血色素不同,即B 药有效。
(2) 首先进行方差齐性检验,得 3.021F =,0.05P >,可认为两总体方差齐,两组差值可用两独立样本均数比较的t 检验。