统计学__假设检验(第五章)_(1)_2
统计学概论05
![统计学概论05](https://img.taocdn.com/s3/m/0efa452fb4daa58da0114adc.png)
5-18
总体标准差未知时对总体均值检验经常用t统 计量: X 0
t s n ~ t (n 1)
但是,在大样本场合(样本容量n大于30时), t-统计量与标准正态分布统计量近似,通常用 z检验代替t检验。
5-19
总体成数的检验
当样本容量较大时,下列统计量服从标准正 态分布:
z p n
5-26
z检验的p-值: z0 检验统计量为z统计量的p-值计算公式, 表示 检验统计量的抽样数据,则p-值的计算方法 如下: 如果:H 1 , 0 p-值=2 pz z0 如果:H 1 , 0 p-值= pz z 0 如果:H 1 , 0 p-值= pz z 0
5-11
二、参数检验
参数检验都是先对样本所属总体的性质作出 若干的假定,或对总体的分布形状加以限定, 然后对总体的有关参数情况进行统计假设检 验。因此,参数检验又称为限定分布检验。 如在总体服从正态分布条件下,对其均值进 行检验。下面通过具体例子来说明参数检验 方法。
5-12
在例1中,按历史资料,总体的标准差是4毫 升。我们通过检验总体均值是否等于250毫升, 来判断饮料厂商是否欺骗了消费者。程序如 下:
5-6
构造一个统计量来决定是“接受原假设,拒绝备选 假设”,还是“拒绝原假设,接受备选假设”。对 不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计的分布以及由实际问题 中所确定的显著性水平,来进一步确定检验统计量 拒绝原假设的取值范围,即拒绝域。在给定的显著 性水平α下,检验统计量的可能取值范围被分成两部 分:小概率区域与大概率区域。小概率区域就是概 率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区 域。
教育与心理统计学 第五章 假设检验考研笔记-精品
![教育与心理统计学 第五章 假设检验考研笔记-精品](https://img.taocdn.com/s3/m/0a715b3a59fb770bf78a6529647d27284b73370f.png)
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
医学统计学假设检验
![医学统计学假设检验](https://img.taocdn.com/s3/m/2190d2d03c1ec5da51e27024.png)
❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。
统计学导论 科学出版社 第五章 假设检验
![统计学导论 科学出版社 第五章 假设检验](https://img.taocdn.com/s3/m/57e0600603d8ce2f00662368.png)
右侧检验
或
H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值
☺
☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体
第5章t检验
![第5章t检验](https://img.taocdn.com/s3/m/e6b5285eac02de80d4d8d15abe23482fb5da025f.png)
3.5
12.25
10
15.0
8.0
7.0
49.20
Байду номын сангаас
11
13.0
6.5
6.5
42.25
12
10.5
合计
9.5
1.0
1.00
39(d)
195(d2)
H0:d=0, H1:d0, 0.05。
自由度计算为 ν=n-1=n-1=12-1=11,
查附表2,得t0.05(11) = 2.201,
t0.01(11) = 3.106,本例t > t0.01(11), P < 0.01,差别有统计学意义,拒绝H0,接受H1,
应的总体方差相等(方差齐性) u 检验:1.大样本
2.样本小,但总体标准差已知
➢t检验 样本均数与总体均数比较的t检验 配对设计资料比较的t检验 两独立样本均数比较的t检验
➢样本均数与总体均数的比较的t检验,亦 称单样本t检验(one sample t test) 。
➢用于从正态总体中获得含量为n的样本, 算得均数和标准差,判断其总体均数μ 是否与某个已知总体均数μ0相同。
可认为两种方法皮肤浸润反应结果的差别有 统计学意义。
查表,t与自由度为9(10-1)时的t界值进行比 较,得到0.01<p<0.05。
P=2*[1-CDF.T(2.434,9)]
CDF.T(quant, df)。数值。返回 t 分布(指定自由度为 df)中的 值将小于 quant 的累积概率。
SPSS软件操作
• 第一步:以“血尿素氮” 为变量名,建立变量
t
df
Sig. (2-tailed) Difference Lower
《统计学》第5章 假设检验
![《统计学》第5章 假设检验](https://img.taocdn.com/s3/m/1fd5f62c777f5acfa1c7aa00b52acfc788eb9f77.png)
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
医学统计学-假设检验概述
![医学统计学-假设检验概述](https://img.taocdn.com/s3/m/afc5869ca45177232e60a2e1.png)
二、假设检验应注意的问题
假设检验利用小概率反证法思想,从问题对立面 (H0)出发间接判断要解决的问题(H1)是否成立。在H0 成立的条件下计算检验统计量,获得P值来判断。当P ≤,就是小概率事件。
小概率事件原理:小概率事件在一次抽样中发生 的可能性很小,如果它发生了,则有理由怀疑H0,认 为H1成立,该结论可能犯的错误。
当不拒绝H0时,没有拒绝实际上不成立的H0,这 类错误称为Ⅱ类错误(“存伪”),其概率大小用β 表示。
假设检验中的两类错误
客观实际
拒绝H0
不拒绝H0
H0成立 第Ⅰ类错误(α) 推断正确(1- α)
H0不成立 推断正确(1- β) 第Ⅱ类错误(β)
α与β的关系: 当样本量一定时, α愈小, 则β愈大,反之α愈大,
距法
理论上:
• 总体偏度系数1=0为对称,1>0为正偏态,1<0为负偏态; • 总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰。 • 只有同时满足对称和正态峰两个条件时,才能认为资料服从
假设检验概述
第五章 假设检验概述
第一节 假设检验的分类、论证方法与步骤 一、假设检验的分类 二、假设检验的论证方法 三、假设检验的步骤
第二节 假设检验的两类错误和注意事项 一、Ⅰ型错误和Ⅱ型错误 二、应用假设检验的注意事项
第三节 正态性检验与数据转换 一、正态性检验 二、数据转换
第四节 例题和SPSS电脑实验
P>:不拒绝H0 ,还不能认为差异有统计学意义… P:拒绝H0,接受H1 ,差异有统计学意义…
第二节 假设检验的两类错 误和注意事项
一、Ⅰ型错误和Ⅱ型错误
1. Ⅰ型错误: 当拒绝H0时,可能拒绝了实际上成立的H0,这
第五章-回归模型的假设检验
![第五章-回归模型的假设检验](https://img.taocdn.com/s3/m/ac276e3ca58da0116c1749ea.png)
步骤二:计算F值
回归平方和
Yˆ Y
F
解释变量数 残差平方和
=
k
uˆ 2
样本数 解释变量数 1 n k 1
1
决定系数 决定系数
样本数 解释变量数 解释变量数
1
=
R2 1 R2
n
k k
1[计算式]
步骤三:计算出来的F值,服从自由度(分子,分母)=(k,n k 1)
的F分布,将其与F分布表中的到的F值(判定值)相比较,进行显著
自由度调整后的决定系数:
2
R 1
n 1
1 R2 =1 10 1 1 0.98358 0.97889
n k 1
10 2 1
(3)根据公式,
F R2 n k 1 = 0.98358 10 2 1 209.7 1 R2 k 1 0.98358 2
根据F分布表,1%的显著性水平下自由度为(分子,分母)=(k=2,n k 1=7)
单侧检验,根据t分布表,得:
tˆ =4.816 3.499
tˆ1 =16.383 2.998
tˆ2 =19.094 2.998
放弃原假设(H0 : 0, H0 : 1 0, H0 : 2 0),估计出来的回归系数
在1%的显著性水平上显著。
结构变化的F检验
• 结构变化的F检验,也称为Chow test,用于检验经济 分析中的一个重要问题--“是否存在结构变化”。基 本步骤如下:
Yˆ 2.267718 0.247759 X1 1.296761X 2 回归系数的符号条件也得到满足。
解答(2)(3)
(2)根据公式,
决定系数:
R2 = ˆ1SY1 ˆ2SY 2 = 0.247759 46+ 1.296761 17 0.98358
医学统计学第七版教材第五章总结
![医学统计学第七版教材第五章总结](https://img.taocdn.com/s3/m/332796342bf90242a8956bec0975f46527d3a712.png)
医学统计学第七版教材第五章总结假设检验1.试述假设检验中α与P的联系与区别。
区别:(1)α值是事先确定的一个小的概率值。
为一次检验中,甘愿冒的风险。
(2)P值是在H,成立的条件下,出现当前检验统计量以及更极端状况的概率。
为一次检验中,实际冒的风险。
联系:以t检验为例,P、α都可以用t分布尾部面积大小表示。
Kα时,拒绝H。
假设,差异有统计学意义。
2.试述假设检验与置信区间的联系与区别。
联系:区间估计与假设检验是由样本数据对总体参数做出统计学推断的两种主要方法。
区别:置信区间用于说明量的大小,即推断总体参数的置信范围;假设检验用于推断质的不同,即判断两总体参数是否不等。
3.怎样正确运用单侧检验和双侧检验?需要根据数据的特征及专业知识进行确定。
若比较甲、乙两种方法有无差异,则应选用双侧检验。
若需要区分何者为优,,则应选用单侧检验。
在没有特殊专业知识说明的情况下,一般采用双侧检验即可。
4.试述两类错误的意义及其关系。
(1)Ⅰ类错误:如果检验假设H。
实际是正确的,由样本数据计算获得的检验统计量得出拒绝H。
的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设H。
(弃真)的错误称为Ⅰ类错误。
I类错误的概率用α表示。
(2)Ⅱ类错误:若检验假设H。
原本不正确(H正确),由样本数据计算获得的检验统计量得出不拒绝H。
(纳伪)的结论,此时就犯了Ⅱ类错误。
Ⅱ类错误的概率用β表示。
5.简述假设检验的基本思想。
假设检验是在局成立的前提下,从样本数据中寻找证据来拒绝H。
、接受H,的一种“反证”方法。
如果从样本数据中得到的证据不足,则只能不拒绝H,暂且认为H,成立,即样本与总体间的差异仅仅是由于抽样误差所引起。
拒绝H。
是根据某个界值,即根据小概率事件确定的。
所谓小概率事件是指如果比检验统计量更极端(即绝对值更大)的概率较小,比如小于等于0.05,则认为零假设的事件在某一次抽样研究中不会发生,此时有充分理由拒绝H。
,即有足够证据推断差异具有统计学意义。
应用统计学(第五章 统计推断)
![应用统计学(第五章 统计推断)](https://img.taocdn.com/s3/m/1cf2d653227916888486d773.png)
检验统计量: χ2 (n 1) s2 σ02
例题5 已知某农田受到重金属污染,抽样测定其镉含量
(μg/g)分别为:3.6、4.2、4.7、4.5、4.2、4.0、3.8、
3.7,试检验污染农田镉含量的方差与正常农田镉含量的方 差0.065是否相同。
解:假设 H0:σ 2 σ02 , H A:σ 2 σ02
P(μ-1.960 σ x ≤ x < μ+1.960 σ x)=0.95
否定区
接受区
否定区
左尾
0.025
μ-1.960σ x
0.95
0.025
0 μ+1.960σ x
右尾
临界值: ± uσ x= ± 1.960σ x
双尾检验 = 0.01
P(μ-2.576 σ x ≤ x < μ+2.576 σ x)=0.99
解: 假设: H0: μ ≤ μ0, HA : μ > μ0 确定显著水平:α=0.05 检验统计量:u x μ0 379.2 377.2 1.818 σ n 3.3 9 u0.05=1.645,计算得:u=1.818>u0.05,P<0.05
推断:否定H0,接受HA。
即:栽培条件的改善,显著提高了豌豆籽粒重量。
4)推断
接受/否定H0(HA,实际意义)
例题1 正常人血钙值服从的正态分布,平均值为2.29 mM,标准差为 0.61mM。现有8名甲状旁腺减退患者经治疗后,测得其血钙值平均为 2.01mM,试检验其血钙值是否正常。
1)提出假设 2)确定显著水平 3)计算概率 4)推断
1)提出假设
H0
零假设 /无效假设
对 /检验假设
第五章t检验
![第五章t检验](https://img.taocdn.com/s3/m/3574b8e41a37f111f1855b70.png)
样本均数与总体均数的比较
▪ 建立检验假设,确定检验水准 H0: = 0 H1: ≠ 0 =0.05
相等
一、单样本t检验 one sample t-test
▪ 即样本均数代表的未知总体均数和已知 总体均数0(一般为理论值、标准值或 经过大量观察所得的稳定值等)的比较。 这时检验统计量的计算在H0成立的前提 条件下计算。
t
X
S X
X 0 ,
S/ n
n -1
one sample t-test
已知总体
未知总体
X=136.0g/L S= 6.0g/L n=280
出现差别的两种可能:
▪总体均数不同,故样本均数有差别 ▪总体均数相同,差别仅仅是由于抽样误差 造成的
怎样判断属于哪一种可能? 先计算一个统计量,如t值,然后根据相 应的概率做判断。
一、假设检验的基本原理
样本均数与已知总体均数不等,原因? (1) ≠ 0,两总体均数不等 (2)= 0 ,抽样误差所致 这种不等,有多大的可能性由抽样误差造成?如果抽样误差
一般认为双侧检验较保守和稳妥,尤其是多样 本。
▪ 研究者想知道是否有一方较高,则采用单侧 检验(one-side test)。
从专业知识判断知:一结果不可能低于另一结 果,拟用单侧检验。
▪ 一般认为双侧检验稳妥,故常用。
确定检验水准, size of a test,
▪ 过去称显著性水平(significance level)
统计学--假设检验(第五章)-(1)-2
![统计学--假设检验(第五章)-(1)-2](https://img.taocdn.com/s3/m/19b4e4d9846a561252d380eb6294dd88d0d23d92.png)
左侧检验:
×
抽样分布
Region of Rejection
拒绝H0
置信水平
1 -
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
36.6
36.9
36.7
37.2
36.3
37.1
36.7
36.8
37.0
37.0
36.1
37.0
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区
间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个有
解:研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500 H1 : < 500
<提出假设>
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
传统上,做出决策所依据的是样本统 计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的P
值。
注:假设检验不能证明原假设正确。
① 假设检验只提供不利于原假设的证据。当拒绝原假设时, 表明样本提供的证据证明它是错误的;当没有拒绝原假设时 ,我们也不说“接受原假设”,因为没法证明原假设是正确 的
生物统计学:第五章 对单个和两个总体平均数的假设检验
![生物统计学:第五章 对单个和两个总体平均数的假设检验](https://img.taocdn.com/s3/m/a36a360e3186bceb18e8bb8d.png)
二、未知σ12,σ22,但是σ12=σ22 已知两总体方差相等,但是不知道它的具体 值是多少
样本1
样本2
x1,n1 1
x2,n2 1
2
2
(x1 x1) /(n1 1) (x2 x2 ) /(n2 1)
合并的方差可以用两个样本的均方的加权平均来估计
s s s 2
2
df1
2
原假设的否定域分别为:
(1)Z ua (2)Z u2a (3)Z u2a
uα 和u2α:分别为标准正态分布 两尾概率为 α和2α时 的分位点。
见附表2。α=0.05时, uα=1.96 u2α=1.64 α=0.01时,uα=2.58 u2α=2.33
5.1.2 t 检验-总体的方差σ2未知
那么按照下面的t检验方法进行检验。
(二)校正 t 检验(Welch)
若经F(双尾)检验得出的结论是σ1≠σ2,这时可用一种近 似法——t’检验判定平均数之间的差异显著性。
– 该检验的临界值仍由t 表查出,对自由度进行校正 ;
– t 检验统计量
tdf
x1 x2 s12 s22 n1 n2
2
(S / n S / n ) 1 1 df (S12 / n1 )2
(1)H 0:1 2;H A:1 2 双侧检验 (2)H 0:1 2;H A:1 2 单侧检验 (3)H 0:1 2;H A:1 2 单侧检验
在实验研究中,虽然我们尽量排除各种偶然因 素的干扰,以突出处理结果,但是实验总会受 到一些偶然因素的影响而产生实验误差。
即使同一个处理的不同重复的观察值表现也不 同,观察值仅仅是实验的表面结果,它是实验 处理的理论值(即总体均数)与实验误差之和。
n1 1
医学统计5第五章 假设检验
![医学统计5第五章 假设检验](https://img.taocdn.com/s3/m/ce66a51bbe1e650e52ea99c5.png)
二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。
统计学 假设检验
![统计学 假设检验](https://img.taocdn.com/s3/m/fb03e25f28ea81c759f57814.png)
H0;备择假设是拒绝原假设后可供选择的假设, 记为 H1。
12
第三节 假设检验的基本原理
原假设和备择假设是对立的,检验结果二者 必取其一。或者接受H0而拒绝H1;或者拒绝H0而 接受H1。
原假设和备择假设不是随意提出的,应根据 所检验问题的具体背景而定。常常是采取“不轻 易拒绝原假设”的原则,即把没有充分理由不能 轻易否定的命题作为原假设,而相应地把没有足 够把握就不能轻易肯定的命题作为备择假设。
20
第三节 假设检验的基本原理
双侧检验的拒绝区域位于统计量分布曲线的 两侧,如图1(a)所示;左单侧检验的拒绝区域位 于统计量分布曲线的左侧,如图1(b)所示;右单 侧检验的拒绝区域位于统计量分布曲线的右侧, 如图1(c)所示。
在例1中,若取=0.05,由于是双侧检验,所 以Z/2 = 1.96。接受区域:- 1.96≤Z≤1.96;拒绝 区域:Z > 1.96或Z < - 1.96。
19
第三节 假设检验的基本原理
在实际应用中,一般是先给定了显著性水平 ,这样就可以由有关的概率分布表查得临界值 (Critical Value)Z,从而确定H0的接受区域 和拒绝区域。临界值Z就是接受区域和拒绝区域 的分界点。
对 于 不 同 形 式 的 假 设 , H0 的 接 受 区 域 和 拒 绝区域也有所不同。
25
第三节 假设检验的基本原理
犯第一类错误的概率,亦称拒真概率,它实 质上就是前面提到的显著性水平,
即P(拒绝H0|[H0为真]= 。 (二)第二类错误 当原假设H0为不真,但由于样本的随机性使 样本统计量落人接受区域,这时的判断是接受原 假设。这类错误称为第二类错误,亦称取伪错误。
统计学课后答案
![统计学课后答案](https://img.taocdn.com/s3/m/df9487806aec0975f46527d3240c844769eaa0bd.png)
第四章 抽样分布与参数估计3.某地区粮食播种面积5000亩,按不重复抽样方法随机抽取了100亩进行实测,调查结果,平均亩产450公斤,亩产量标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。
解:已知X =450公斤,n =100(大样本),n/N=1/50,11≈-Nn,不考虑抽样方式的影响,用重复抽样计算。
s =52公斤,1-α=95%,α=5%。
这时查标准正态分布表,可得临界值:96.1025.02/==z z α该地区粮食平均亩产量的置信区间是:1005296.14502⨯±=±nsz x α=[439.808,460.192] (公斤) 总产量的置信区间是:[439.808⨯5000,460.192⨯5000] (公斤) =[2199040,2300960](公斤)4.已知某种电子管使用寿命服从正态分布。
从一批电子管中随机抽取16只,检测结果,样本平均寿命为1490小时,标准差为24.77小时。
试以95%的置信度估计这批电子管的平均寿命的置信区间。
解:(1)已知X =1490小时,n =16,s =24.77小时,1-α=95%,α=5%。
这时查t 分布表,可得 2.13145)1(2/=-n t α该批电子管的平均寿命的置信区间是:1677.2413145.214902⨯±=±nst x α=[ 1476.801,1503.199](小时)因此,这批电子管的平均寿命的置信区间在1476.801小时与1503.199小时之间。
6.采用简单随机重复抽样的方法,从2 000件产品中抽查200件,其中合格品190件。
要求:(1)计算合格品率及其抽样平均误差。
(2)以95.45%的置信度,对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其置信度是多少? 解:(1)合格品率:P=190/200⨯100%=95% 抽样平均误差:np p p )1()(-=σ=0.015(2)%3%95%100015.02%95)(22/02275.02/±=⨯⨯±=±==p Z P Z Z σαα]19601840[]2000%982000%92[(%]98%92[,,的置信区为:件合格品数量,:合格品率的置信区间为=⨯⨯)(3)%64.87)(8764.01,54.1%31.2%100015.0%31.2)(2/2/2/==-==⨯⨯==∆z F Z Z p Z ασααα查表得7.从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:试求:(1)以95.45%的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于800元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过30元,估计工资不少于800元的工人所占比重的允许误差范围不超过10%,置信度仍为95.45%,试问至少应抽多少工人? 解(1)通过EXCEL 计算可得: X =816元,n =50人,s =113.77元。
统计学习题及答案
![统计学习题及答案](https://img.taocdn.com/s3/m/c477affcbe1e650e53ea9937.png)
统计学习题及答案第五章假设检验一、填空题:1. 就是事先对总体参数作出一个假设,然后利用样本信息判断该假设是否合理。
2.原假设和备择假设的关系是。
3.假设检验最常用的有三种情况:双侧检验、和。
4. 当总体方差已知,正态总体时,样本均值服从正态分布,选择的统计量为统计量。
5. 左侧检验的拒绝区域位于统计量分布的,右侧检验的拒绝区域位于统计量分布的。
6(假设检验中的两类错误是和。
二、单项选择题:1. 在假设检验中,原假设H,备择假设H,则称( )为犯第一类错误 01A、H为真,接受HB、H为真,拒绝H 0000C、H不真,接受HD、H不真,拒绝H 01002. 按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用( )。
A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验3. 当样本统计量的观察值未落入原假设的拒绝域时,表示( )。
A、可以放心地接受原假设B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设D、备择假设是错误的4(进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( )。
A、都减少B、都增大C、都不变D、一个增大一个减小三、多项选择题:1. 关于原假设的建立,下列叙述中正确的有( )。
A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2. 在假设检验中,α与β的关系是( )。
A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β四、计算题:,(某种感冒冲剂的生产线规定每包重量为,,克,超重或过轻都是严重的问题。
统计学简答题参考答案
![统计学简答题参考答案](https://img.taocdn.com/s3/m/a92c603aabea998fcc22bcd126fff705cd175c59.png)
统计学简答题参考答案第一章绪论1、什么就是统计学?怎样理解统计学与统计数据得关系?答:统计学就是一门收集、整理、显示与分析统计数据得科学。
统计学与统计数据存在密切关系,统计学阐述得统计方法来源于对统计数据得研究,目得也在于对统计数据得研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据得来源。
答:统计数据来源于两个方面:直接得数据:源于直接组织得调查、观察与科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查与抽样调查。
间接得数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3、简要说明抽样误差与非抽样误差。
答:统计调查误差可分为非抽样误差与抽样误差。
非抽样误差就是由于调查过程中各环节工作失误造成得,从理论上瞧,这类误差就是可以避免得。
抽样误差就是利用样本推断总体时所产生得误差,它就是不可避免得,但可以控制得。
4、解释描述统计与推断统计得概念?(P5)答:描述统计就是用图形、表格与概括性得数字对数据进行描述得统计方法。
推断统计就是根据样本信息对总体进行估计、假设检验、预测或其她推断得统计方法。
第二章统计数据得描述1描述次数分配表得编制过程。
答:分二个步骤:(1)按照统计研究得目得,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体得表现作为一个组,或者几个表现合并成一个组,这取决于分组得粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量得取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组得次数,编制次数分配表。
2、一组数据得分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态与峰度几方面来测度。
常用得指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数与峰度系数。
3、怎样理解均值在统计中得地位?答:均值就是对所有数据平均后计算得一般水平得代表值,数据信息提取得最充分,具有良好得数学性质,就是数据误差相互抵消后得客观事物必然性数量特征得一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要得基础地位。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
右侧检验:统计量 > 临界值,拒绝H0
(2)假设检验中的两类错误
第一类错误(弃真错误)
原假设为真时,拒绝原假设
会产生一系列后果 第一类错误的概率为,被称为显著性水平
假设检验的结果 不一定正确!
第二类错误(取伪错误)
原假设为假时,接受原假设 第二类错误的概率为
原假设抽样分布
α
µ0
接受域 (原假设为真)
第五章 假设检验 ۩ ۩ 假设检验的基本原理 假设检验的步骤
۩
۩
一个总体参数的检验
利用p 值进行假设检验
总体参数
推断估计
抽样分布
参数估计
随机原则
统计量
假设检验
检验
假设检验在统计方法中的地位:
统计方法
描述统计法 推断统计法
参数估计
假设检验
正常人的平均体温是37oC吗?
当问起健康的成年人体温是多少时,多数人的回 答是37oC!这似乎已经成了一种共识……以下是一 位研究人员测量的50个健康成年人的体温数据。
一、假设检验的基本原理
1. 假设检验(hypothesis test)
1° 先对总体参数(或分布形式)提出某种假设,再利用样
本信息判断假设是否成立 2°参数检验——总体的分布形式已知; 非参数检验 3°逻辑上运用反证法,统计上依据小概率原理! 小概率是在一次试验中,一个几乎不可能发生的事 件发生的概率; 在一次试验中小概率事件一旦发生,我们就有理由
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区 间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个 有任何特定意义的概念”
我们应该放弃“正常人的平均体温是37oC”这个共识吗?
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
<提出假设>
【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含
量不少于500克,从消费者的利益出发,有关研究人员 要通过抽检其中的一批产品来验证该产品制造商的说明
×
1-
Region of Non rejection Region of Rejection
H0
临界值
观察到的样本统计量
统计量决策规则:
1°给定显著性水平,查表得出相应的临界值Z或Z/2 , tα 或 tα/2 2°将检验统计量的值与 水平的临界值进行比较 3°作出决策
双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0
床生产的零件是否符合标准要求。若零件的平均直径大于或
小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
双侧检验:
是否属实。试陈述用于检验的原假设与备择假设。
解: 研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
提出假设(小结):
1°原假设和备择假设是一个完备事件组,而且相互 对立 <互斥互补> 2°先确定备择假设,再确定原假设 3°等号“=”总是放在原假设上
拒绝原假设
2. 假设检验的基本思想
抽样分布
这个值不像我们应 该得到的样本均值 ...
因此,我们 拒绝假设 =50!
如果这是总体 的真实均值
20
= 50 H0
样本均值
3.假设检验的过程(提出假设→抽取样本→作出决策)
提出假设
我认为人口的 平均年龄是50岁
总体
作出决策
拒绝假设!
第一类错误(弃真错误)
弃真错误:原假设为真, 却落在拒绝域内被拒绝。
x
拒绝域
扩大拒绝域( α 变大),第
原假设抽样分布
一类错误可能性变大;反之,为
α
µ0
防止弃真错误,就要缩小α 。
x
拒绝域
原假设:
1-α
µ0
接受域
α
拒绝域
1-β
备择假设:
β
µ1
拒绝域
接受域
研究者总是希望能做出正确的决策,但由于决策是
H0 :无罪
陪审团审判 裁决 无罪 有罪 实际情况 无罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0
放过坏人
H0 检验
决策
实际情况 H0为真 H0为假
正确决策 第二类错 误() 1– 第一类错 正确决策 误() (1-)
冤枉好人
两类错误的控制:
对于一个给定的样本,如果犯第一类错误的代价比犯
拒绝H0
1-
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
H1 : 某一数值 H1 : 某一数值 H1 : < 某一数值
<提出假设>
【例1】一种零件的生产标准直径为10cm,为对生产过程进行控 制,质量监测人员定期对一台加工机床检查,来确定这台机 床生产的零件是否符合标准要求。若零件的平均直径大于或 小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
建立在样本信息的基础之上,而样本又是随机的,因而 就有可能犯错误; 原假设和备择假设不能同时成立,决策的结果要么 拒绝H0 ,要么不拒绝H0 。决策时总是希望当原假设正确
时,没有拒绝它;当原假设不正确时拒绝它,但实际上
很难保证不犯错误
是针对原假设 H0 说的!
假设检验中的两类错误(决策结果)
假设检验就好像 一场审判过程 统计检验过程
建立的原假设和备择假设为:
H0 : 500
H1 : < 500
左侧检验:
抽样分布
Region of Rejection
√
置信水平
拒绝H0
1-
Region of Non rejection
临界值
H0
观察到的样本统计量
左侧检验:
抽样分布
Region of Rejection
×
置信水平
2. 确定适当的检验统计量
1°用于假设检验问题的统计量
2°选择统计量的方法与参数估计相同,需考虑:
是大样本 or 小样本 总体方差已知 or 未知
3. 规定显著性水平(significant level)
1°是一个概率值
2°原假设为真时,拒绝原假设的概率
<抽样分布的拒绝域>
3°表示为
常用的 值有0.01,0.05,0.10
计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的 P
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
右侧检验:
抽样分布
置信水平 拒绝H0
√
1-
Region of Non rejection Region of Rejection
H0
临界值
观察到的样本统计量
右侧检验:
抽样分布
置信水平 拒绝H0
抽样分布 拒绝H0
Region of Rejection
√
置信水平 拒绝H0
/2
1-
Region of Non rejection
Region of Rejection
/2
临界值
H0
临界值
观察到的样本统计量
双侧检验:
抽样分布 拒绝H0
Region of Rejection
×
置信水平 拒绝H0
37.1 36.9 37.6 36.1 37.1 37.0 36.6 36.1 36.7 36.8 36.9 36.6 36.7 37.1 36.2 36.7 37.2 37.1 37.2 37.0 36.9 36.2 37.3 36.6 36.3 36.9 36.4 37.0 36.3 37.0 37.1 36.7 36.9 36.5 37.5 37.0 36.6 36.6 37.1 36.1 36.4 36.9 36.4 36.7 36.9 37.1 37.3 36.9 36.7 37.0
抽取随机样本
X = 20
均值
二、假设检验的步骤
1. 提出原假设和备择假设 2. 确定适当的检验统计量 3. 规定显著性水平 4. 计算检验统计量的值 5. 作出统计决策
1. 提出假设
1°原假设(null hypothesis)
研究者收集证据,指的是待检验的假设,用H0表示
统计学涵义是指参数没有变化或变量之间没有关系 起初被假设是成立的,后面根据样本数据确定是否 有足够的证据拒绝它 总是有符号 , ,