第三章假设检验
第三章假设检验

第二章假设检验3.2 —种元件,要求其使用寿命不低于1000 (小时),现在从一批这种 元件中随机抽取25件,测得其寿命平均值为950 (小时)。
已知这种元 件寿命服从标准差 100(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格 解:提出假设:H 。
:1000, H i : 1000构造统计量:此问题情形属于u 检验,故用统计量:u=此题中:x 950 0100 n=25代入上式得:拒绝域:V= 本题中: u u 10.05 u 0.95 1.64 即, u U 0.95拒绝原假设H 。
认为在置信水平0.05下这批元件不合格。
3.4某批矿砂的五个样品中镍含量经测定为(%):3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在 0.01下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1, n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1: nx2=x2+(x(1,i)-x1)A 2;1000=950-1000 100 25 2.5endx2=x2/n; S=sqrt(x2);提出假设:H 0: J 0 3.25 H 1 : 1构造统计量:本题属于1 2未知的情形,可用t 检验,即取检验统计量为:-X — S .n 1本题中,X 3.252, S=0.0117,代入上式得:否定域为:V 二 t>t (n 1)1— 2本题中, 0.01,t 0.995(4) 4.6041Qt t1 - 2接受H 0,认为这批矿砂的镍含量为 3.25。
3.5确定某种溶液中的水分,它的10个测定值X 0.452%, SS 百本题中,X 0.452% 代入上式得:拒绝域为:拒绝H °1 H 0: 0.5% (ii)H 0 : 0.04%_3.252-3.25_0.0117 -F10.3419设总体为正态分布N(,2),试在水平5%检验假设:H 1 : 0.5%H 1 : 0.0.4%(i)构造统计量:本文中未知,可用t 检验。
计量经济学 第3章 双变量模型:假设检验

假设检验的前提是什么?
本章框图 一、古典假设
回归结果好坏? 三、高斯马尔科夫定理
二、估计量的分布问题
四、 假设 检验
七、正态性检验
方法 统计量 显著性
结论
五、拟合优度 六、预测
一、OLS估计需要的基本假设有哪些?
一、OLS估计需要的基本假设有哪些?
一、OLS估计需要的基本假设有哪些
一、OLS估计需要的基本假设有哪些?
十三、案例2股票价格和利率
理论和假说 变量选择 数据6-13 散点图 估计和结果 结论的经济意义
十四、案例3房价和贷款利率
理论和假说 变量选择 数据6-6 散点图 估计和结果 结论的经济意义
十五、案例4古董和拍卖价格
理论和假说 变量选择 数据6-14 散点图 估计和结果 结论的经济意义
第3章 双变量模型:模型检验
引子、样本回归参数的估计问题
引子、样本回归参数的估计问题
结论:
样本回归系数随样本变化。 样本回归系数是随机变量,如何描述? 样本回归系数和总体回归参数是什么关系 基于什么条件下,利用最小二乘估计的得
到的样本回归系数可以用来作为总体回归 参数的估计? 根据什么说明:总体回归函数的模型设定 是正确的。
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
六、样本回归函数拟合数据好坏的标准是什么?
六、样本回归函数拟合数据好坏的标准是什么?
六、样本回归函数拟合数据好坏的标准是什么?
七、判决系数的性质有哪些?
3[1].1假设检验初述,二类错误
![3[1].1假设检验初述,二类错误](https://img.taocdn.com/s3/m/259a1b59be23482fb4da4c43.png)
第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。
一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。
(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。
若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。
例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。
即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。
第三章假设检验例子

试问,在显著性水平
25%下,能否认为每匹布上的疵点数服从泊松分布。
例:一位环保工程师要考察某条河流的污染情况。 他收集了河流与某个居民点的距离 X (单位:公里) 及河流该处的生化需氧量 Y (单位: 104 mL / L )的 15 对数据如下表:
xi yi 65 2 9 18 20 25 28 50
显著性水平 =0.1 下,对总体 X 是否服从二项分 布 B 2, 0.5 作 2 拟合优度检验,其中 X 表示两 个孩子的家庭中男孩个数,并对结论作直观解释。
例:某厂在全面质量管理工作中,抽查了 50 匹布, 记录下它们的疵点数:
疵点数 频数 0 1 2 3 4
21 18 7 3 1
更新设备后,从新生产的产品中随机抽取 100 个,
测得平均重量 x 12.5 克 , 如果方差不变,问更新 设备后,产品的平均重量是否有显著变化 X ~ N , 2 , 今从一批产品中抽查 10 根测其折断力,算得
均未知,试问在显著性水平 5%下,能否认为距离与 生化需氧量无关?
例:为了考察某地区 50 岁以上的成年人吸烟 习惯与患肺癌之间的关系,调查了 112 名对象, 得列联表如下:
人数 吸烟 不吸烟 n j
患肺癌 未患肺癌 18 12 4 78
ni
,试问在
n 112
显著性水平 1%下,能否认为吸烟习惯与患肺癌无关?
例:为了检查一颗骰子是否均匀,把这颗骰子掷了 100 次,得结果如下表:
出现点数 频数 1 2 3 4 5 6
14 15 13 20 18 20
试在显著性水平
=0.05 下作 2 拟合优度检验。
例:为了检验某厂生产的灯泡的使用寿命是否服从 指数分布,随机地抽查了 150 只灯泡,测得它们的 平均使用寿命 x 200 小时 ,把这 150 个数据 分组整理后如下表:
《数理统计》第三章 假设检验

P328
P329
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
两个正态总体方差比的假设检验 两个正态总体方差比的假设检验 方差比
两个正态总体方差比的假设检验 两个正态总体方差比的假设检验 方差比
P393
P393
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值,方差的假设检验举例 两个正态总体均值,方差的假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验 检验) 一个正态总体均值的假设检验(U检验)
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验) 一个正态总体均值的假设检验(U检验)表示
两个正态总体均值差假设检验举例 两个正态总体均值差假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值差假设检验举例 两个正态总体均值差假设检验举例
两个正态总体方差比的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
总体分布函数的假设检验
1.3 非参数假设检验(Non-Parameter hypothesis testing) 非参数假设检验 Parameter
第三章 总体均数的估计与假设检验

Sd
d
d Sd / n
2
(
d)
n
n 1
S d 0.1087 t 2.7424 0.1087/ 10 7.925
v 10 1 9
3)确定P值,作出推断结论 T0.05,9=2.262, 7.925>2.262,故P<0.05.可以认为两种 方法对脂肪含量的测定结果不同。
167.41, 2.74
165.56, 6.57
168.20, 5.36 n j=10
…. 165.69, 5.09
将上述100个样本均数看成新变量值,则这个 100个样本均数构成一新分布,绘制直方图
样本均数的抽样分布具有如下特点:
1) 各样本均数未必等于总体均数
2) 各样本均数间存在差异
3) 样本均数的分布很有规律,围绕着总体均 数,中间多,两边少,左右基本对称,也 服从正态分布
假设检验的基本步骤:
1、建立检验假设
H0: 检验假设, 无效假设,零假设 μ=μ0
H1: 备择假设,对立假设
μ≠μ0
2、确定检验水准 α=0.05 单双侧
3、选定检验方法和计算检验统计量
4、确定P值和作出推论结论。
P值是指从H0所规定的总体进行随机抽样,获 得大于(或等于及小于)现有样本获得的检验 统计量值的概率。
(1012/L)
血红蛋白 (g/L)
女
男 女
255
360 255
4.18
134.5 117.6
0.29
7.1 10.2
4.33
140.2 124.7
*标准值:使用内科学(1976年)所载均数(转位法定单位)
1)说明女性的红细胞数与血红蛋白的变异程度何者为大? 2)抽样误差是? 3)试估计该地健康成年女性红细胞数的均数? 4) 该地健康成年男女血红蛋白含量是否不同? 5)该地男性两项血压指标是否均低于上表的标准值(若测 定方法相同)?
第三章 假设检验

第三章 假设检验一、填空题1、在假设检验中,第一类错误(即弃真错误)是 。
2、在假设检验中,第二类错误(即取伪错误)是 。
3、在假设检验中,βα,分别为犯第一类错误和第二类错误的概率,n 为样本容量,则有当n 固定时,βα, ; 当n 增大时,βα, 。
4、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,所采用的检验统计量为 。
5、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,拒绝域为 。
6、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,所采用的检验统计量为 。
7、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,拒绝域为 。
8、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,所采用的检验统计量为 。
9、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,拒绝域为 。
10、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,所采用的检验统计量为 。
11、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,拒绝域为 。
12、检验一个总体X 服从正态分布,可用的方法有(给出两种方法即可) 。
13、设某个假设检验问题的拒绝域为W ,且当原假设H 0成立时,样本值12(,,,)n X X X 落入W 的概率为0.15,则犯第一类错误的概率为_____________________。
第三章(3) 假设检验

解:H0 : 0.5, H1 : 0.5
n=16 ,0.05 ,t (15) 1.753
t x 0 s* 0.56 0.5 2 >1.753 n 0.12 16
否定H0
即该服务系统工作不正常
42/27
(三)关于方差的检验
1、检验假设 H0: ,H1:
42/31
ns 选取 = 2 0
2
2
ns2 当2= 2 b时,否定H0 0
当2 b时,不能否定H0
42/32
例6 葡萄酒厂用自动装瓶机装酒,每瓶规定重量为500克,标 准差不超过10克,每天定时检查。某天抽得9瓶,测得平均重 量为x 499克,标准差为s* 16.03克。假设瓶装酒的重量服从 正态分布。问这台机器工作是否正常?(=0.05)
H0 : EX 0.5, H1 : EX 0.5
样本平均值X 0.6
由于
X 0.5 0.1 0.224
而
DX 0.25 0.224 n 100 0.05
不能否定H0
42/10
二、参数检验
☆8
42/11
参数检验
• 参数估计与参数检验都利用样本的信 息
估计量 样本 信息 样本 统计量 检验统计量 参数检验 参数估计
解:
提出假设 H0:2 0.1082 ,H1:2 0.1082
n5 0.05
*2
s 0.2282
*2
查表可得
a=0.484
2
b=11.1
ns (n 1)s 4 0.2282 17.83 >11.1 2= 2 2 2 0 0 0.108
否定H0,即方差不能认为是0.1082
数理统计 (研究生课程) :第三章 假设检验

必须认为这个差异反映了事物的本质差别,即反映 了生产已不正常.
这种差异称作 “系统误差”
正确
第二类错误
人们总希望犯这两类错误的概率越小越好,但 对样本容量一定时,不可能使得犯这两类错误的 概率都很小。 往往是先控制犯第一类错误的概率在一定限度 内,再考虑尽量减小犯第二类错误的概率。
即: 较小的 (0,1) 使得 P{拒绝H0|H0为真}≤ ,
然后减小P{接受H0|H0不真} 犯两类错误的概率:
如发现不正常,就应停产,找出原因,排除 故障,然后再生产;如没有问题,就继续按规定 时间再抽样,以此监督生产,保证质量.
很明显,不能由5罐容量的数据,在把握不大 的情况下就判断生产 不正常,因为停产的损失是 很大的.
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
如果H0不成立,但统计量的实测 值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的H0,那就 犯了“以假为真”的错误 . “取伪错误” 这两类错误出现的可能性是不可能排除的。 原因在于:由样本推导总体
假设检验的两类错误
实际情况 H0为真 H0不真 第一类错误 正确
决定 拒绝H0 接受H0
在上面的例子的叙述中,我们已经初步介绍 了假设检验的基本思想和方法 .
基于概率反证法的逻辑的检验: 如果小概率事件在一次试验中居然发生, 我们就以很大的把握否定原假设.
《应用数理统计》第三章假设检验课后作业参考答案

第三章 假设检验课后作业参考答案3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。
假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。
已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响?(01.0=α)解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36/06.064.261.2/u 00-=-=-=nX σμ(3)否定域⎭⎬⎫⎩⎨⎧>=⎭⎬⎫⎩⎨⎧>⋃⎭⎬⎫⎩⎨⎧<=--21212αααu u uu u u V (4)给定显著性水平01.0=α时,临界值575.2575.2212=-=-ααuu ,(5) 2αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000X 950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.3某厂生产的某种钢索的断裂强度服从正态分布()2,σμN ,其中()2/40cm kg =σ。
现从一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(2/cm kg )。
设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提高? 解:(1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13/4020/u 00==-=nX σμ (3)否定域{}α->=1u u V(4)给定显著性水平01.0=α时,临界值33.21=-αu(5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。
第三章 假设检验

近似服从标准正态分布N(0,1)。
给定小概率 ,查附表1可得
u
2
P{U u }
2
,使
即
上式中花括号内是小概率事件。
m p0 n P{ u } p0 1 p0 2 n
m 进行一次抽样后得到子样废品率 的数值, n
如果使上面小概率事件发生,那么拒绝假设 H0 ,否则接受H0 。这就是说,若
10
假设H0 ,即能化。这 个例子的目的是要检验正态母体的平均数。 2 2 2 假定母体X的分布是 N , ,且 0 2 ( 0 是已知数)。在母体上作 假设H0 : 0 0是已知数 u 给定 ( 是小概率),查附表1可得 2 进行一次抽样后获得子样平均值 x 。若
1 2
n1 n2 2 的t分布,其中
1 1 * S n1 n2
S
*
n1 1S
给定显著水平 ,由附表2可得 t n1 n2 2 2 使 P{T t n1 n2 2} 即
P{ X1 X 2
2
n2 1S n1 n2 2
x 0 u
2
0
则拒绝假设H0 ,即不能认为母体平均数 0 0 若 x u
0
n n
则接受假设H0 ,即可认为母体平均数是 0
2
例2 某种产品在通常情况下废品率是5%, 现从生产出的一批中随意地抽取50个,检验 得知有4个废品,问能否认为这批产品的废 品率为5%?(取小概率 =5%) 母体X的分布是二点分布B(1,p),即 P{X=1}=p, P{X=0}=1-p 在母体上作 假设H0 :p=p0(取 p0=0.05) 2 p0 (1 p0 ) E X p0 , D X n n m p0 故 U n p0 1 p0
第三章 4 假设检验的基本原理与步骤A版

假设检验的基本原理和步骤●某一样本均数是否来自于某已知均数的总体?●两个不同样本均数是否来自均数不相等的总体?要回答这类问题:----参数估计----假设检验(hypothesis test)假设检验过去称显著性检验。
它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。
然后在H0成立的条件下计算检验统计量,最后获得P值来判断。
例1某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。
问从事铅作业工人的血红蛋白是否不同于正常成年男性的均数140g/L?本例:μ=140g L,X=130.83g Lμ?①单纯抽样误差造成的(μ=μ0);造成X≠μ0的情况有二:②抽样误差和本质异造成的(μ≠μ0)。
假设检验的目的就是判断差别是由哪种情况造成的。
男性铅作业工人血红蛋白μ=140g/L一种假设H 0:μ=μ0男性铅作业工人血红蛋白μ≠140g/L另一种假设H 1:μ≠μ0 X=130.83 g L 抽样误差抽样误差总体不同1.建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设又称零假设,记为H0;(2)备择假设又称对立假设,记为H1。
对于检验假设,须注意:①检验假设是针对总体而言,而不是针对样本;②H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可;③H1的内容直接反映了检验单双侧。
若H1中只是μ>μ0或μ<μ0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
例如表1 样本均数(代表未知总体均数μ)与已知总体均数μ比较的t 检验目的H0H1双侧检验单侧检验是否μ≠μ0是否μ>μ0是否μ<μ0μ=μ0μ=μ0μ=μ0μ≠μ0μ>μ0μ<μ0表2 两样本均数(分别代表未知总体均数μ1与μ2)比较的t 检验目的H0H1双侧检验单侧检验是否μ1≠μ2是否μ1>μ2是否μ1<μ2μ1=μ2μ1=μ2μ1=μ2μ1≠μ2μ1>μ2μ1<μ2④单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。
第3章 一元回归模型:假设检验

ui ~ N (0, )
2
回顾:正态分布由来
高尔顿钉板
回顾:正态分布由来
高尔顿钉板
回顾:正态分布的平均值和方差
第327页
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
问:随机误差项
答:使用残差项
se(b2 ) var(b2 )
u i 的方差 2 不知道怎么办?? ei 的方差来估计随机误差项的方差:
EViews 回归结果
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
高斯-马尔科夫定理:
如果满足古典线性回归模型的基本假定,则OLS 估计量是最优线性无偏估计量(Best Linear Unbiased Evaluation , BLUE)。
3.1 古典线性回归模型的基本假定
二、对随机误差项
u i 的假定:
5. 解释变量与随机误差项不相关。
cov(ui , X i ) 0
6. 随机误差项之间不相关(无自相关、无序列相关)。
cov(ui , u j ) 0
i j i, j 1, 2,..., n
回顾:变量间的相关性
相关系数
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
1. 线性: b1和b2是线性估计量,即它们是Y的线性函数:
b1 Y b2 X
x y ( X X )(Y Y ) b x (X X ) X Y nXY X nX
i i i i 2 2 i 2 i i i 2 i 2
第三章 假设检验

小概率原理中,关于“小概率”的值通常根据实际问 题的要求而定,如取α=0.1,0.05,0.01等, α为检验的显著性水平(检验水平). 在假设检验过程中,描写(条件)小概率事件的统计 量的取值范围称为该原假设的否定域(拒绝域), 否定域的边界称为该假设检验的临界值.
φ(x)
α/2
- zα/2 否定域 zα/2
P 犯第一类错误 =P 当H 0为真拒绝H 0 =a
另一方面,当H0为不真时,样本观测值也可能不落入拒绝域, 此时致使我们作出接受H0的错误决策(纳伪). 这种错误称为第 二类(type II error)错误,犯第二类错误的概率常记为 ,即
P 犯第二类错误 =P 当H 0为假接受H 0 =
六、假设检验与区间估计的联系
§3.2 单个正态总体参数的假设检验
双侧假设检验的拒绝域见图.
那么,如何判断原假设H0 是否成立呢? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中几乎不会发生 .
在假设检验中,我们称这个小概率为 显著性水平,用a表示. (significance level) 的选择要根据实际情况而定。 常取
现在回到我们前面灯泡寿命的例中: 在提出假设 H0: 由于 已知,取 ~ N(0,1) 当H0为真时, ~ N(0,1) 对给定的显著性水平a,可以在N(0,1)表中查到 分位数的值 ,使 = 1600; H1:≠1600后,
故不能拒绝H0 . 没有落入 拒绝域
二、假设检验的步骤 (1)根据问题的要求提出原假设 H0和备择假设H1;
以例2为例进行分析总结 (1)提出假设
H0:=0=32.5;H1:≠0
(2)在 H0为真时选取检验统计量并 (2)在H0为真时构造统计量并 确定其分布; 确定其分布 (3)对给定(或选定)的显著性水平 α,构造小概率事件,确定拒绝域 (3)对于给定的显著水平a=0.01, 由P{|t|>t0.01/2(5)}=0.01, (4)计算统计量的观测值; 推断:当统计量的值落入 拒绝域,就拒绝H0; 否则就接受H0. 得拒绝域W={|t|>4.0322} (4)计算统计量的观测值 做出推断 由于|t|=2.997≤4.0322.所以接 受H0.
第三章 差异分析与假设检验

(2)两两比较。如果研究者对因素的所有水平“同等 无知”,在发现水平之间存在差异后,可以做两两比 较,找出a(a-1)/2个成对均值之间的差异是否显著。多 个均值的两两比较不宜直接两两作t检验。多重比较不 限于在F检验之后进行,只要对多个均值进行两两比较, 都应当使用多重比较的方法。两两比较式要检验如下 一组假设: H0: μi-μj=0;i>j=1,……,a-1 常用的检验方法有最小显著差数法(LSD),Duncan 多范围检验、q检验法(SNK)、Turkey法等,研究者 可以同时选用多种方法对比检验结果。
社会心理学家要比较三种宣教方式如何 影响大学生对反恐战争的态度。随机选 取90名学生,并将它们分成三组。在对 他们进行三种不同宣传后,纸笔测验他 们对待战争的态度。用ANOVA检验三 种宣传方式对学生态度的影响。方差分 析结果如下:
来源
平方和
df
均方
F
p
宣传方式
误差
180.10
438.50
2
87
一项研究“学生对文章内容的不同预期对英文 阅读理解的影响”的实验,“不同预期”在文 章中具体表现为“不同类型标题提示”(因素 A),有三个水平:正确标题提示、中性标题 提示、误导标题提示。被试是同一个学院6个 专业的大一学生,每个专业6人并被随机分成3 个组,每组2人阅读一种类型标题提示的文章。 考虑到不同专业学生的英文程度可能不同,所 以将专业作为区组。
为什么统计上显著的结果可能在理论上 和实际应用中都没有意义? 简要描述F检验的原理。 重复测量ANOVA和独立组ANOVA的主 要差异是什么? F检验和两个平均数比较有什么差异? 简单主效应和总体主效应之间有什么差 异?
第三章总体均数的估计和假设检验

本例自由度n-125-124,查附 表2,得单侧t0.05(24)=1.711。
今tt0.05(24),故P0.05,无统
计学意义,按0.05水准,不
拒绝H0,根据现有样本信息,尚 不能认为该山区成年男子平均 每分钟脉搏数高于一般成年男 子。
第一节 均数的抽样误差 和总体均数的估计
统计推断(statistical inference):
推断
样本
总体
(1)参数估计 (2)假设检验
一、均数的抽样误差:在统计学上
把由抽样造成的样本均数与总体均 数间的差异或各个样本均数间的差 异统称为均数的抽样误差。
性质: (1)原分布正态
原分布偏态
新分布正态
例3.4 次/min
对一个样本均数与一个已知的或 假设的总体均数0作比较,它们之间 差别可能有两种原因造成:
–由于抽样误差所致,
–由环境的原因,两个总体均数 间有本质差异。
一、建立检验假设和确定检验水准
(一)假设 假设有两个:
–无效假设(null hypothesis), 符号为H0,又称检验假设。 记为H0:μ=μ0 或μ-μ0=0
理进行区间估计)。
对上式进行变换,可得置信度为1-α
的总体均数可信区间的通式为:
习惯将上式写成:
若取1-α=0.95,则为总体均数95%可 信区间,或取1-α=0.99.则为总体均 数99%可信区间。
(二)σ已知 (按正态分布原理)
(三)σ未知但n足够大(n>50) (按正态分布原理)
常用u值表 参考范围(%)
新分布近似正态
(2)原分布 x~N(μ,σ2)
新分布 ~N(μ, )
原分布 x~N(155.4,5.32)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 假设检验3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1,n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1:nx2=x2+(x(1,i)-x1)^2;endx2=x2/n;S=sqrt(x2);0101102: 3.25 H :t 3.252, S=0.0117, n=50.3419H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.995120 V=t>t (1)0.01,(4) 4.6041, 3.25n t t tH ααα-⎧⎫-⎨⎬⎩⎭==<∴本题中,接受认为这批矿砂的镍含量为。
3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S ==2N(,),μσ设总体为正态分布试在水平5%检验假设:0101() H :0.5% H :0.5%() H :0.04% H :0.0.4%i ii μμσσ≥<≥<{}0.95()0.452% S=0.035%-4.1143(1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。
取检验统计量为X 本题中,代入上式得: 0.452%-0.5%拒绝域为:V=t >t 本题中,01 4.1143H <=∴t 拒绝{}22200222212210.952()nS S 0.035% n=10 0.04%100.035%7.65630.04% V=(1)(1)(9)16.919ii n n ααμχσσχχχχχχ--===*==>--==2构造统计量:未知,可选择统计量本题中,代入上式得:()()否定域为:本题中, 210(1)n H αχ-<-∴接受3.8用重量法和比色法两种方法测定平炉炉渣中2SiO 的含量,得如下结果重量法:n=5次测量,120.5%,0.206%X S == 比色法:n=5次测量,221.3%,0.358%Y S == 假设两种分析法结果都服从正态分布,问 (i )两种分析方法的精度σ()是否相同? (ii )两种分析方法的μ均值()是否相同?0.01α=() 解:(i )121122121221212121211H : H :n (1) F=n (1)H FF 11(11)(11)V H 0.015, n S n S n n n n n n n αασσσσα-=≠----⎧⎫⎧⎫----⎨⎬⎨⎬⎩⎭⎩⎭==00220提出原假设:对此可采用统计量在下,(,),我们可取否定域为V=F<F ,F>F ,此时 P()=本题中,111 x 20.5%, S =0.206% 5, y 21.3%, S =0.358%n ===212122120.0050.9950.0050.995n (1)5(51)0.206%F=0.3311n (1)5(51) F 0.0669 F F F H n S n S -*-*==-*-*=∴220代入上式得:()(0.358%)1(5,5)=14.94(5,5)=14.94由于 (5,5)<F<(5,5)接受即无明显差异。
(ii)1202122222121112012H H :(11() ()H 2 V=n n i ii i X Y S X X S Y Y n n t n n t μμμμσ===≠=-=-+-∑∑11提出假设::这种未知的场合,用统计量其中在成立时,服从自由度为的分布。
否定域为:12121111t ((2))V H 0.015, x 20.5%, S =0.206% 5, y 21.3%, S =0.358%t n n n n X Y αα-⎧⎫>+-⎨⎬⎩⎭======0此时 P()=本题中,代入上式得:120.9951-2121-20 =-3.8737t (2)t (8) 3.3554t(2),n n t n n H αα+-==>+-∴拒绝即差距显著。
3.9设总体116(,4),,,XN X X μ为样本,考虑如下检验问题:{}{}01123:0 H :1() =0.05 V ={2X -1.645}V = 1.502X 2.125V =2X 1.962X 1.96(ii)H i μμα==-≤≤≤≤-≥试证下述三个检验(否定域)犯第一类错误的概率同为或通过计算他们犯第二类错误的概率,说明哪个检验最好?解:{}{}{}{}00.97512012()0.050.05:02*1.960.052 1.64502 1.645 1.645( 1.645)1(1.645)=1-0.95=0.05V 1.502 2.i P x V H X U U H X V X X P X P X ααμσμσ-=∈=⎧⎫-⎪⎪=>==⎨⎬⎪⎪⎩⎭=∴>==≤-⎧⎫⎪⎪-⎪⎪≤-=≤-=Φ-=-Φ⎨⎬⎪⎪⎪⎪⎩⎭=≤≤即,P U 这里P {}{}{}{}{}{}203301110125 1.50 2.120(2.215)(1.50)0.980.930.052 1.962 1.962 1.96 1.96P(V H )=1-P 2 1.962(1(1.96))0.05ii :2 1.645X P V H V X X X X H V X σββ⎧⎫⎪⎪-⎪⎪=≤≤⎨⎬⎪⎪⎪⎪⎩⎭=Φ-Φ=-=⎫⎪⎪=≤-≥=≥=≥⎬⎪⎪⎭<=-Φ=X ≥-或()犯第二类错误的概率 =P -V =P {}1μ=-{}{}223310.3551(0.355)0.36:1 1.502 2.12511 4.125:2 1.96110.04 3.96V P X V P X σβμσβμσ⎧⎫⎪⎪+⎪⎪≥=-Φ=⎨⎬⎪⎪⎪⎪⎩⎭=-≤≤=-⎧⎫⎪⎪+⎪⎪≤≤⎨⎬⎪⎪⎪⎪⎩⎭ΦΦ=≤=-⎧⎫⎪⎪+⎪⎪≤≤⎨⎬⎪⎪⎪⎩⎭X =P X =1-P 3.50 =1-(4.125)+(3.50) =1X =P ⎪ΦΦ∴11 =(3.96)-(0.04)=0.99996092-0.516=0.48396092V 出现第二类错误的概率最小,即V 最好。
3.10 一骰子投掷了120次,得到下列结果:问这个骰子是否均匀?(0.05)α= 解:22i 122i 11:620()()20i ki i i ki i i P n np np n np np χχχ====-=-+++==∑∑0i 2222本题原假设为: H i=1,2,,6这里n=120,nP 本题采用的统计量为Pearson 统计量即, 代入数据为:(23-20)(26-20)(15-20)=4.82210.9521k-15k-1H ααχχχχ--<20()=()=11.071由于 () 所以接受即认为这个是均匀的。
3.11 某电话站在一小时内接到电话用户的呼唤次数按每分钟记录的如下表:试问这个分布能看作为泊松分布吗?α(=0.05) 解:{}{}{}{}0221122222233224H :()!81610X n 01*6*7*260606060200.13530!212*0.27071!222*0.27072!23 1.5*0.23!k e P x k k p e P P X e e P P X e e P P X e e P P X e λλλλλ-∧∧--------=====*+++++=====================0检验问题为: 参数为已知的最大似然估计 {}{}{}{}{}4225522662278222221030224*0.09024!3245* 0.03615!15246* 0.01206!457160()(860*0.1353)(1660*0.2707)(160*0.0120)60*0.135360*0.270760*0ki i i i e P P X e e P P X e e P P X e P P X P X n np np χ------=================≥=-≤=----==+++∑.01200.6145=(下面为MATLAB 编程计算程序。
)21210k-1k-1,H ααχχχχ--<∴20.952由于()=(5)=11.071()接受即分布可以看作为泊松分布。
n=60;p=zeros(1,7);p=[exp(-2) exp(-2)*2 exp(-2)*2 exp(-2)*1.5 exp(-2)*(2/3) exp(-2)*(4/15) exp(-2)*(8/90)]; nn=zeros(1,7);nn=[8 16 17 10 6 2 1]; sum=0; for i=1:7sum=sum+((nn(1,i)-n*p(1,i))^2)/(n*p(1,i)); end sumsum = 0.61453.13从一批滚珠中随机抽取了50个,测得他们的直径为(单位:mm ): 15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.3 15.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.9 15.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.8 15.2 15.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.5 15.1 15.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2 是否可认为这批滚珠直径服从正态分布?(0.05)α= 解:2123(),H :()()H 0.1833()(-1.1163)0.13210.428214.815.078p ()(-1.1163)(-0.6492)(-1.1163)0.12600.4282p X F x x F x p μσμσμσ-=Φ==Φ=Φ=-=Φ-Φ=Φ-Φ==Φ020设为滚球的直径,其分布函数为则检验问题为在成立的条件下,参数,的最大似然估计为=15.078,14.6-15.07815.115.078()(-0.6492)(0.0514)(-0.6492)0.26240.4282--Φ=Φ-Φ=4512340.952015.415.078p ()(-0.6492)(0.7520)(0.0514)0.25350.4282p 10.2260k-m-12k-m-1,p p p p H ααχχχχ-=Φ-Φ=Φ-Φ==----=<∴221-21-()=()=5.991()=5.991接受认为滚珠直径服从正态分布。