研究生数理统计课件第4章假设检验(2)

合集下载

概率论与数理统计课件:假设检验

概率论与数理统计课件:假设检验

假设检验
首页 返回 退出
五、假设检验的两类错误
由于样本具有随机性,因此,当我们利用样本判断时, 可能会犯两类错误:
所作决策
真实情况
(未知)
样本未落入拒绝域 样本落入拒绝域
接受H0
拒绝H0
H0为真
正确
第一类错误
H0不真
第二类错误
正确
第一类(弃真): 第二类(取伪):
假设检验
P{拒绝H0|H0为真}= , P{接受H0|H0不真}= .
(α=0.05)
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
Z X 0 ~ N (0,1) / n
假设检验
首页 返回 退出
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
由样本数据计算,得 x 100.104 计算统计量Z的观测值,得
Z 100.104 100 0.658 1.96 0.5 / 10
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
要检验的假设为
H0 : 100, H1 : 100
(2)未知σ2 ,选择检验统计量
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
例2 某厂生产的固体燃料推进器的燃烧率服从正态分 布X~N(40,22),现在采用技术研发部设计的新方法 生产了一批推进器,随机测试25只,测得燃烧率的 样本均值为 x 41.25 ,假设在新方法下σ=2,问用 新方法生产的推进器的燃烧率是否有显著的提高?

概率论和数理统计假设检验课件

概率论和数理统计假设检验课件

随机变量的分类
随机变量的分布函数
描述随机变量取值范围的函数,其值 域为[0,1]。
离散型随机变量和连续型随机变量。
数理统计基础
参数估 计
参数估计的概念
参数估计是根据样本数据 推断总体参数的过程。
点估计
通过样本数据直接得到一 个具体的数值作为总体参 数的估计值。
区间估计
根据样本数据计算出一个 区间,该区间包含总体参 数的可能性较高。
假设检验与回归Байду номын сангаас析的比较
目的和方法不同
假设检验的主要目的是判断一个 或多个零假设是否成立,而回归 分析是通过建立数学模型来描述
因变量和自变量之间的关系。
应用场景不同
假设检验常用于检验关于参数的 假设是否成立,而回归分析则广
泛应用于预测和解释数据。
侧重点不同
假设检验侧重于参数的点估计和 推断,而回归分析侧重于描述和
详细描述
在两独立样本的假设检验中,我们需要确保两组样本是相互 独立的,然后使用适当的统计量来比较两组样本的平均值或 比例。常见的两独立样本假设检验包括t检验、Z检验和卡方 检验等。
两相关样本的假设检验
总结词
两相关样本的假设检验是用来比较两个相关样本的平均值或比例是否相等。
详细描述
在两相关样本的假设检验中,我们需要确保两组样本是相关的,然后使用适当的统计量来比较两组样本的平均值 或比例。常见的两相关样本假设检验包括配对t检验和威尔科克森符号秩检验等。
预测变量之间的关系。
习题与思考题
基础概念题
题目1
假设检验的基本概念是什么?请 简述其步骤。
题目4
什么是第一类和第二类错误?如 何避免它们?
题目2

数理统计之假设检验ppt课件

数理统计之假设检验ppt课件

z2 z0.025 1.96;
x0
575.2570
5.2 102.0551.96
n 8 10
8
这说明小概率事件竟在一次试验中发生了,
故拒绝H0,可以接受H1。 即认为折断力大小有差别
完整版PPT课件
15
已知 X~N(,2), 2 已知,检验假设
H 0: 0 H 1: 0的过程分为六个步骤:
由样本算得 x543.5, s27.582 查表 t2(n1)t0.02 (4 5)2.776 这里 |t||543549|1.77t0.02(54)2.776
7.58/ 5 接受H0。新罐的平均爆破压力与过去无显著差别。
完整版PPT课件
31
例6 某工厂生产一种螺钉,标准要求是长度是32.5毫米,
假设的决定。 ❖ 基本思想(规则或前提)
小概率事件在一次试验中几乎不会发生。
完整版PPT课件
4
带概率性质的反证法 通常的反证法设定一个假设以后,如果出现的 事实与之矛盾,(即如果这个假设是正确的话,出现 一个概率等于0的事件)则绝对地否定假设.
带概率性质的反证法的逻辑是: 如果假设H0是正确的话,一次试验出现一个 概率很小的事件,则以很大的把握否定假设H0.
❖ 2 在H0成立的前提下,选择合适的统计量,这个统 计量要包含待检的参数,并求得其分布;
❖ 3 给定显著性水平 ,按分布写出小概率事件及其
概率表达式;
❖ 4 由样本计算出需要的数值;
❖ 5 判断小概率事件是否发生,是则拒绝,否接受
完整版PPT课件
9
二 单个正态总体参数的假设检验
一、总体均值 的假设检验
2
z x
2
完整版PPT课件

数理统计课件4假设检验

数理统计课件4假设检验
斤。设实际袋重服从正态分布,且=0.015。某天开工后,随机抽取9 袋,称得净重为 0.497 0.560 0.518 0.524 0.489 0.511 0.510 0.515 0.512 问包装机的工作是否正常。
思考:怎样算是 “包装机的工作正常”?
各袋重量允许有误差,但平均袋重应当稳定在额定标准!
偏差 X 0 应很小。
反映出每次包装的重量不尽相同
如果 X 0 过分大,则有理由 怀疑H0的正确性从而拒绝H0
当H0为真时,
取 统 计 量U

X 0~ n
N (0,1)
U 应很小
{U Z }应是一个小概率事件,
2
P{U Z }
2
6
比如取=0.05,就有 P{ U 1.96} 0.05
有理由认为包装机工作不正常。
概率反证法:如果小概率事件在一次试验中竟然发生了,
我们就 以很大的把握 否定原假设。
7
原假设 二、常用的术语
备择假设 引例
解: 今假设H我0 :们=一0=起0.5来, 看且引记H例1 :的≠0=0.5,
当H0为真时, 由于解X~题N(过0,程2),故
X ~ N (0, 2 n)
概率()很小的事件{|U|≥1.96}发生了 拒绝H0
X
U





Z
Z
2
2
9
“纳伪”错误:当H0为假时,因样本的统计量的观察值落入接
受域,按此方法,H0 被接受。
“纳伪”错误发生的概率为 ?
注: ≠1-.
通常记为 ,即 P{接受H0|H0为假}= 。
难计算!!
U

Z

假设检验《统计学原理》课件

假设检验《统计学原理》课件
图b
X=X1>X0
H0为伪
从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小 α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而 β变小,即若减小β错误,也会增大犯α错误的机会,
a 错误和 错误的关系
在样本容量n一定的情况下,假设检验不能同时做到犯α和 β两类错误的概率都很小,若减小α错误,就会增大犯β错误 的机会;若减小β错误,也会增大犯α错误的机会,要使α和 β同时变小只有增大样本容量,但样本容量增加要受人力、 经费、时间等很多因素的限制,无限制增加样本容量就会 使抽样调查失去意义,因此假设检验需要慎重考虑对两类 错误进行控制的问题,
参数假设检验举例
例2:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要 求,这时需要进口商对供货商的说法是否真 实作出判断,进口商可以先假设该批钢筋的 平均拉力强度不低于2000克,然后用样本的 平均拉力强度来检验假设是否正确,这也是 一个关于总体均值的假设检验问题,
假设检验的两类错误
正确决策和犯错误的概率可以归纳为下表:
假设检验中各种可能结果的概率
H0 为真
接受H0
1-α 正确决策
拒绝H0,接受H1
α 弃真错误
H0 为伪
β 取伪错误
1-β 正确决策
•假设检验两类错误关系的图示
以单侧上限检验为例,设H0 :X≤X0 , H1:X>X0
图a X≤X0 H0为真
a
H0值
样本统计量 临界值
观察到 的样本 统计量
5、假设检验的两类错误
根据假设检验做出判断无非下述四种情况:
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误, 假设检验是依据样本提供的信息进行判断,有犯错误的可 能,所犯错误有两种类型: 第一类错误是原假设H0为真时,检验结果把它当成不真而 拒绝了,犯这种错误的概率用α表示,也称作α错误 αerror 或弃真错误, 第二类错误是原假设H0不为真时,检验结果把它当成真而 接受了,犯这种错误的概率用β表示,也称作β错误 βerror 或取伪错误,

研究生应用数理统计假设检验

研究生应用数理统计假设检验

时,随机地抽取10块地,测得每块旳实际亩产量为 x1, x2 , , x10
计算出 x
1 10
10 i 1
xi
320 公斤,假如一直早稻产量 X
服从正态
分布 N (,122 ) ,试问所估产量是否正确?
解:因为亩产量X N (,122 ), 0 310 ,故可产生两个假设:
H0 : 0 310, H1 : 310
定义 检验的p值 设原假设为H0,T是检验 统计量,其观测值为t,H0的拒绝域为W , 则称如下定义的p值为原假设H0的检验的p值. 若W {T :T c},则p P{T t H0为真} 若W {T :T c},则p P{T t H0为真} 若W {T : T c1或T c2},则
pi P( X Ai )
当H0成立时, 2的渐近分布(关于n)是自由度为k -1的 2分布
k
,即lim P(
(ni npi )2 x)
x 2 (t; k 1)dt.其中k是分组的
n i1
npi
组数.
注:
(1)该检验方法称为 2拟合优度检验.
(2)统计量 2的定义与样本空间S的划分有关.只有当
P{ | U | u1- } . 2
2. 2未知 U = X 0 N (0,1)
S/ n
3.设X1,
, X n1是取自总体X
~
N
(
1,
2 1
)的样本,Y1,
,
Yn

2
取自总体Y
~
N
(
2
,
2 2
)的样本,X,Y相互独立,检验假设
H0 : 1 2 ,H1 : 1<2.
(1)
2 1

第4章抽样误差与假设检验ppt课件

第4章抽样误差与假设检验ppt课件

治疗前后血清甘油三酯疗效的无效假设和备择假
设分别为
H : 0
0
d
H : 0
1
d
检验水准 是预先规定的拒绝域的概率值,实
际中一般取 0.05 。
[说明] :备择假设有双侧和单侧两种情况。双侧
检验指不论正方向还是负方向的误差,若显著地超出
检验水准则拒绝H0,H1
:
μ d
0即为双侧检验;单侧
检验指仅在出现正方向或负方向误差超出规定的水准
第一节 均数的抽样误差与标准误
一、均数的抽样误差
在医学研究中,绝大多数情况是由样本信息研 究总体。由于个体存在差异,因此通过样本推论 总体时会存在一定的误差,如样本X均数 往往不 等于总体 均数 ,这种由抽样造成的样本均数与总 体均数的差异称为抽样误差。对于抽样研究,抽 样误差不可避免。
二、抽样误差的分布
对上面问题可以作如下考虑:
治疗前后甘油三
酯的变化(差值)
d
样本
n 30 S 0.76 d 1.38 d
0? d
问题归纳: 样本疗效
药物作用 + 机遇
d 1.38
μ 0? d
问题:| d 0 | 究竟多大能够下“有效”的结论?
假定治疗前后血清甘油三酯检测结果的差值服从正态分
布,若 H : 0 则 t d 0 服从t 分布。
上限: X u/2.SX 4.77 1.96 0.38/ 140 4.83(1012 / L)
ቤተ መጻሕፍቲ ባይዱ
三、模拟实验
模拟抽样成年男子红细胞数。设定:
4.75, 0.39,n 140
产生100个随机样本,分别计算其95%的可信区间, 结果用图示的方法表示。从图可以看出:绝大多数 可信区间包含总体参数 4.75 ,只有6个可信区间 没有包含总体参数(用星号标记)。

概率论与数理统计课件:假设检验的基本概念

概率论与数理统计课件:假设检验的基本概念
件下, 已經觀測到的樣本資訊出現的概率.
如果這個概率很小, 這就表明一個概率很小的事件 在一次試驗中發生了. 而小概率原理認為, 概率很 小的事件在一次試驗中是幾乎不可能發生的, 也就 是說導出了一個違背小概率原理的不合理的現象.
這表明事先的設想H0是不正確的, 因此拒絕原假 設H0. 否則, 不能拒絕H0.
假設檢驗分為參數檢驗和非參數檢驗,本章4.2-4.5屬 於參數假設檢驗,4.6-4.9屬於非參數檢驗。
H0 : 0 H1 : 0
0
0
H 0 : p p0 H1 : p p0
p p0
p p0
H0
: 2
20
H1
:
2
2 0
4.2 任意总体(大样本) 正态总体(方差已知,方差未知)
假設檢驗 假設 μ = 0.5 X ~ N (0.5, 0.0152 )
H1
μ < 0.5
H0
μ = 0.5
X - 0.5 ~ N (0,1) 0.0152
9
H1
μ > 0.5
X 0.5
X 0.5
X 0.5
X - 0.5 0.0152
0
Ua
9
a
2
X - 0.5 0 Ua 0.0152
9
1a
4.3 大样本
同学练习
假設檢驗
H0 : 1 2 H1 : 1 2
1 2
1 2
H0 :W1 W2 H1 :W1 W2
W1 W2
W1 W2
H0
:
2 1
2 2
H1
:
2 1
2 2
4.4.1 任意两总体(大样本)
两个正态总体

第四章 假设检验 《数理统计学》PPT课件

第四章  假设检验  《数理统计学》PPT课件

4.2.3 用p值作判断
表4.2.2对4个不同的显著性水平α分别列出相应的拒绝域和所 下的结论。
4.2.3 用p值作判断
定义4.2.1 在一个假设检验问题中,拒绝原假设H0的最小显 著性水平称为p值。
利用p值和给定的显著性水平α可以建立如下判断法则:
● 若α≥p值,则拒绝原假设H0; ● 若α<p值,则接受原假设H0。 例4.2.4 任一检验问题的p值可用相应检验统计量的分布(如标准正 态分布、t分布等)算得。
由样本到总体的推理称为统计推断。英国统计学 家R.A.费希尔认为常用的统计推断有三种基本形式, 它们是
● 抽样分布; ● 参数估计,又可分为点估计与区间估计; ● 假设检验,又可分为参数检验与非参数检验。 其中抽样分布与参数估计在前几章已有叙述,今后 还会不断补充。从这一章开始将叙述假设检验,并讨 论假设检验与区间估计,确定样本量之间的关系。
假设检验是统计学中最具特色的部分,其统计味甚浓。 从建立假设,寻找检验统计量,构造拒绝域(或计算p值), 直到最后作出判断等各个步骤上都能体现多种统计思想 的亮点。假设检验的思维方式也独具一格,从其他数学 分支学不到这种判断问题的思路。不犯错误、不冒风险 的判断是不存在的,问题在于设法控制犯错误的概率。
4.1.3 势函数
定义4.1.2 设检验问题
H0: θ∈Θ0, H1: θ∈Θ1 的拒绝域为W,则样本观察值x=(x1,x2,…,xn)落在拒绝域 W内的概率称为该检验的势函数,记为
g(θ)=Pθ(x∈W), θ∈Θ0∪Θ1⊂Θ
(4.1.8)
例4.1.3 某厂制造的产品长期以来不合格品率不超过0.01。 某天开工后,为检验生产过程是否稳定,随机抽检了 100件产品,发现其中有2件不合格品。试在0.10水平 上判断该天生产是否稳定。

假 设 检 验

假 设 检 验
第一节 影响客车空调系统噪声的主要因素及其噪声控制的基本方法
一、客车空调系统数值模拟仿真的意义
客车车室内部的空气品质是衡量乘坐舒适性的一个重要指标。 车内空气质量的优劣和热舒适性的好坏,不仅直接影响乘客的乘坐感受,还影响乘 员的身体健康。 车内空气环境研究的重点是对空气分布的研究,只有掌握了车内空气流速、温度、 湿度、洁净度等的时空分布,才能准确地对车内空气品质进行预测和评价。 传统的汽车空调系统试验(主要指轿车)利用样机或实车在风洞或环境模拟实验室 内完成,既费时又耗资巨大,且对不同方案试验很不方便,极大影响了新产品的开发周 期。
对于正态总体提出数学期望等于0 的假设等.
假设检验就是根据样本对所提出的假设作出判断: 是接受, 还是拒绝. 假设检验问题是作出这一决策的过程.
4.1 假设检验的基本概念
假设检验的推理方法及其基本原理 推理方法: 带有某种概率性质的反证法。 其基本原理就是 人们在实际问题中经常采用的所谓实际推断原理: 小概率事件在一次试验中几乎是不可能发生的. 下面结合实例来说明假设检验的基本思想.
目前,国际上常见的商业化 CFD 通用软件有: FLOTRAN、CFX、FLUENT、NUMECA、 PHOENICS、STAR-CD 等。
第十章 计算流体动力学在客车空调系统设计中的应用
第一节 影响客车空调系统噪声的主要因素及其噪声控制的基本方法
二、CFD的研究进展及CFD软件
1. FLUENT
第十章 计算流体动力学在客车空调系统设计中的应用
计算流体动力学(Computational Fluid Dynamics,CFD)作为流体力学的一个
分支,是近代流体力学、数值数学和计算机科学结合的产物,是一门具有强大生命力的 边缘学科。它以电子计算机为工具,应用各种离散化的数学方法,对流体力学的各类问 题进行数值实验、计算机模拟和分析研究,以解决各种实际问题。

《统计假设检验》PPT课件

《统计假设检验》PPT课件

两均数差异越大,β值越小。
精选ppt
18
如何选择合适的α值
若一个试验耗费大,可靠性要求高,不允许反复,那么α值 应取小些;当一个试验结论的使用事关重大,容易产 生严重后果,如药物的毒性试验,α值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将α 值放宽到0.1,甚至放宽到0.25。
在提高显著水平,即减小α值时,为了减否定小域犯Ⅱ型错误的概 否率定,域可适当增大接样受本域含量。增大样本含量可以同时降 低犯两类错误的可能性。
精选ppt
17
意两 图类
错 误 示
两类错误间的关系:
如图所示,图中左边曲线是H0为真时,x1 x2的分布密度曲
线;右边曲线是HA为真时,x1 的x2分布密度曲线( 1) 2
犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差 异大小等因素有关:
当α值变小时, β值变大;反之亦然,也就是说Ⅰ型 错误α的降低必然伴随着Ⅱ型错误β的升高 ;
精选ppt
3
第一节 显著性检验的基本原理
一、显著性检验的意义
二、两种假设
三、显著水平与两类错误
四、双侧检验与单侧检验
五、显著性检验的基本步骤
精选ppt
4
一、显著性检验的意义
(一)为什么要进行显著性检验? 例1
某实验要求实验动物平均体重μ=10.00g, 现有
实验动物10只,平均体重 =x 10.23g, 已知总体
n
10
4.∵ HA: μ≠μ0,当∣u∣ >u0.025时拒绝H0 查正态分布表得,u0.025=1.96。 5. 做出推断及生物学解释:
∵ ∣u∣ <u0.025 ,P>0.05, ∴接受H0:μ=μ0 ,即可以认为这10只动物抽自总

概率论与数理统计参数假设检验PPT课件

概率论与数理统计参数假设检验PPT课件

时,拒绝H0.
《概率统计》
返回
下页
结束
例3. 采用两种育苗方案作杨树的育苗试验,已知苗高的标准差
分别为σ1=20cm, σ2=18cm各取80株树苗作为样本,算得苗高样
本均值为:甲 x 6812 , 乙 y 5865
已知苗高服从正态分布,判断两种试验方案对平均苗高有无显著
差异(α=0.01)?
车床乙:1.11, 1.12, 1.18, 1.22, 1.33, 1.35, 1.36, 1.38
解:
H0
:
2 1
2 2
(
2 1
,
22分别为两台机床的方差)
选统计量
F
S12
S
2 2
~
F (9,7)
查表得 F 2 (9,7) F0.05 (9,7) 3.68
F1 2 (9,7) F0.95 (9,7) 1/ F0.05 (7,9) 0.304
H0: μ=μ0
H1: μ ≠ μ0
双侧检验
2)μ比μ0有无显著
H0: μ=μ0
H1: μ > μ0
右单侧检验
提高(增大)?
3)μ比μ0有无显著
降低(减少)?
(μ≤μ0) H0: μ=μ0
H1: μ < μ0
左单侧检验
(μ≥μ0)
要点:含等号“=”的作为原假设(这样做就是为了数学处理的方便).
《概率统计》
15 36
μ=μ0=70
显然统计量的值t = -1.4在接受域内,所以接受H0,即可以认 为全体考生平均分为70分.
《概率统计》
返回
下页
结束
例2. 一种元件,要求使用寿命不得低于1000小时,现在从一批这种元件中随 机抽取25件,测得其使用寿命的平均值为950小时,已知该元件寿命服从标准 差σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合 格.

数理统计基本概念与假设检验(doc 77页)

数理统计基本概念与假设检验(doc 77页)

数理统计基本概念与假设检验(doc 77页)数理统计与Matlab讲义宋向东目录第1章数理统计基本概念 (1)1.1 总体与样本 (1)1.1.1 简单随机样本 (1)1.1.2 有限总体的无放回样本 (3)1.2 统计量 (3)1.2.1 样本k阶矩 (3)1.2.2 顺序统计量 (4)1.2.3 经验分布函数 (4)1.3 三个常用分布 (6)1.3.1 2 分布 (6)1.3.2 t分布 (7)1.3.3 F分布 (8)第2章参数估计 (10)2.1 点估计 (10)2.1.1 无偏性 (10)2.1.2 有效性 (12)2.1.3 相合性 (12)2.2 区间估计 (13)2.2.1 单正态总体均值的置信区间 (13)2.2.2 单正态总体方差的置信区间 (14)2.2.3 两正态总体均值差的置信区间 (15)2.2.4 两正态总体方差比的置信区间 (15)第3章假设检验 (17)3.1 假设检验的基本概念 (17)3.2 正态总体参数的假设检验 (19)3.2.1 单正态总体均值的假设检验 (19)3.2.2 单正态总体方差的假设检验 (20)3.2.3 两正态总体均值的假设检验 (21)3.2.4 两正态总体方差的假设检验 (21)3.2.5 大样本非正态总体均值的假设检验 (22)3.3 三个常用的非参数检验 (23)3.3.1 符号检验 (23)3.3.2 Wilcoxon秩和检验 (25)3.3.3 Wilcoxon符号秩检验 (30)3.4 检验的功效函数 (32)3.5 总体分布的假设检验 (37)3.5.1 2 检验 (37)3.5.2 Kolmogorov检验 (40)第4章回归分析 (44)4.1 一元回归分析 (44)4.1.1 回归方程的计算 (44)4.1.2 回归方程的显著性检验 (45)4.2 多元回归分析 (48)4.2.1 多元回归方程的计算 (48)4.2.2 显著性检验 (49)4.2.3 逐步回归分析 (52)第5章方差分析 (57)5.1 单因素方差分析 (57)5.1.1 方差分析的基本概念 (57)5.1.2 单因素方差分析的计算 (60)5.1.3 单因素方差分析的多重比较 (65)5.2 双因素方差分析 (67)5.2.1 有重复实验的双因素方差分析 (67)5.2.2 无重复实验的双因素方差分析 (72)参考文献 (76)第1章 数理统计基本概念1.1 总体与样本总体:研究对象的全体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)若 H 0 中 X 的分布函数 F ( x) 不含未知参数.
记 为 X 的所有可能取值的全体,将 分为k个
两两互不相交的子集
A1 , A2 ,, Ak
以 f i (i 1,2,, k ) 表示样本观察值 x1 , x2 ,, xn
中落入 Ai 的个数,
=> 在n次试验中,事件 Ai发生的频率为 fi /n
4 u / 2 u051 0.05 / 50
1.96
| u | 0.0306 1.96 =>接受假设 H 0
=>可以认为这批产品的次品率为5%
2.总体均值的假设检验
2 X 1 , X 2 ,, X n 为 X 的样本, 设总体X 的均值为μ,方差为
另一方面,当H0为真时, 可以根据H0所假设的 X 的分 布函数来计算
pi P( Ai ).
选取统计量
fi hi pi n i 1
k
2
来度量样本与H0中所假设的分布的吻合程度,hi是 给定的常数。
如果选取 hi n / pi , 则上述统计量变成
( fi npi ) npi i 1
u s xy
*2 1
n2 100,
*2 2
u / 2 u0.025 1.96
=>拒绝原假设 H 0 ,
n2
/2
n1 s
n2
3.5849 1.96
即认为这两台机床加工的 轴承的平均椭圆度是不相同的.
4.5 非参数假设检验 1 分布拟合检验 设总体X的实际分布函数为F(x),它是未知的. X 1 , X 2 ,, X n 为来自总体 X的样本. 根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),
注意:运用 检验法检验总体分布, 把样本数据进
2
行分类时, (1)大样本, 通常取 n 50
ˆi 5 (2)要求各组的理论频数 npi 5 或 np
(3)一般数据分成7到14组. 有时为了保证各组
npi 5
组数可以少于7组
例1 孟德尔在著名的豌豆杂交实验中, 用结黄色 圆形种子与结绿色皱形种子的纯种豌豆作为亲本进 行杂交, 将子一代进行自交得到子二代共556株豌 豆, 发现其中有四种类型植株
2 1 2 2
近似地服从标准正态分布
2
2 2 *2 分别用 S *1 和 S 2 近似代替 1 和 2 ,
当n1和n2都充分大且原假设 H0 成立时,
U S X Y
*2 1
n1 S
*2 2
n2
仍近似地服从标准正态分布.
u s x y
*2 1
=>该假设检验问题的拒绝域为
由 9 : 3 : 3 : 1 的理论比例可知
9 p1 , 16
由n=556,得
3 p2 , 16
3 p3 , 16
1 p4 16
np1 312.75, np2 104.25
np3 104.25, np4 34.75
而 f1 315 ,
f 2 101 ,
2 k
解 设这两台机床加工的轴承的椭圆度分别为X,Y 且 1 E X , 2 E Y 检验假设 H0 : 1 2 , H 1 : 1 2 由于题目给出的两个样本都是大样本,因此该假设检验 问题的拒绝域为 u xy u
s
*2 1
n1 s
*2 2
现在 n1 200,
2 k
2
定理1 (皮尔逊)当H0为真且n充分大时, 统计量
2 ( f np ) i 2 i npi i 1 k
近似服从 (k 1) 分布.
2
由定理1, 若给定显著性水平α,则前述假设检验问 题的拒绝域为
2 2 (k 1)
(2)若H0中X 的的分布函数含有未知参数.
2 设总体 X的均值为 1 ,方差为 1 2 总体 Y的均值为 2 ,方差为 2
下求假设检验问题 H0 : 1 2 , H1 : 1 2 的拒绝域. 由中心极限定理知,当样本容量 n1和n2都充分大时,
U X Y 1 2
n1 n2
Y R


Y rr

yyR
yyrr
总计
(黄圆)(黄皱) (绿圆)(绿皱)
315株 101株 108株 32株 556株
试问这些植株是否符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例 ( 0.05)

检验假设
H 0 : 这些植株符合 9 : 3 : 3 : 1 的理论比例.
H1 : 这些植株不符合 9 : 3 : 3 : 1 的理论比例.
此时, 首先在假设下利用样本求出未知参数的最大 似然估计, 以估计值作为参数值, 然后再根据 H0中 所假设的 X 的分布函数 F(x)求出 pi的估计值
ˆ(A ) ˆi P p i 2 k ( fi npi ) 2 并在 npi i 1 ˆ i 代替 pi , 得到统计量 中以 p 2 k ˆ ( fi npi ) 2 ˆi np i 1
检验假设 H 0 : 0 , H1 : 0 由中心极限定理知,当样本容量n充分大时,U 近似地服从标准正态分布N(0,1)
X 0 / n
用 S
*2
近似代替 2 ,并且当 H 0 为真
且样本容量n充分大时, X 0 统计量 U * 仍近似服从标准正态分布
A1 [3.95, 4.25], A2 (4.25, 4.55],
A12 (7.25, 7.55]
=>大麦穗长的频数、频率分布表
Ai
3.95~4.25 4.25~4.55 4.55~4.85 4.85~5.15 5.15~5.45 5.45~5.75 5.75~6.05 6.05~6.35 6.35~6.65 6.65~6.95 6.95~7.25 7.25~7.55 合计
试检验大麦穗长是否服从正态分布?(α=0.05)
解 检验假设 H 0 : X的概率密度为 f ( x)
2
1 2
e
2

( x )2 2 2
n 把X可能取值的全体 [3.95, 7.55] 划分为
k =12个互不重叠的小区间:
, 是未知的, 所以应首先估计 , 2 , 的最大似然估计为 n 1 *2 2 2 ˆ ˆ x 5.921 , s 0.6034
由于
1 n E( X ) E( X i ) p n i 1
1 n 1 D( X ) D( X i ) p(1 p) n i 1 n
因此由中心极限定理可知, 当 H 0 成立且样本容量
n充分大时,统计量 U
X p0 近似地服从标准正态分布. p0 (1 p0 ) / n
即检验假设:H0 : F ( x) F0 ( x), H1 : F ( x) F0 ( x)
:
总体 X 的分布律为 P{X xi } pi , i 1,2, 若总体 X 为连续型的, 则 H 0 相当于总体 X 的
注意: 若总体 X 为离散型的, 则 H 0 相当于
概率密度为 f (x) .
n1 s
*2 2
n2
u / 2
例3 两台机床加工同一种轴承,现在从他们加工的轴承中分别随机 地抽取200根和100根,测量其椭圆度(单位:mm),经计算得:
x 0.081 ,
* * s 0 . 025 , s 1 2 0.062 y 0.062,
能否认为这两台机床加工的轴承的平均椭圆度是相同的(α=0.05)
例2 某农科站为了考察某种大麦穗长的分布情况, 在一块实验地里随机抽取了100个麦穗测量其长度, 得到数据如下(单位: cm) 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
=>该假设检验问题的拒绝域为
u
x p0 u / 2 p0 (1 p0 ) / n
例1 某种产品在通常情况下次品率为5%. 现在从生产出的一批产 品中随机地抽取50件进行检验, 发现有4件次品. 问能否认为这批 产品的次品率为5%?(α=0.05)
, 1, 该产品为次品 X . 0, 该产品为合格品
定理2 (皮尔逊)当 H 0 为真且 n 充分大时, 统计量
2 ˆ ( f np ) i 2 i ˆi np i 1 k
近似服从 (k r 1) 分布, 其中r是 X的分布函数
2
F(x)包含的未知参数的个数. 若给定显著性水平α,则前述假设检验问题的拒绝域为
2 2 (k r 1)
解 设这批产品次品率为 p, 在这批产品中任意取一件产品, 定义随机变量 X :
X ~ b(1, p)
检验假设 H 0 : p 0.05,
相关文档
最新文档