第六章 假设检验数学建模算法
数学建模课后作业第六章
数学建模课后作业第六章-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN第六章.数理统计实验6.2 基本实验1.区间估计解:(1)由点估计与参数估计未知参数和σ^2,可以求出均值与方差;由题目条件可以得出如下的R程序:> x<-c(1067,919,1196,785,1126,936,918,1156,920,948)> n<-length(x)> x.sd<-sd(x)> x.mean<-mean(x); x.mean[1] 997.1> x.var<-sum((x-x.mean)^2)/n; x.var[1] 15574.29即=997.1,σ^2=15574.29令大约95%的灯泡至少使用的时间为x小时,可以得出如下的等式:由标准正态分布表可以得出:Ф()=0.05,可以得出=-1.645可以得出x=791.809小时。
(2)当使用时间至少为1000小时:查阅标准正态分布表可以得出对应的概率为1-Ф()=1-Ф()=1-Ф(0.02324)=1-0.5106=0.4894即由题可以得出使用时间在1000小时以上的概率为48.94%。
2.假设检验I解:对于自然状态下的男子血小板的数目可以假设服从于正态分布,由点估计与参数估计未知参数和σ^2,可以求出均值、均值区间与方差;x<-c(113,126,145,158,160,162,164,175,183,188,188,190,220,224,230,231,2 38,245,247,256)> n<-length(x)> x.sd<-sd(x)> x.mean<-mean(x); x.mean[1] 192.15> x.var<-sum((x-x.mean)^2)/n; x.var[1] 1694.728> tmp<-x.sd/sqrt(n)*qt(1-0.05/2,n-1)> a<-x.mean-tmp;a [1] 172.3827 > b<-x.mean+tmp;b [1] 211.9173可以得出均值为= 192.15,方差σ^2=1694.728;均值区间为(172.3827,211.9173)由此可以得出对于油漆工人而言正常男子血小板数为225单位,油漆工人明显低于正常的数量,则可以得知结论油漆作业对人体血小板数量有严重影响。
数学建模常用各种检验方法
数学建模常用各种检验方法数学建模是利用数学方法解决实际问题的过程。
在进行数学建模时,需要对模型的合理性进行检验,以确保模型的可靠性和准确性。
本文将介绍数学建模中常用的各种检验方法。
1.残差分析方法残差(residual)是指观测值与模型预测值之间的差异。
残差分析可以通过比较残差的大小、分布和形态,来检验模型的合理性。
常用的残差分析方法包括:正态性检验、稳定性检验、独立性检验和同方差性检验。
2.敏感性分析方法敏感性分析(sensitivity analysis)用于分析参数对模型结果的影响程度。
通过改变参数的值,并观察输出结果的变化,可以评估参数对模型的敏感性。
常用的敏感性分析方法包括:单参数敏感性分析、多参数敏感性分析和全局敏感性分析。
3.假设检验方法假设检验(hypothesis testing)用于判断模型的假设是否成立。
通过对模型的假设进行检验,可以评估模型的合理性和拟合优度。
常用的假设检验方法包括:t检验、F检验和卡方检验。
4.误差分析方法误差分析(error analysis)用于评估模型的误差水平。
通过比较实际观测值与模型预测值之间的误差,可以评估模型的准确性和精度。
常用的误差分析方法包括:平均绝对误差(MAE)、均方根误差(RMSE)和平均百分比误差(MAPE)。
5.稳定性分析方法稳定性分析(stability analysis)用于评估模型的稳定性和鲁棒性。
通过对模型进行参数扰动或输入扰动,并观察输出结果的变化,可以评估模型的稳定性和可靠性。
常用的稳定性分析方法包括:参数扰动分析、输入扰动分析和鲁棒性分析。
6.验证方法验证(validation)用于评估模型的预测能力和适用范围。
通过对模型进行验证,可以判断模型在不同情况下的预测效果和适用性。
常用的验证方法包括:留一验证(leave-one-out validation)、交叉验证(cross-validation)和外部验证(external validation)。
第六章假设检验基础PPT课件
❖假设检验的原理: 假设检验的基本思想是反证法和小
概率的思想
❖反证法思想:首先提出假设(由于未经检验是否成立,
所以称为无效假设),用适当的统计方法确定假设
成立的可能性大小,如果可能性小,则认为假设不
成立,拒绝它;如果可能性大,还不能认为它不成立
❖小概率思想:是指小概率事件在一次随机试验中认为
基本上不会发生
一、一组样本资料的t 检验(one sample/group t-test)
现有取自正态总体N(μ,σ2)的、容量为n 的一份 完全随机样本。 目的:推断该样本所代表的未知总体均数µ与已知总体 均数µ0是否相等已知总体均数µ0是指标准值,理论值 或经大量观察所得的稳定值。
n136135
3. 确定P值
指从H0规定的总体中随机抽得等于及 大于(或等于及小于)现有样本获得
的检验统计量值的概率。
4. P值的意义:如果总体状况和H0一致,统计量获 得现有数值以及更不利于H0的数值的可能性(概率) 有多大。
5.
t0 .2 (3 5 ) 50 .68 t 2 t0 .2 (3 5 ) 5得 P 0 .25
H0一般设为某两个或多个总体参数 相等,即认为他们之间的差别是由 于抽样误差引起的。H1的假设和H0 的假设相互对立,即认为他们之间 存在着本质的差异。H1的内容反映 出检验的单双侧。
单双侧的确定: 一是根据专业知识,已知东北某县囱
门月龄闭合值不会低于一般值; 二是研究者只关心东北某县值是否高
于一般人群值,应当用单侧检验。 一般认为双侧检验较为稳妥,故较为
目的要求选用不同的检验方法。
4、确定P值: P值是指由H0所规定的总体中做随机抽
样,获得等于及大于(或等于及小于)现 有统计量的概率。当求得检验统计量的值 后,一般可通过特制的统计用表直接查出P 值。
统计学第六章假设检验
10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?
数理统计中的假设检验方法
数理统计中的假设检验方法在数理统计中,假设检验方法是一种重要的统计推断方法,旨在通过对样本数据进行统计分析,对总体参数的假设进行验证。
本文将介绍假设检验的基本概念和步骤,并介绍几种常见的假设检验方法。
一、假设检验的基本概念和步骤假设检验是基于样本数据对总体参数进行推断的方法,其基本思想是通过假设检验来判断总体参数是否符合某种特定的假设。
例如,我们可以对一个总体的均值是否等于某个特定值进行假设检验。
假设检验的基本步骤如下:1. 建立原假设(H0)和备择假设(H1):原假设是我们要进行检验的假设,备择假设是原假设的对立假设。
例如,原假设可以是总体均值等于某个特定值,备择假设可以是总体均值不等于该特定值。
2. 选择适当的显著性水平(α):显著性水平是我们在进行假设检验时所允许的犯第一类错误的概率,通常取0.05或0.01。
3. 根据样本数据计算检验统计量:检验统计量是用来判断原假设是否成立的量,其选择取决于具体的假设检验方法。
4. 设置拒绝域:拒绝域是指当检验统计量的取值落入该域时,我们拒绝原假设。
拒绝域的划定依赖于显著性水平和假设检验方法。
5. 做出统计判断:根据对样本数据的分析以及检验统计量是否落入拒绝域,我们可以判断是否拒绝原假设。
6. 得出结论:根据统计判断,我们可以得出关于总体参数的统计结论,并对其进行解释。
二、常见的假设检验方法1. 单样本 t 检验:单样本t 检验用于判断一个样本的均值是否与某个已知的数值相等。
它常用于样本容量较小(小于30)且总体标准差未知的情况。
2. 独立样本 t 检验:独立样本 t 检验用于比较两个独立样本的均值是否相等。
它常用于独立样本间的均值差异的比较。
3. 配对样本 t 检验:配对样本 t 检验用于比较同一组样本在两个时间点或两个条件下的均值是否相等,常用于配对样本的差异性分析。
4. 卡方检验:卡方检验用于检验两个或多个分类变量之间的关联性。
它可用于判断观察到的频数与期望的频数是否有显著差异。
概率论课件假设检验
确定临界值
根据研究目的和精度要求,选择合适 的显著性水平,以平衡第一类错误和 第二类错误的发生概率。
做出决策
决策准则
根据样本数据和临界值, 做出是否拒绝零假设的决 策。
结果解释
对决策结果进行合理解释, 说明拒绝或接受零假设的 原因和意义。
结果应用
将决策结果应用于实际问 题中,为后续研究和应用 提供依据。
双侧检验
对两个方向上的差异都进行检验,例如检验平均值是否与某 个值相等。
参数检验与非参数检验
参数检验
基于总体参数的假设进行检验,例如检验总体均值或比例。
非参数检验
不基于总体参数的假设进行检验,例如中位数或众数检验。
独立样本检验与配对样本检验
独立样本检验
对两个独立样本进行比较,例如比较 两个不同群体的平均值。
感谢您的观看
05 实际应用案例
医学研究中的假设检验
总结词
医学研究中的假设检验是评估新药物、治疗方法或诊断技术有效性的关键步骤。
详细描述
在医学研究中,研究者通过假设检验来比较新药物或治疗方法与现有标准之间的差异,以评估其疗效和安全性。 假设检验通过统计方法对数据进行处理,根据预设的显著性水平判断假设是否成立,从而为医学决策提供依据。
假设检验的优点与局限性
01
局限性
02
03
04
假设检验依赖于样本数据的代 表性,如果样本不具有代表性 ,则推断结果可能存在误差。
假设检验的结果受到样本量大 小的影响,样本量过小可能导
致推断结果不稳定。
在某些情况下,假设检验可能 无法给出明确的结论,导致决
策者难以做出判断。
未来研究方向
探索更有效的假设检验方法
假设检验的公式运用总结
假设检验的公式运用总结假设检验是统计学中的一种方法,用于根据样本数据来对一个或多个总体参数进行推断。
它可以用来验证与研究假设或猜想相关的统计推断。
以下是假设检验的公式运用总结。
1.假设检验的步骤-第一步:提出原假设(零假设)和备择假设。
原假设通常表示没有变化或无效果,备择假设则表示有变化或有效果。
-第二步:确定显著性水平(α),用于设定拒绝原假设的临界值。
-第三步:收集样本数据并计算所需的统计量。
根据问题的不同,可能需要计算平均值、比例、标准差等统计量。
-第四步:计算拒绝域的临界值。
根据样本量、显著性水平和检验类型,可以使用不同的分布来计算。
-第五步:计算检验统计量的值,并将其与拒绝域的临界值进行比较。
-第六步:做出决策,判断是否拒绝原假设。
如果检验统计量的值落在拒绝域内,则拒绝原假设;否则,接受原假设。
2.常见的假设检验公式2.1单样本t检验-假设检验的计算公式:t=(tt-t)/(√(t²/t))-其中,tt为样本均值,t为总体均值,t²为样本的方差,t为样本量。
2.2双独立样本t检验-假设检验的计算公式:t=(tt₁-tt₂)/√(t₁²/t₁+t₂²/t₂)-其中,tt₁和tt₂为两个独立样本的均值,t₁²和t₂²为两个独立样本的方差,t₁和t₂为两个独立样本的样本量。
2.3配对样本t检验-假设检验的计算公式:t=(ttt-t₀)/(√(t²t/t)-其中,ttt为配对样本的差异的均值,t₀为配对样本差异的总体均值,t²t为配对样本差异的样本方差,t为配对样本的样本量。
2.4卡方检验-假设检验的计算公式:t²=Σ(tt-tt)²/tt-其中,tt为观察到的频数,tt为期望的频数。
2.5方差分析-假设检验的计算公式:t=tttt/tttt-其中,tttt为处理间均方,tttt为处理内均方。
以上是常见的假设检验公式的运用总结。
管理运筹学 第6章 假设检验
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
-1.96
0
1.96
Z
第六章
假设检验
例3:根据以往的资料,某厂生产的产 品的使用寿命服从正态分布N(1020, 10 02)。现从最近生产的一批产品中随机 抽取16件,测得样本平均寿命为1080小 时。问这批产品的使用寿命是否有显著 提高(显著性水平:0.05)?
第六章
假设检验
• 2.已知某炼铁厂的铁水含碳量(%) 在正常情况下服从正态分布N(4.55, 0.112),今测得5炉铁水含碳量如下: • 4.28,4.40,4.42,4.35,4.37. • 若标准差不变,铁水的含碳量是否有 明显的降低?( =0.05)
第六章
6.3
假设检验
总体比率的假设检验
第六章
假设检验
一、假设检验(Hypothesis Testing)问题的提出
例1、某企业生产一种零件,以往的资料显示零 件平均长度为4cm,标准差为0.1cm。工艺改革后, 抽查100个零件发现其平均长度为3.94cm。问:工艺 改革后零件长度是否发生了显著变化? 例2、某厂有一日共生产了200件产品,按国家标 准,次品率不得超过3%才能出厂。现从该批产品中 随机抽取10件,发现其中有2件次品,问这批产品能 否出厂。
6.2.1 正态总体参数假设检验的步骤
第一步:建立原假设H0和备择假设H1。原假设应该 是希望犯第Ι类错误概率小的假设。 常用的假设形式 :
H H H
: , H : ( 双边备择假设) 0 0 1 0 : , H : ( 右单边备择假设) 0 0 1 0 : , H : ( 左单边备择假设) 0 0 1 0
统计学——假设检验概念和方法
4. 我们想要证明(检验)大于或小于这两种可能 性中的任何一种是否成立
5. 建立的原假设与备择假设应为
6.
H0: = 10 H1:
10
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
/2
1 -
/2
临界值
H0值
样本统计量 临界值
双侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
率原理
假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
抽样分布
...因此我们拒绝 假设 = 50
... 如果这是总 体的真实均值
20
m = 50
H0
样本均值
假设检验的过程
总体
☺☺ ☺
☺☺ ☺☺ ☺☺
提出假设
我认为人口的平 均年龄是50岁
抽取随机样本
☺X均=值20☺
作出决策 拒绝假设! 别无选择.
一项研究表明, 采用新技术生产后, 将会 使产品的使用寿命明显延长到1500小时 以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命 延长)是正确的
备择假设的方向为“>”(寿命延长)
建立的原假设与备择假设应为
H0:
1500
H1:
1500
单侧检验
(原假设与备择假设的确定)
一项研究表明, 改进生产工艺后, 会使产 品的废品率降低到2%以下。检验这一结 论是否成立
Z X m0
Sn
否
样本容量 n
小
用样本标 准差S代替
t 检验
t X m0 Sn
总体均值的检验
(2 已知或2未知大样本)
【教学课件】第六章 假设检验基础
19
假设检验的基本思想
1.假设检验采用的逻辑推理方法是反证法;
为了检验某假设是否成立,先假定它正确,然 后根据样本信息,观察由此假设而导致的结果是否 合理,从而判断是否接受原假设;
2.判断结果合理与否,是基于“小概率事件不 易发生”这一原理的;
即在一次抽样中,小概率事件不可能发生。如 果在原假设下发生了小概率事件,则认为原假设是 不合理的;反之,小概率事件没有发生,则认为原 假设是合理的。
能性很小,如果在一次抽样中发生了,
2021/8/17
则有理由怀疑假设μ=μ0不成立。即
所来自的X 总体不是μ0总体。
6
二、假设检验的基本步骤
1.建立检验假设,确定检验水准 假设有两种: (1)μ=μ0 :常称无效假设,又称原假设或零假
设。用H0表示。 (2)μ>μ0 :称备择假设,或对立假设。用H1表
S n 5.08 36
n 1 36 1 35
2021/8/17
14
3.确定P值
P值的含义是:指从H0规定的总体中,随机抽得 等于及大于(或等于及小于)现有样本获得检 验统计量值(t或Z)的概率。 自由度为35 ,查附表2,得到:
单侧 t0.05(35) 1.690。 得P >0.05。
2021/8/17
2021/8/17
30
检验假设为: H0 :μd= 0, H1 :μd≠0
检验统计量 :
t dd d0
Sd
Sd / n
n1
2021/8/17
31
例6-2 某儿科采用静脉注射人血丙种球蛋白 治疗小儿急性毛细支气管炎。用药前后患儿 血清中免疫球蛋白IgG(mg/dl)含量如表 6-1所示。试问用药前后IgG有无变化?
回归模型的假设检验(附)
第6章 回归模型的假设检验1,区间估计—基本概念假设对消费函数回u Y C ++=21ββ归分析之后,得出边际消费倾向2β的估计值为0.509。
这是对未知的总体MPC 2β的一个单一的点估计。
这个点估计可不可靠?虽然在重复抽样中估计值的均值可能会等于真值))ˆ((22ββ=E ,但由于抽样波动,单一估计值很可能不同于真值。
在统计学中,一个点估计量的可靠性有它的标准误差来衡量。
因此,我们不能完全依赖一个点估计值,而是围绕点估计量构造一个区间。
比方说,在点估计量的两旁各划出宽为2或3个标准误差的一个区间,使得它有95%的概率包含着真实的参数值。
这就是取件估计的粗略概念。
假定我们想知道宽竟,比方说,2ˆβ离2β有多“近”。
为了这个目的,试求两个正数δ和a ,10<<a ,使得随机区间)ˆ,ˆ(22δβδβ+-包含2β的概率为a -1。
a -=+≤≤-1)ˆˆPr(222δββδβ (1) 如果存在这个区间,就称之为置信区间,)1(a -称置信系数或置信度,a 称为显著水平。
置信区间的端点称临界值。
上限和下限。
0.05,0.01。
比方说05.0=a ,(1)式就可读为:试中的区间包含真实的2β的概率为95%。
2,回归系数的置信区间一元回归时,在i u 的正态性假定下,OLS 估计量21ˆ,ˆββ本身就是正态分布的,其均值和方差已随之列出。
以2ˆβ为例 2ˆ22ˆβββS Z -=--(2) 2ˆβ的方差∑-=22)(X X σ这是一个标准化正态变量。
因此,如果知道真实的总体方差2σ已知,就可以利用正态分布对2β作概率性表达。
当2σ已知时,以μ为均值,2σ为方差的正态变量有一个重要性质,就是σμ±之间的面积约占68%,95%,99%。
但是2σ很少能知道,在现实中用无偏估计量2σ来确定。
用σˆ代替σ,(2)可以改写为 )ˆ(ˆ222βββS t -= (3)这样定义的t 变量遵循自由度为n-2的t 分布。
假设检验的计算
2、小样本单总体均值的两端 t 检验
1. 假定条件
总体为正态分布
2. 使用t 统计量(t的分布形态决取于自由度。 Df=n-1)
t xM s n1
22
已知初婚年龄服从正态分布,根据9 个人抽样调查得到x=23.5,s=3,是 否可以认为该地区初婚年龄已经超 过20岁。
23
(二)单个总体比例的检验
12
三 、单个总体均值和比例的假设检验
(一)单个总体均值的检验 (二)单个总体比例的检验
13
(一)单个总体均值的检验
14
1.大样本总体均值检验(两端)
1.假定条件:总体服从正态分布
2.原假设为:H0: M=M0; 研究假设为:H1:M M0
3. 使用 z 统计量(通常n≥100)
z xM sn
39
3、两个配对样本的T检验—前后两次调
查同一总体所得的样本
前面讲的都是两个相互独立的样本 通常用于试验组和控制组的调查中,前后
两期的数据是属于同一个样本,两个是相 关样本,而不是相互独立的样本
t sd
xd n 1
Xd表示样本差异的均值 Sd样本差异的标准差
40
【例】一个以减肥为主要目标的健美俱乐部声称,参 加其训练班至少可以使减肥者平均体重减轻8.5公斤 以上。为了验证该宣称是否可信,调查人员随机抽 取了10名参加者,得到他们的体重记录如下表,在 a = 0.05的显著性水平下,调查结果是否支持该俱乐 部的声称?:
9
真实情况 H0为真 H0不真
所做决策
接受H0
拒绝H0
正确
犯第Ⅰ类错误 (弃真)
犯第Ⅱ类错 正确 误(纳伪)
10
5、两种检验的角度:参数检验与非参 数检验
第六章 假设检验PPT课件
4.一批成品按不重复方法抽选200件, 其中废品10件,又知道抽样单位数是成 品量的1/22。当概率为0.9545时,可否 认为这一批产品的废品率不超过6%? (20分)
解:已p 知n1:n 1 02 100 % ;0 n 10 5 % 1;U 0/22,N n2 12
n 200
pP ( 1 n P )( 1 N n )0 .0 ( 2 1 5 0 .0 0 )( 1 0 5 2 1 ) 2 0 .01 1 .5 5 %
解 由题意可知:化肥重量X~N(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。
假设 H0:=100; H1: ≠100
构造T统计量,得T的0.1双侧分位数为
t0.05 (8) 1 . 8 6
例3 化工厂用自动包装机包装化肥,每包重量服从正态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1)
3、在Variables栏中,键入C2,在Test Mean栏中 键入750,打开Options选项,在Confidence level 栏中键入95,在Alternative中选择not equal,点击 每个对话框中的OK即可。
显示结果
结(1)因为 750 746.98,754.58所以接受原假设
表达:原假设:H0:EX=75;备择假设: H1:EX≠75
判断结果:接受原假设,或拒绝原假设。
基本思想
参数的假设检验:已知总体的分布类型,对分布函数或 密度函数中的某些参数提出假设,并检验。
基本原则——小概率事件在一次试验中是不可能发生的。
思想:如果原假设成立,那么某个分布已知的统计 量在某个区域内取值的概率应该较小,如果样本的观 测数值落在这个小概率区域内,则原假设不正确,所以, 拒绝原假设;否则,接受原假设。
第六章 假设检验(2)
1、单样本双边假设检验步骤如下
第一步:建立假设
H 0 : 0 H1 : 0
n≥30时,其服从正态分布
第二步:设统计量为
X 0
在H 0成 立 的 条 件 下
X 0 在H 0成立的条件下 t ~ t (n 1) t N (0,1) 或 t s n n
假设检验与方差分析
(2)设定允许的抽样误差水平
a 0.10时,临界值Z 1.28 (0.10显著水平的单边检验 )
(3)计算两比例间差异的估计标准差
S p m f 1 1 P1 P nm n f P n m Pm n f P f nm n f
设统计量为
H1 : 0
H 0成立的条件下 在 Z ~ N (0,1)
Z
x 0
n 由给定的显著水平a=0.05确定临界值,Z0.05=-1.645
( x)
确定拒绝域和接受域
z Za 1.645 接 受 H1 拒 绝 H0 z Za 1.645 , 没 有 理 由 拒 绝 H0
( x)
确定拒绝域和接受域
z>Za 1.645 , 拒 绝 H0, 接 受 H1 z<Za 1.645 , 没 有 理 由 拒 绝 H0
1 a 0.95
a 0.05
Za 1.645
x
接受域
拒绝域
假设检验与方差分析
3、单个样本左单边假设检验
若提出原假设和备选假设:
H0 : 0
所以本例 S p m f
45 0.58 71 0.41 P 0.48 45 71 1 1 0.48 1 0.48 0.10 45 71
第六假设检验讲课文档
第13页,共15页。
❖ 练习:美国某学者对 287位母亲抱新生儿的 方式进行了观察,发现 大多数母亲都把婴儿抱 在左边,不管母亲是左 撇子还是右撇子。数据 如下:
第7页,共15页。
x
第三节 均值比较的Z检验
❖ 两个均值的比较
这里讨论的是从两个总体中分别抽取随机样本,通过对样本 数据的分析来推断总体均值差异的方法,亦即两个均值差 异的比较问题。多均值比较在方差分析中另行介绍。
❖ 基本思路:
设两总体均值分别为U1和U2,成立虚无假设H0:U1-U2=0,或 U1=U2;在H0条件下,两样本是从总体中随机抽取的, 其均值差异X1-X2可以等于零,也可以不等于零,是一 个围绕零值波动的随机分布。
第4页,共15页。
➢ 决策的风险
两种的样选本择;:21、、拒接绝受HH00,,犯我错们误的的运概气率太为差1,.1抽6%到。了一个很偏 ➢ P值的含义
的在样本本例的中可,能p=性0.0只11有60意.0味11着6。在H0条件下,抽到如此偏小 本更一偏般的来样说本,的1、可能概性值;意2味、着或在者H表0条述件为下,,p抽值到意比味实着有样样本 数据对虚无假设的支持程度(或两者之间的一致性程 度);3、在假设检验过程中,如果p值较小,我们拒绝 H0,p就是我们要冒的风险。
第3页,共15页。
❖ 四、计算概率值(p值),做出决策。 在这个情况下,我们是否接受无效假设H0呢?我们先计
算在H0成立的条件下,抽到头围均值小到Xbar=33.89这个
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验
6.1 假设检验的基本问题 6.2 一个总体参数的检验 6.3 两个总体参数的检验
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
6.1
假设检验的基本问题
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
一、假设的陈述
n
2 未知:
z
x 0 s n
~ N (0,1)
总体均值的检验( 2 已知)
(例题分析)
【例】一种罐装饮料采用自动生 产线生产,每罐的容量是255ml, 标准差为5ml。为检验每罐容量是 否符合要求,质检人员在某天生产 的饮料中随机抽取了40罐进行检验, 测得每罐平均容量为255.8ml。取 显著性水平=0.05 ,检验该天生 产的饮料容量是否符合标准要求?
1. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
2. 它是事先指定的犯第Ⅰ类错误概率的最大允 许值 3. 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定 5. 拒绝原假设,则表明检验的结果是显著的 不拒绝原假设,表明检验的结果是不显著的
三、检验统计量与拒绝域
检验统计量
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
... 因此我们拒 绝假设 = 50
... 如果这是总 体的假设均值 20
= 50 H0
样本均值
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
我认为人口的平 均年龄是50岁
总体
抽取随机样本
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(单侧检验 )
抽样分布
拒绝H0 置信水平
1-
临界值
0
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
1-
临界值 观察到的样本统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对原假 设和备择假设作出决策的某个样本统计量
2. 对样本估计量的标准化结果
原假设H0为真
点估计量的抽样分布
3. 标准化的检验统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
总体均值的检验( 2 未知)
(例题分析)
【例】一种机床加工的零件尺 寸绝对平均误差为1.35mm。生 产厂家现采用一种新的机床进行 加工以期进一步降低误差。为检 验新机床加工的零件平均误差与 旧机床相比是否有显著降低,从 某天生产的零件中随机抽取50个 进行检验。利用这些样本数据, 检验新机床加工的零件尺寸的平 均误差与旧机床相比是否有显著 降低? (=0.01)
1.98 1.11
1.70 1.17
1.97 0.91 1.22 1.06 1.54 1.08 1.10 1.64
2.37 1.38 1.60 1.26 1.12 1.23 0.82 0.86
左侧检验
总体均值的检验( 2 未知)
(例题分析)
H0 : 1.35 H1 : < 1.35 = 0.01 n = 50 临界值(c):
0
样本统计量
右侧检验的P 值
抽样分布
置信水平 拒绝H0 1-
P值
0
临界值 计算出的样本统计量
假设检验步骤的总结
1. 陈述原假设和备择假设 2. 从所研究的总体中抽出一个随机样本 3. 确定一个适当的检验统计量,并利用样本数据算 出其具体数值 4. 确定一个适当的显著性水平,并计算出其临界值, 指定拒绝域 5. 将统计量的值与临界值进行比较,作出决策
500g
提出假设
(例题分析)
【例】一家研究机构估计,某城市中家庭拥有汽车 的比率超过30%。为验证这一估计是否正确,该研 究机构随机抽取了一个样本进行检验。试陈述用于 检验的原假设与备择假设
解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比率 超过30%”。建立的原假设和备择假设 为 H0 : 30% H1 : 30%
拒绝 H0
0.025
结论:
样本提供的证据表明:该天生 产的饮料符合标准要求
-1.96
0
1.96
z
总体均值的检验(z检验)
(P 值的计算与应用)
第1步:进入Excel表格界面,直接点击“f(x)”(粘 贴 函数) 第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定 第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0
置信水平
拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
双侧检验与单侧检验
(假设的形式)
单侧检验 左侧检验
H0 : 0
假设
双侧检验
H0 : = 0 H1 : ≠0
右侧检验
H0 : 0
原假设
备择假设
H1 : < 0 H1 : > 0
二、假设检验中的两类错误
1.第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设 第Ⅰ类错误的概率记为
1、假设和假设检验
假设是对总体参数的具 体数值所作的陈述
总体参数包括总体均值、 比率、方差等 分析之前必须陈述
我认为这种新药的疗效 比原有的药物更有效!
1. 假设检验:先对总体的参数(或分布形式)提 出某种假设,然后利用样本信息判断假设是 否成立的过程 2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原理
H0 : 10cm H1 : 10cm
提出假设
(例题分析)
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500克。从消费者的利益出发,有 关研究人员要通过抽检其中的一批产品来验证该产 品制造商的说明是否属实。试陈述用于检验的原假 设与备择假设
解:研究者抽检的意图是倾向于 证实这种洗涤剂的平均净含量并 不符合说明书中的陈述 。建立的 原假设和备择假设为 H0 : 500 H1 : < 500
统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策
6.2
一个总体参数的检验
一、总体均值的检验 二、总体比率的检验 三、总体方差的检验
一个总体参数的检验
一个总体
均值
比率
方差
z 检验
(单尾和双尾)
t 检验 (单尾和双尾)
z 检验 (单尾和双尾)
2检验
(单尾和双尾)
双侧检验:│统计量│> 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
四、利用 P 值 进行决策
什么是P 值?
(P-value)
1. 在原假设为真的条件下,检验统计量大于、小 于或等于其计算值的概率
双侧检验为分布中两侧面积的总和
拒绝H0 0.01
检验统计量:
z
1.3152 1.35 0.365749 50
2.6061
决策:
拒绝H0
结论:
0 z
新机床加工的零件尺寸的平均误 差与旧机床相比有显著降低
-2.33
(例题分析)
【例】 一种零件的生产标准是直径应为10cm,为对生
产过程进行控制,质量监测人员定期对一台加工机床检 查,确定这台机床生产的零件是否符合标准要求。如果 零件的平均直径大于或小于10cm,则表明生产过程不 正常,必须进行调整。试陈述用来检验生产过程是否正 常的原假设和被择假设
解:研究者想收集证据予以证明的假设应该是“ 生产过程不正常”。建立的原假设和备择假设为
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾检 验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或单 尾检验(one-tailed test)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
0
样本统计量
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平 拒绝H0 1-
0
观察到的样本统计量
临界值
样本统计量
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平 拒绝H0
1-
0
临界值
样本统计量
决策规则
1. 给定显著性水平,查表得出相应的临界 值z或z/2, t或t/2 2. 将检验统计量的值与 水平的临界值进行 比较 3. 作出决策