第六章 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 四、计算概率值(p值),做出决策。
在这个情况下,我们是否接受无效假设H0呢? 我们先计算在H0成立的条件下,抽到头围均值小到 Xbar=33.89这个程度的样本的可能性。
查表可知,p(z<-2.273)=0.0116。
这样,如果接受H0,则说明我们抽到了一个均 值严重偏小的样本,抽到这么偏的样本的可能性只 有1.16%。
2、或者表述为,p值意味着样本数据对虚无假设的支 持程度(或两者之间的一致性程度);
3、在假设检验过程中,如果p值较小,我们拒绝H0,p 就是我们要冒的风险。
➢ 结论:
Pwk.baidu.com反映了拒绝原假设时所犯错误的可能 性,在进行假设检验时,我们通常要设定一 个我们所能接受的犯这种错误的风险水平α 值 ,称为检验水准或显著性水平。
故两样本均值Z检验的统计量计算公式为: Z= X1-X2/SE。
练习:
有趣的环境是否会对脑发育产生影响呢?美国 某生物学家对老鼠进行了实验。他随机抽出10窝新 出生的老鼠,每窝中分别随机抽取出1只到处理组, 1只到对照组。两组老鼠所受待遇相同,所不同的只 是处理组的老鼠都住在一个笼子里,还放了许多好 玩的东西;而对照组的老鼠却用隔板分开,也没有 什么玩具。一个月后,取出每只老鼠的脑皮质,各 窝中10对老鼠脑皮质重量如下表(单位:厘克):
❖ 基本思路: 设两总体均值分别为U1和U2,成立虚无假
设H0:U1-U2=0,或U1=U2;在H0条件下,两样 本是从总体中随机抽取的,其均值差异X1-X2 可以等于零,也可以不等于零,是一个围绕 零值波动的随机分布。
统计研究表明,样本均值差值X1-X2服从于 均值为0,标准差为SE的正态分布。其中X1X2的方差正好是X1和X2的方差之和。
❖ 在本例中,我们可成立如下假设:
➢ H0: μ1 = μ0 ➢ H1: μ1 < μ0
❖ 三、在H0条件下计算检验统计量。 如果H0成立,根据中心极限定理,均值的抽样
分布服从正态分布,从研究总体中随机抽取样本量
为55的样本,其均值会落在正态曲线横轴的任一位
置,但大多数会落在总体均值μ1 = μ0附近,远离 中心点的可能性较小。样本均值偏离中心点的距离
❖ 一、假设检验的p值法与经典法的比较 ❖ 二、假设检验中的两类误差(错误)
❖ 三、假设检验的统计意义 ➢ 1、假设检验结论的正确性是以概率作为保证
的 ➢ 2、p值的含义 ➢ 3、统计结论的表述
❖ 二、两个比例的比较
❖ 对两个样本比例(p1和p2)进行检验的目的 是推断两个总体的比例是否不同。其基本原 理与两样本均值比较类同。
❖ 例题:为比较城镇和农村小家庭的比例是否 相等,分别抽取样本如下: n1=150,x1=123;n2=200,x2=102(显著度为 0.001)
❖ 练习:美国某学者对 287位母亲抱新生儿的 方式进行了观察,发现 大多数母亲都把婴儿抱 在左边,不管母亲是左 撇子还是右撇子。数据 如下:
❖ 一、分析差异来源 值为根0.据61题cm意。,该差Xb异ar来=源33有.8两9,种可μ能0=3性4.:50,两者差
➢ 1、该矿区的自然社会条件并不影响新生儿发育,矿 区头均新围值生均的儿 值 差μ总 异0体 来相的 源等头于(围抽μ均样1值误=μ差μ1,与0也一)就般,是新样说生本我儿均们(值抽总与到体总了)体 一个头围偏小的样本,由此造成的差异不具有显著 性(significance),即没有统计学意义。
右边 左边 合计
右撇 43 子
左撇 7 子
合计 50
212 255 25 32 237 287
❖ 问:1、全部母亲中将婴儿抱在左边的比例是 否为50%?
❖ 2、右撇子母亲和左撇子母亲将婴儿抱在左边 之比例的差异具有统计学意义吗?(是否具 有显著性)
❖ 猜一猜为什么母亲们偏爱在左边抱婴儿?
第六节 小结
可由其标准值来衡量。
本例中,n=55,σ =1.99,在H0: μ1 =34.50条件下,将观测值Xbar标准化,即 Xbar=33.89与中心点之间的距离(以标准差 为单位来衡量)为: z=(33.89-34.50)/(1.99/n1/2 )=-2.273
由此可见Xbar=33.89落在距中心点较远的 位置。
➢ 决策的风险 两种选择: 1、的接样受本H;0,我们的运气太差,抽到了一个很偏 2、拒绝H0,犯错误的概率为1.16%。
➢ P值的含义 在本例中,p=0.0116意味着在H0条件下,抽到
如此偏小的样本的可能性只有0.0116。 一般来说,
1、概值意味着在H0条件下,抽到比实有样本更偏的样 本的可能性;
❖ 一、单样本比例的z检验
比例是均值的一种特殊情况,对比例进行 检验,其思想是将属性数据转化为(二分变 量),然后对其均值进行检验。 ❖ 对某高校随机抽样n=200的样本,根据样本计 算出学生中城市户口为40%。问该高校城市户 口学生比例是否高于35%。(显著性水平为 0.05)
z P Q 40% 35% 5 1.65 SE 40%(1 40%) 200
p<α,拒绝原假设; p>α,不拒绝原假设。
第二节 进一步的讨论
❖ 一、检验的方向 ❖ 二、两类错误 ❖ 三、假设检验的统计意义
x
第三节 均值比较的Z检验
❖ 两个均值的比较 这里讨论的是从两个总体中分别抽取随机样 本,通过对样本数据的分析来推断总体均值 差异的方法,亦即两个均值差异的比较问题。 多均值比较在方差分析中另行介绍。
第六章 假设检验
XX
1 n
n i 1
Xi
第一节 假设检验的基本逻辑
❖ 例:通过以往大规模调查,已知某地新生儿头围均 值为34.50cm,标准差为1.99cm。为研究该地某矿区 新生儿发育状况,从该矿区随机抽取新生儿55人, 测得其头围均值为33.89cm。问该矿区新生儿头围均 值是否小于一般新生儿头围均值?
所以,我们首先要成立两个相互对立的假设: 虚 hy无po假th设esHi0s和,备或择译假为设无H效1。假虚设无,假)设主(张n,ul差l 异可以 由抽样误差来解释,也就是说差异在总体中不存在 或无效。备择假设与虚无假设对立,主张样本数据 表现出的差异来源于总体差异。在假设检验中,直 接检验的是虚无假设,所以虚无假设又称检验假设 (hypothesis to be tested)。
处理组 68 65 66 67 66 66 64 69 63 66 对照组 65 62 64 65 64 59 63 65 58 65
第四节 大样本比例的假设检验
❖ 当n较大,且比例不接近于0和1时,大样本比 例(或百分率)的比较可采用z检验。具体应 用条件如下:
➢ n较大,且每组例数都大于60; ➢ 样本比例p和1-p都不接近于100%和0; ➢ np和n(1-p)均大于5。
➢ 2、差异不仅仅由抽样误差造成,矿区新生儿总体头 围μ学均意0 )值义,小 。这于种一差般异新被生认儿为总具体有头显围著均性值,(亦μ即1有<统计 在这两者之间如何抉择呢?关键在于两个均值的 差异能否用抽样误差来解释。
❖ 二、成立假设: 在统计学里,上述问题是用反证法的方式来解
决的,首先假设差异可由抽样误差解释,两总体均 值 样相,等 得, 到然 头后 围再 均来 值分小析到在Xbμar1=3=3.μ890这的个总程体度中的随可机能抽 性有多大。如果这个可能性很小,则拒绝这一假设, 而采纳相反的假设。