假设检验的基本思想与步骤
4 假设检验和t检验

t
2.671
17905113912 /11101971 9462 / 9 ( 1 1)
11 9 2
11 9
=n1+n22=11+9-2=18
(3)确定P值,作出推断结论
以=18,查 t 界值表得 0.01<P<0.02。按=0.05 水
准,拒绝 H0,接受 H1,差异有统计学意义。可以认为 两种饲料对小鼠的体重影响不同。
(2)计算检验统计量
本例n=12,d=53,d2=555,
d d 53 4.42 n 12
sd
d2 (
d)2 / n
555 (53)2 /12 5.40
n 1
12 1
t d 4.42 2.83 sd / n 5.40 / 12
12 1 11
(3)确定P值,作出推断结论
(1)建立检验假设,确定检验水准
H0:1=2 即两组小鼠的体重总体均数相同 H1:1 2 即两组小鼠的体重总体均数不相同 =0.05
(2)计算检验统计量
126.45 105.11
t
2.671
(111)17.762 (9 1)17.802 ( 1 1)
11 9 2
11 9
126.45 105.11
型)选择相应的检验统计量。 如 t 检验、z检验、 F检验和 2 检验等。
本例采用t检验方法 t X X X 0 , n 1
SX S n S n
本例t值为1.54
3. 确定P值,做出推断结论
是指查根表据得所到计检算验的用检的验临统界计值量,确然定后H将0成算立得的可 能性的大统小计,量即与确拒定绝在域检的验临假界设值条作件比下较由,抽确样定误P差引 起差值别。的如概对率双。侧 t 检验 | t | ,则 tα/2(ν) P α ,按检
第6章 假设检验 《统计学概论》PPT课件

显著性水平和拒绝域(双侧检验 )
抽样分布
拒绝H0
/2
1 -
置信水平 拒绝H0
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域(双侧检验 )
抽样分布
拒绝H0
/2
1 -
置信水平 拒绝H0
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域( 左侧检验 )
抽样分布
拒绝H0
置信水平
1 -
临界值
0
样本统计量
显著性水平和拒绝域(左侧检验 )
0.025
P值
检验统计量:
0.025
0
Z x X 0 =1050 1000 =2.5 n 100 25
P值 =2 P{Z≥2.5} =2×0.0062=0.0124
检验统计量 的观察值
结论:P值< =0.05,
所以应该拒绝H0
5-42
假设检验的两种判断方法的比较
样本
检验统计 量观察值
给定显著 性水平
z X 0 / n
z 检验
常用 统计量
t X 0
S/ n
F
2
(n 1)S 2
(n1 1)S122
12
(n2 1)S22
S12 S22
2 2
t 检验
χ 2检验
F检验
第三步:确定显著水平α的值,查相应的分 布表得其临界值以及拒绝域。
第四步:进行显著性判别。
假设检验结论的表述
假设检验结论的表述
平)
检验的显著性水平是事先设定的拒绝原假设时所犯错误的概率 的最大允许值。
P值是根据观察样本实际计算的拒绝原假设时所犯错误的概率值。
统计假设检验的基本思想和概念

统计假设检验的基本思想和概念本章主要介绍统计假设检验的基本思想和概念以及参数的假设检验方法。
8.1假设检验的基本思想和概念(一)统计假设的概念为了引入统计假设的概念,先请看例8-1。
例8-1味精厂用一台包装机自动包装味精,已知袋装味精的重量,机器正常时,其均值=0.5(0.5,0.015的单位都是公斤)。
某日开工后随机抽取9袋袋装味精,其净重(公斤)为:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512问这台包装机是否正常?【答疑编号:10080101针对该题提问】此例随机抽样取得的9袋味精的重量都不正好是0.5公斤,这种实际重量和标准重量不完全一致的现象,在实际中是经常出现的。
造成这种差异不外乎有两种原因:一是偶然因素的影响,二是条件因素的影响。
由于偶然因素而发生的(例如电网电压的波动、金属部件的不时伸缩、衡量仪器的误差而引起的)差异称为随机误差;由于条件因素(生产设备的缺陷、机械部件的过度损耗)而产生的差异称为条件误差。
若只存在随机误差,我们就没有理由怀疑标准重量不是0.5公斤;如果我们有十足的理由断定标准重量已不是0.5公斤,那么造成这种现象的主要原因是条件误差,即包装机工作不正常,那么,怎样判断包装机工作是否正常呢?我们通过解例8-1 来找出解假设检验问题的思想方法。
解已知袋装味精重,假设现在包装机工作正常,即提出如下假设:,这是两个对立的假设,我们的任务就是要依据样本对这样的假设之一作出是否拒绝的判断。
由于样本均值是的一个很好的估计,故当为真时,应很小。
当过分大时,我们就应当怀疑不正确而拒绝。
怎样给出的具体界限值呢?当为真时,由于,对于给定的很小的数0<α<1,例如取α=0.05,考虑,其中是标准正态分布上侧分位数,而事件(8.1.1)是一个小概率事件,小概率事件在一次试验中几乎不可能发生。
我们查附表1得,又n=9,=0.015,由样本算得,又由(8.1.1)得:小概率事件居然发生了,这与实际推断原理相矛盾,于是拒绝,而认为这台包装机工作不正常。
简述统计假设检验的基本步骤

统计假设检验的一般步骤(1)根据实际问题的要求,充分考虑和利用已知的背景知识,提出原假设H及备择假设1H;(2)给定显著性水平α以及样本容量n;(3)确定检验统计量U,并在原假设H成立的前提下导出U的概率分布,要求U的分布不依赖于任何未知参数;(4)确定拒绝域,即依据直观分析先确定拒绝域的形式,然后根据给定的显著性水平α和U的分布,由P{拒绝H|0H为真}=α确定拒绝域的临界值,从而确定拒绝域;(5)作一次具体的抽样,根据得到的样本观察值和所得的拒绝域,对假设H作出拒绝或接受的判断.扩展:假设检验的基本思想假设检验的基本思想实质上是带有某种概率性质的反证法. 为了检验一个假设H是否正确, 首先假定该假设0H正确, 然后根据样本对假设H作出接受或拒绝的决策. 如果样本观察值导致了不合理0的现象的发生, 就应拒绝假设H, 否则应接受假设0H.假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则, 即小概率事件在一次试验中是几乎不发生的. 但概率小到什么程度才能算作“小概率事件”, 显然, “小概率事件”的概率越小,否定原假设H就越有说服力. 常记这个概率值为)1α,称为检验的显著性水平. 对不同的问题, 检验的显著性0(<<α水平α不一定相同, 但一般应取为较小的值, 如0.1,0.05或0.01等.假设检验的两类错误当假设H正确时, 小概率事件也有可能发生, 此时我们会拒绝假设H, 因而犯了“弃真”的错误, 称此为第一类错误. 犯第一类错误0的概率恰好就是“小概率事件”发生的概率α, 即P{拒绝H|0H为真}=α.反之, 若假设H不正确, 但一次抽样检验结果, 未发生不合理结果,这时我们会接受H, 因而犯了“取伪”的错误,称此为第二类错误. 记β为犯第二类错误的概率, 即P {接受0H |0H 不真}=β.理论上, 自然希望犯这两类错误的概率都很小。
当样本容量n 固定时, α,β不能同时都小, 即α变小时, β就变大;而β变小时,α就变大.。
假设检验

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
假设检验的基本思想1.小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
2.假设的形式H0——原假设,H1——备择假设双尾检验:H0:μ = μ0,单尾检验:,H1:μ < μ0,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
第七章假设检验与t检验(终板)

2、P值是指从H0所规定的总体中作随机 抽样,获得等于及大于 (或等于及小于)现有 样本统计量的概率。通过 P值与α 值的比 较来确定拒绝或不拒绝H0。
四、假设检验的应用注意事项
(1)研究设计要科学严密 (2)考虑假设检验方法的前提条件 (3)正确理解P值的含义 (4)假设检验的结论不能绝对化 (5)统计学意义与实际意义相互结合
的疗效时,如能根据专业知识认为新药 疗效不会比旧药差,只关心新药是否比 旧药好(疗效至少相同,绝对排除出现 相反的可能性),可用单侧检验。
双侧检验:在比较甲乙两种药物的疗效时, 事先不能确定哪种药的疗效较好,只关心两药 的疗效有无差别,要用双侧检验。双侧检验若 有差别,单侧检验肯定有差别;反之,单侧检 验若有差别,双侧检验不一定有差别。 单侧检验更容易得到有统计学意义的结论。
140 150 138 120 140 145 135 115 135 130 120 133 147 125 114 165 —
差值d (4)
27 25 12 -10 -10 0 0 10 7 -5 20 3 37 10 -6 10
d 130
d2 (5)
725 625 144 100 100 0 0 100 49 25 400 9 1369 100 36 100
2、选定检验方法和计算检验统计量
根据研究设计方案、资料类型、样本含量 大小及分析目的选用适当的检验方法,并根据 样本资料计算相应的检验统计量;不同的检验 方法要用不同的公式计算现有样本的检验统计 量(t ,u,F值)。检验统计量是在H0成立的前 提下计算出来。
3、确定P值,作出统计推断 P值是指由所规定的总体作随机抽样, 获得
医学统计学-假设检验

3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立
布
F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。
假设检验2

检验。
两样本均数比较的t检验
•
假定两样本所代表的总体分别服从正态分
布 N (1,12 ) 、N (2 , 22 ),若两总体方差相等
(12 = 22 ),可估计出两者的合并方差 Sc2
x1 x2 2 2 x2 x1 2 2 n 1 S n 1 S n n 1 2 2 1 2 Sc2 1 n1 n2 2 n1 n2 2
•
选用双侧检验还是单侧检验需要根据分析目的及专业 知识进行确定 在没有充分理由进行单侧检验时,为了稳妥起见,建 议采用双侧检验
•
•
应该在假设检验的第一步建立检验假设时确定,不应
该在算得检验统计量后主观确定,否则可能得到相反 的结论
2. 选定检验方法,计算检验统计量
2 N ( , ), 已知观察变量血红蛋白值服从正态分布
•
两小样本均数比较时,要求两样本均来自正态
分布总体,且两样本总体方差相等
•
对两大样本(n1、n2 均大于50)的均数比较,可用Z 检验
配对设计均数的比较
亦称为配对 t 检验(paired samples t test)
•
配对设计资料主要有以下三种情况
配对的两个受试对象分别接受两种不同处理之 后的数据 同一样品用两种方法(或仪器)检验出的结果 同一受试对象两个部位的测定数据
n n 1 3 n 1 Xi X KURT n 1 n 2 n 3 i 1 S n 2 n 3
n 4 2
S KURT
24n n 1 n 3 n 2 n 3 n 5
假设检验

假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
假设检验的基本思想

假设检验的基本思想假设检验的基本思想⼀、总结⼀句话总结:> 假设检验的基本思想是【“⼩概率事件”原理】,其统计推断⽅法是带有某种概率性质的【反证法】。
> 【⼩概率思想】是指⼩概率事件在⼀次试验中基本上不会发⽣。
> 【反证法思想】是先提出检验假设,再⽤适当的统计⽅法,利⽤⼩概率原理,确定假设是否成⽴。
即为了检验⼀个假设H0是否正确,⾸先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。
【如果样本观察值导致了“⼩概率事件”发⽣,就应拒绝假设H0,否则应接受假设H0】。
> 对于不同的问题,检验的显著性⽔平α不⼀定相同,⼀般认为,事件发⽣的概率【⼩于0.1、0.05或0.01等】,即“⼩概率事件”。
1、假设检验(hypothesis testing)?> 假设检验(hypothesis testing),⼜称统计假设检验,是⽤来判断【样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断⽅法】。
> 【显著性检验】是假设检验中最常⽤的⼀种⽅法,也是⼀种最基本的统计推断形式,其【基本原理】是【先对总体的特征做出某种假设】,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。
> 常⽤的【假设检验⽅法】有【Z检验、t检验、卡⽅检验、F检验等】⼆、假设检验的基本思想来看看百度百科的说法:假设检验(hypothesis testing)假设检验(hypothesis testing),⼜称统计假设检验,是⽤来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断⽅法。
显著性检验是假设检验中最常⽤的⼀种⽅法,也是⼀种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。
常⽤的假设检验⽅法有Z检验、t检验、卡⽅检验、F检验等基本思想假设检验的基本思想是“⼩概率事件”原理,其统计推断⽅法是带有某种概率性质的反证法。
假设检验的5个步骤

假设检验的5个步骤假设检验是一种常用的统计分析方法,用于从样本数据得出关于总体参数的推断,借助统计学的方法进行识别。
它的基本思想是通过对样本数据的分析,判断总体参数是否具有某种特定的性质。
下面将介绍假设检验的五个基本步骤:1. 提出假设:假设检验的第一步是提出一个原假设(H0)和一个备择假设(H1)。
原假设通常是我们希望验证或者接受的假设,而备择假设则是对原假设的否定或者其他可能的假设。
这两个假设应该是互斥的,即它们不能同时成立。
2. 确定显著性水平:显著性水平(α)是我们在假设检验中设置的决策标准,用于判断样本数据对原假设的支持程度。
通常情况下,α的取值为0.05或0.01,这意味着我们愿意接受犯错的风险为5%或者1%。
3. 选择合适的检验统计量:根据研究目的和所要检验的参数,选择适当的检验统计量。
常用的统计量包括z检验和t检验等。
它们的选择基于总体分布的已知信息,例如总体均值的标准差是否已知、样本容量的大小等。
选择合适的检验统计量可以提高假设检验的效能。
4. 计算检验统计量的值:利用样本数据计算出检验统计量的具体值。
这个值反映了样本数据与原假设相符或者不符的程度。
与检验统计量配套的还有自由度,它用于确定理论上的分布和对应的临界值。
根据计算出的检验统计量的值和自由度,可以查找相应的临界值。
5. 做出决策:根据检验统计量的值和临界值比较,可以进行决策并给出相应的结论。
如果检验统计量的值落在拒绝域(即超过临界值),则拒绝原假设,接受备择假设;否则,接受原假设。
同时,还可以计算p值来辅助决策。
p值是指在原假设下,观察到的样本结果或者更极端结果发生的概率。
根据预先设定的显著性水平,如果p值小于显著性水平,则拒绝原假设,接受备择假设。
总之,假设检验是一种基于样本数据的统计方法,它包括假设的提出、显著性水平的确定、检验统计量的选择和计算、以及做出决策这五个基本步骤。
合理地应用这些步骤可以帮助我们从样本中得出关于总体参数的推断,并作出科学、准确的统计决策。
假设检验

例3.某厂生产的一种钢筋,其抗断强度一直服 从正态分布,今换一批材料生产,问其抗断强 度是否仍服从正态分布? 更一般的问题是:如何根据抽样的结果来判 断总体X的分布函数F(x)是否等于给定的函数 F0(x)。 上述例子所代表的问题是很广泛的,它们 的共同特点是:先对总体的参数或总体的分布 函数的形式作某种假设H0,然后由抽样结果对假 设H0是否成立进行推断。为此需要建立检验假设 的方法。在数理统计学中,称检验假设H0的方法 为假设检验。
现从该厂生产的螺钉中抽取容量为 36 的样本, 其样本均值为 x 68 . 5,问原假设是否正确?
若原假设正确, 则
X ~ N (68 , 3.6
2
)
36
偏离较远 因而E ( X ) 68,即 X 偏离68不应该太远, 是小概率事件, 由于
X 68 3.6 6
X 68
~ N (0,1)
(4)比较
x 570
/
n
与 z
1
的值的大小。现在
x 570
/
n
2 .0 5 5 1 .6 4 5 z 1
(5) 拒绝假设H0即接受H1.也就是新生产 的铜丝的折断力比以往生产的铜丝的折断力 要大.
以上三种检验法由于都是使用U的分布,故又 名U检验法.
二.2未知时,均值的假设检验
小概率原理又称实际推断原理,它是概率论 中一个基本而有实际价值的原理,在日常生活中 也有广泛应用。人们出差,旅行可以放心大胆地 乘坐火车,原因是{火车出事故}这事件的概率 很小,在一次试验(乘坐一次火车)中,这个小 概率事件实际上不会发生的。
第一节 假设检验的概念 1.定义: 先对总体X的分布函数或参数提出假 设,然后通过抽样并根据样本提供的信息对假设 的正确性进行推断,作出接受或拒绝假设的决策. 这一过程称为假设检验. 2.参数假设检验和非参数假设检验 3.理论依据 实际推断原理:小概率事件在一次试验中(几 乎)是不可能发生的.
浅谈假设检验基本思想及其应用5

假设检验[摘要]:假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
假设检验在经济和社会生活各个领域得到了极为广泛的应用。
本文主要阐述假设检验的基本思想,一般步骤,应用和几种常见的检验方法:U检验、T检验、比例检验、卡方检验等。
[关键词]:假设检验、检验方法、数理统计。
我在学习《概率论与数理统计》时通常的感觉是“课文看得懂,习题做不出”。
要做出题目,至少要弄清概念,有些还要掌握一定的技巧。
这句话说起来简单,但是真正的做起来就需要花费大量的力气。
我在学习时,只注重公式、概念的记忆和套用,自己不对公式等进行推导。
这就造成一个现象:虽然在平时的做题过程中,自我感觉还可以;尤其是做题时,看一眼题目看一眼答案,感觉自己已经掌握的不错了,但一上了考场,就考砸。
这就是平时的学习过程中只知其一、不知其二,不注重对公式的理解和推导造成的。
在看书的时候注意对公式的推导,这样才能深层次的理解公式,真正的灵活运用。
做到知其一,也知其二。
现在概率统计的考试考的是基础知识,主要涉及排列组合、导数、积分、极限这四部分。
说这部分是基础,本身就说明这些知识不是概率统计研究的内容,只是在研究概率统计的时候不可缺少的一些工具。
即然这样,在考试中就不会对这部分内容作过多的考察,也会尽量避免在这些方面丢分。
有些人花大量的力气学习微积分,甚至学习概率统计之前,将微积分重现学一边,这是不可取的。
对这部分内容,将教材上涉及到的知识选出来进行复习,理解就可以。
万不能让基础知识成为概率统计的拦路虎。
学习中要知道那是重点,那是难点。
如何掌握做题技巧?俗话说“孰能生巧”,对于数学这门课,用另一个成语更贴切“见多识广”。
对于我们而言,学习时间短,想利用“孰能生巧“不太现实,但是”见多识广“确实在短时间内可以做到。
这就是说,在平时不能一味的多做题,关键是多做一些类型题,不要看量,更重要的是看多接触题目类型。
假设检验的基本思想及其步骤1.1 假设检验的基本思想假设检验是指对总体提出某项假设,然后利用从总体中抽样所得的样本值来检验所提的假设是否正确。
假设检验的基本思想和有关概念的教学设计

㊀㊀㊀㊀㊀假设检验的基本思想和有关概念的教学设计假设检验的基本思想和有关概念的教学设计Һ魏满满1㊀李石虎2∗㊀周㊀勤2㊀(1.江苏师范大学科文学院,江苏㊀徐州㊀221116;2.江苏师范大学数学与统计学院,江苏㊀徐州㊀221116)㊀㊀ʌ摘要ɔ本文主要探究了假设检验的基本思想和有关概念的教学设计.首先,通过 女士品茶 的故事引入,提炼出假设检验的基本思想;其次,通过分析项链含金量这一实际案例总结出假设检验的基本步骤,并介绍了假设检验的两类错误和p值的概念;最后,融入思政的元素,丰富了课堂教学内容.ʌ关键词ɔ假设检验;教学设计ʌ基金项目ɔ江苏师范大学课程思政专项研究(KCSZY17);江苏师范大学数学与统计学院思政示范课程(XYKCSZ01)一㊁引㊀言概率论与数理统计课程是各个高校理工科的基础必修课,它在理工科及经管类各专业被广泛应用.假设检验是概率论与数理统计中的重要知识点,是统计推断的主要方法之一,在概率统计的理论研究与实际应用中都占有极其重要的地位.2019年3月18日,在学校思想政治理论课教师座谈会上,习近平总书记明确提出[1]:要坚持灌输性和启发性相统一,注重启发性教育,引导学生发现问题㊁分析问题㊁思考问题,在不断启发中让学生水到渠成得出结论.近年来,各大高校都十分重视思政建设,通过教师培训㊁专家讲座㊁示范课程等多种方式来加深教师对课程思政的理解.教师是高校的 第一主角 ,作为专业课教师,也有责任和义务认真挖掘所授课程的 思政元素 .例如,2021年,李晨和陈丽萍[2]在研究概率统计的思政元素时,以概率学者的文化素养和科学治学精神为切入点,通过多个实际案例剖析全概率公式的应用,潜移默化地引入诸多思政元素来激发学生的学习兴趣.受此启发,本文着重从概率论与数理统计课程中 假设检验 这一角度思考,通过教学设计来探索课程思政理念进概率统计课堂的实践方法,目的就是同大家交流如何上好 假设检验 这一知识点的教学课.首先,我们通过 女士品茶 这一广为流传且富有趣味性的故事引入,启发学生思考,从中提炼出假设检验的基本思想.其次,我们通过分析项链含金量这一实际案例总结出假设检验的基本步骤.接着,我们介绍假设检验的两类错误和p值的概念,并介绍假设检验的一些应用.最后,我们融入思政的元素,以我国著名数学家严加安院士的‘悟道诗“为结尾,阐述了概率统计的基本思想,同时激励学生向老一辈科学家学习,树立正确的价值观,从而丰富了课堂教学内容.二㊁教学过程(一)问题引入首先,我们从一个经典故事出发,来体会假设检验的基本思想.例1[3]㊀(女士品茶试验)故事发生在英国剑桥大学,那是20世纪20年代,一群大学精英们正在品茶.该茶是由牛奶和茶水混合而成的.在品茶过程中,一位女士宣称:先加入牛奶还是先加入茶,不同的顺序会使茶的口感不同.周围人都认为这位女士简直是在胡言乱语,这是不可能的啊!然而在场的统计学家Fisher却对这个话题很感兴趣,他请人端来10杯调制好的茶让该女士品尝,其中有的是先加的牛奶,有的是先加的茶.结果,这位女士正确地鉴别出每一杯茶的制作顺序.该如何判断该女士是否有鉴别能力呢?Fisher的想法:假设该女士没有鉴别能力,这个时候她只能靠猜,从而她猜对的概率为12.因此,她能同时判断出10杯茶的概率为2-10<0.001,这个概率非常非常小,仅仅做一次试验是几乎不会发生的,可是,它却发生了!这表明原假设不恰当,应予以拒绝,认为该女士有鉴别能力!假设检验的基本思想:小概率反证法思想.先提出假设,然后设计试验,在原假设成立的条件下计算概率,依据小概率原理来判断是否拒绝原假设.那么多大的概率属于小概率呢?对于不同的问题,会有不同的标准,在统计学中,这个小概率称为显著性水平,常取0.05或0.01.接下来,我们就通过生活中的一个实际案例来探索一下假设检验的奥秘.(二)实例分析在生活中,经常会遇到一组数据,我们来看下面的例子.例2[4]㊀质检部门接到投诉后,对某金店进行调查,从标有18K的一批项链中抽取20条,测得其含金量如下:表1㊀某金店项链含金量数据单位:K17.618.117.918.318.017.417.518.617.317.817.317.818.117.417.618.017.218.318.317.5∗通信作者:李石虎,男,讲师,博士,就职于江苏师范大学,研究方向为概率论与数理统计.联系方式:江苏省徐州市江苏师范大学泉山校区数学与统计学院;电话邮编:221116;E-mail:shihuli@jsnu.edu.cn.㊀㊀㊀㊀㊀㊀问:如何判断这批项链有没有达到标准呢?(显著性水平α=0.05)分析:观察表1中的数据,我们可以发现:有的含金量大于18K,有的含金量小于18K,还有的恰好等于18K.那么我们能否直接说和标准值18K有显著差别呢?根据所学的统计学思想方法,我们已经了解到答案是否定的,因为这里看到的只是样本数据,我们无法直接做出判断.那么应该如何判断呢?我们的思路如下:首先,计算出这20条项链含金量的平均值为17.8,它与标准值18存在0.2的差值.这0.2的差值是由抽样引起的误差,还是有本质的差别?我们利用上述思想来检验一下.令ξ表示这批项链的含金量,由中心极限定理可知ξ ㊃N(μ,σ2),我们要检验均值是否为μ=18,具体步骤如下:1.建立假设.原假设H0:μ=18,表示这批项链符合标准;与之对立的备择假设H1:μʂ18,表示这批项链不符合标准.2.在H0成立时,由Fisher定理可知统计量T= x-μSnnt(n-1)=t(19).3.由T分布图像(如图1)可以看出:T的取值集中在零点附近.这表明:|T|越大,对应的概率就越小.从而存在临界值C,使得|T|大于或等于C是一个小概率事件,则C要满足P(|T|ȡC|H0成立)=α,再由T分布图像的对称性可知C=t0.975(19)ʈ2.093.图1㊀T分布图像从而,当|T|ȡ2.093时,非常小的概率事件在此就发生了,只能拒绝原假设H0.我们将W={(ξ1,ξ2, ,ξn)||T|ȡ2.093}这一集合称为拒绝域,如果样本的观测值落到W中,则原假设应被拒绝.4.代入样本均值和样本标准差进行计算,得到所观测的样本统计量t的值:|t|=|17.8-18|0.4039320ʈ2.214>2.093,其落到拒绝域W中,因此原假设被拒绝,故这批项链没有达到标准.为了更直观地理解拒绝域的含义,同学们可以参考T分布图像.小结㊀本案例利用假设检验思想得出了该金店项链的含金量不符合标准的结论,启发我们对待任何事情都不要抱有侥幸心理,不要弄虚作假,要诚信做人做事,方能赢得大家的信任.项链含金量不达标可能只是使消费者金钱方面的利益受损.试想一下:如果是某大型婴儿奶粉企业检测出质量不达标的产品呢?再或者是婴儿霜经检测含有毒物质呢?抑或是我们服用的某种药物检测出有危害健康的成分呢?这些案例都不是捕风捉影,均上过各大网站热搜,引起了消费者的恐慌.利用假设检验这个工具,有助于我们全面地认识这类事件,既可以让我们避免无谓的损失,又可以帮助我们找到有利的取舍依据.(三)假设检验的基本步骤通过对上述案例的分析,我们可以归纳出求解假设检验的基本步骤:第一步:从要研究的实际问题引入,先提出一个假设,一般称之为原假设,记为H0,与其对立的假设称为备择假设,记为H1.例如,在上述案例中,原假设为 这批项链符合标准 ,备择假设为 这批项链不符合标准 .第二步:依据所研究总体服从的分布,我们来构造合适的检验统计量,并通过所学知识来确定统计量服从的分布.第三步:接下来,我们需要确定检验的拒绝域W使得P((ξ1,ξ2, ,ξn)ɪW|H0成立)ɤα.第四步:根据样本数值计算统计量所对应的观测值.如果计算所得观测值落进了W中,则说明原假设不当,应予以拒绝,否则原假设不可以被拒绝.(四)假设检验的两类错误在 女士品茶 的例子中,如果该女士本来就没有鉴别能力,但是她运气好,每次都猜对了,这时候我们的推断就出错了.事实上,在假设检验问题中,我们由样本提供的信息来推断总体信息,由于样本只包含总体的一部分信息,这就不可能保证从来不会犯错误.假设检验可能犯的错误有如下两类:(Ⅰ)是否在 拒绝假设H0 时用了 小概率原理 .注意小概率事件并非不可能事件,如果原假设本为真,但由于样本值落进了拒绝区域内而得出 拒绝 的结论,这里犯的错误为弃真错误,通常称为第一类错误,记为α,即P(拒绝H0|H0为真)=α.(Ⅱ)反之,如果原假设H0本来是不成立的,却由于样本值未落进拒绝区域而得出 不能拒绝 的结论.这里的错误是纳伪错误,一般称为第二类错误,记作β,即P(接受H0|H0不真)=β.根据检验法则知:当H0成立时,拒绝H0的概率小于或等于显著性水平α,但是显著性水平α取得越小越好,因为㊀㊀㊀㊀㊀此时拒绝域也会相应地减小,从而导致犯第二类错误的概率增大.这是一个矛盾的双方,类似于区间估计时的做法,我们需要先固定显著性水平α,再选择合理的检验统计量来适当地减小β的值.下面我们再结合一个实际例子来理解两类错误:在新冠肺炎疫情发生初期,新闻报道中时常会出现 假阳 的检测结果.我们可以从假设检验的两类错误的角度来理解:事实上,任何检验方法都会存在犯错误的可能性,理想的试剂应是 假阴 和 假阳 出现的概率都越小越好,但当样本量有限㊁检测技术没有明显优化提升时,一类错误概率的减少必会导致另一类错误概率的增加,因此处理原则是:人为限定犯第一类错误的概率α,为降低犯第二类错误的概率,我们可以增大样本容量.所以,从统计学的观点看,新闻报道中的 假阴 假阳 患者出现并不奇怪.启发:小概率事件虽然在一次试验中不易发生,但绝非不可能事件,重复次数多了,发生的可能性也就增大了.这说明做任何事情都不要存在投机取巧的心理,俗话说 常在河边走,哪有不湿鞋 勿以恶小而为之,勿以善小而不为 .反之,再困难的事情,只要我们持之以恒,总是可以成功的,正所谓 锲而不舍,金石为开 !(五)假设检验的p值可以看出,显著性水平α变小,对应的拒绝域也会变小;当显著性水平α取得足够小时,使得样本值不落在相应的拒绝域中,从而在此显著性水平α下不能拒绝假设H0.当显著性水平α由上述足够小的值不断增大时,对应的拒绝域也会变大,当显著性水平α大到一定程度时,便可以使样本值落入相应的拒绝域中,从而在此显著性水平α下可以拒绝假设H0.对于一个确定的样本值,存在一个实数p(0<p<1),当显著性水平α=p时可以拒绝H0,而当α<p时原假设H0不可以被拒绝.可见,p是使依据给定样本数值做出 拒绝H0 的最小的那个显著性水平,我们称之为检验的p值.在例2中,我们也可以通过统计软件计算t统计量的值和p值:表2㊀某金店项链含金量检验结果检验值=18tdfp值均值差值项链含金量-2.214190.039-0.20000给定显著性水平α为0.05,由表2可知p值0.039<0.05,原假设应被拒绝,认为项链含金量与18K之间有显著的统计差异,从而得出 项链不符合标准 的结论.(六)课堂小结与思政本节课我们主要通过 女士品茶 的案例引入假设检验的基本思想,通过分析项链含金量这一实际案例总结出假设检验的基本步骤,也给出了假设检验的两类错误和p值的含义,这为接下来进一步学习不同类型的㊁具体的假设检验打下了必要的基础.假设检验不仅是一种重要的统计方法,更是一种思维方式,告诉我们用数据来说话,理性地看待问题.正因为如此,假设检验在我们的现实生活中有着十分重要的应用.比如,专家利用假设检验,结合临床数据分析不同采样点㊁人群㊁年龄的新冠病毒核酸检测的结果,给有关部门的决策提供参考.假设检验的理论方法不仅被广泛应用于医学检验㊁生物制药等诸多领域,在我们的生产生活,特别是工业产品的质量判断中也有着十分广泛的应用[5],因为在工厂的实际生产过程中,产品的尺寸总是左右浮动的,存在一定的误差,那么如何判断这些误差是否在允许的范围内?这就要用到假设检验的思想方法.不仅如此,假设检验的理论还可应用于文学研究.例如,东南大学韦博成教授在2009年[6]利用假设检验的理论方法分析了‘红楼梦“前80回与后40回的某些文风差异,得到的结论是 这两部分内容在写作风格方面存在明显的差异 ,给关于‘红楼梦“作者的论断提供了一个强有力的证据.在现实生活中,数据是无处不在的,学习假设检验的思想方法有助于我们正确地挖掘数据背后的规律,做出更客观的判断.如今,我们身处一个大数据时代,通过学习假设检验,更重要的是培养透过现象看本质这一统计思维.这里,调查得来的数据是现象,规律是从数据中探索出来的本质属性.我们需要借助数学模型,并结合统计方法来寻找这其中的规律和随机性,在潜移默化中培养统计思维.正如我国著名的数学家严加安院士在‘悟道诗“中所题:随机非随意,概率破玄机;无序隐有序,统计解迷离.注:课后同学们若想进一步了解统计学的发展历程,可以读一读‘20世纪统计怎样变革了科学:女士品茶“[7]这一科普著作.ʌ参考文献ɔ[1]习近平主持召开学校思想政治理论课教师座谈会[N].新华社,2019-03-18,20:57.[2]李晨,陈丽萍.概率论与数理统计课程教学中思政元素的挖掘与实践[J].大学教育,2021(9):104-106.[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程:第3版[M].北京:高等教育出版社,2019.[4]朱元泽,李贤彬.概率论与数理统计[M].上海:上海交通大学出版社,2015.[5]乔静.假设检验在工业产品质量判断中的应用[J].机电信息,2020(27):142-143.[6]韦博成.‘红楼梦“前80回与后40回某些文风差异的统计分析(两个独立二项总体等价性检验的一个应用)[J].应用概率统计,2009(4):441-448.[7]萨尔斯伯格.20世纪统计怎样变革了科学:女士品茶[M].北京:中国统计出版社,2004.。
4. 假设检验和t检验

3)H1的内容直接反映了检验单双侧。若H1中只是 0 或只是 <0,则此检验为单侧检验。它不仅考虑 有无差异,而且还考虑差异的方向。 4)单双侧检验的确定,首先根据专业知识,其次根据 所要解决的问题来确定。若从专业上看一种方法结果不 可能低于或高于另一种方法结果,此时应该用单侧检验。 一般认为双侧检验较保守和稳妥。
(3) 检验水准,是预先规定的概率值,它确定了 小概率事件的标准。在实际工作中常取 = 0.05。 可根据不同研究目的给予不同设置。 例如本题:
H 0 : 0 136.0
H1 : 0
= 0.05
2. 计算检验统计量
根据变量和资料类型、设计方案、统计推断的 目的、是否满足特定条件等(如数据的分布类 型)选择相应的检验统计量。 如 t 检验、z检验、
126.45 105.11 179051 1391 / 11 101971 946 / 9 1 1 ( ) 11 9 2 11 9
2 2
2.671
=n1+n22=11+9-2=18
(3)确定P值,作出推断结论
以=18, 查 t 界值表得 0.01<P<0.02。 按=0.05 水 准,拒绝 H0,接受 H1,差异有统计学意义。可以认为 两种饲料对小鼠的体重影响不同。
案例10-13
0 136.0g / L, n 25, X 121g / L, S 48.8g / L;
造成 X 0 的可能原因有二: ① 抽样误差造成的; ② 本质差异造成的。
假设检验目的——判断差别是由哪种原因造成的。
一种假设H0
炊事员血红蛋白总体均数
136.0g/L
不同。
( 二)单样本 z 检验