Chapter7假设检验Hypothesistesting.
第七讲-假设检验
• 这里备择假设H1包含了 >0和 <0两方面。
13
H0: = 34.50 (该矿区新生儿的头围与当 地一般新生儿头围均数相同) H1: ≠ 34.50 (该矿区新生儿的头围与当 地一般新生儿头围均数不同)
2. 计算检验统计量
根据变量和资料类型、设计方案、 统计推断的目的、是否满足特定条件等 (如数据的分布类型)选择相应的检验统 计量。
2 1 2 2
2.9 5.2 1.9 / 32 2.7 2 / 40
2
4.23
两均数之差的标准误的估计值
由 于 u0.05/2=1.96 , u0.01/2=2.58 , |u|>u0.01/2, 得 P<0.01 ,按 α=0.05 水准,拒绝 H0 ,接受 H1 ,两 组间差别有统计学意义。可以认为试验组和对 照组退热天数的总体均数不相等,两组的疗效 不同。试验组的平均退热天数比对照组短。 例7-7已计算了的95%的可信区间: -3.3~-1.3 天, 给出了两总体均数差别的数量大小。
4
例 8-3(续例 7-7) 为比较某药治疗流行性出血热的疗效,
二、两样本比较的 u检验 (two-sample u-test) 适用于两样本含量较大 ( 如 n1>30 且 n2>30) 时。 检验统计量为
将 72 名流行性乙型脑炎患者随机分为试验组和对照组, 两组的例数、均数、标准差分别为: n1 32 , X 1 2.9 ,
2
• 本例中一个总体均数已知,是特定的; • 另一个总体均数未知,只知道其中的一个样 本,属于单样本检验。 • 建立以下假设: H0: =0, 即 H1:≠0。 H0: =34.50, H1: ≠34.50。
第十七章 假设检验(hypothesis testing)
A B 40 73 69 182
非参数检验(nonparametric test )
概念:在总体分布不明确或明显偏离正态情况下,
对总体进行差异性推断的一种统计方法,其检验的
是分布,而非参数。
应用范围:
配对资料的秩和检验 两样本成组比较秩和检验 多样本比较的秩和检验 等级分组资料的秩和检验
定结果是否不同?
表2 两种方法对乳酸饮料中脂肪含量的测定结果(%)
编号
哥特里-罗紫法
脂肪酸水解法
1
0.840
2
0.591
3
0.674
4
0.632
5
0.687
6
0.978
7
0.750
8
0.730
9
1.200
10
0.870
0.580 0.509 0.500 0.316 0.337 0.517 0.454 0.512 0.997 0.506
两样本成组比较的秩和检验
例3 为了研究血铁蛋白与肺炎的关系,随机抽取了肺炎患 者和正常人若干名,测得血铁蛋白(μg/L),数据如下表, 请问两种人血铁蛋白总体分布是否相同?
cards; 68 100 83 101 69 120 100 180 110 100 180 240 55 120 200 170 210 300 120 105 ; proc univariate;
var x; run;
例2 用两种方法测定肺炎患者的尿铁蛋白,测量结果如下 表所示,试问,这两种方法测的结果是否有差别?
一、样本均数与总体均数差异的t检验 x
1.数学模型 t 2. SAS过程(编程) S X
用means过程,检验μd = μ- μ0 =0,其检 验相当于总体均数μ=μ0 。
假设检定Hypothesistesting
的機率為何。(0.0475) • 2.定α為0.05,請問此拒絕域的臨界值為何。(55.065) • 3.若所抽出樣本平均值為59分鐘,請問此症改善是否有效。
(can’t reject H0)
9
• Example:
– H1,與虛無假設對立之假設。
• 顯著性(significance):
– 有足夠的證據推翻虛無假設時,稱此檢定具顯著性。
2
•Example:
•根據2000年研究報告顯示,小學生每日上網平均時數不到30分 鐘,因電腦普及網路發展迅速,主管機關認為其平均值已改變, 大於30分鐘。問本題中的虛無假設及對立假設為何。
5
檢定力
• 1-β:power (power of a test)。
– 檢力 or 檢定力。正確的拒絕虛無假設的機率。 – 1-β= P(拒絕H0│H1為真)
6
• 檢定
– 1.檢定事件發生的p值:p<α/2 or p<α reject H0
– 2.檢定信賴區間:是否包含μ0。 – 3.檢定臨界值:Z值。
7
• 歸納結論
– 事件發生的機率(P)是否小於顯著水準(α) – 是否有足夠的證據拒絕虛無假設(reject H0)。 – 當無法拒絕H0時,可能是沒有足夠的證據,而非H0是
必然正確的。
8
• Example
– 大台北地區民眾每日上班所花費的車程時間很長,經 過政府改善後,希望能降至1小時以下,假設上班通車 時間符合常態分配,已知標準差為18分鐘,今我們隨 機抽出36個樣本,則:
– 某廠商宣稱其所開發的魚線平均強度為8公斤,標準差 為0.5公斤。茲從其中隨機抽出50條魚線,測其平均強 度為7.8公斤,(α=0.01;Z0.01=-2.33;Z0.005=-2.575)
HypothesisTesting假设检验讲义中英文版
2
1
2
X
Risk
Risk
10
❖ 可信区间 确定了总体参
数中样本统计可能的数 值范围. 它们可以是单 边也可是双边。
▪ 样本均值、样本标准偏差、样本 方异和其它样本统计被称为特征 值评估者。因为它们是用以代表 总体参数的单一数值。
2
1
2Leabharlann XRiskRisk
11
❖ Point Estimates of parameters and Confidence Interval Interpretation are both means for making inferences about sample data.
▪ Sample Means, Sample Standard
deviation, Sample Variances and other sample statistics are known
as Point Estimators because
they are single values used to represent population parameters
❖ Hypothesis tests are designed to help us make an inference about the true population value at the desired level of confidence.
Hypothesis Tests help determine if an apparent
为何要选取样本?
总体: 统计总体 用以定义所有可知或不可知参数(m, s) 的数据或信息
可能出现取样 错误吗?
应取多少样本?
医学课件第七讲假设检验
在自然科学和社会科学等中,常常要对某 些重要问题做出回答:是或否。如月球比地球 早形成吗? 一种新药对某种病有效吗? 某种 股票会涨吗? 新推出的电视节目收视率高吗?
等等。为了回答这些问题,我们需要对感兴趣 的问题进行试验或观察获得相关数据,根据这
些数据决定是或否的过程称为假设检验。
(Hypothesis Testing)
检验的显著性水平
当样本容量 n 固定时,要减少犯第一类错 误的概率,就会增大犯第二类错误的概率;反 之,若要减少犯第二类错误的概率,就会增大 犯第一类错误的概率。即就是说当样本容量固
定时,不可能同时减少犯两类错误的概率,这
是一对不可调和的矛盾。
Neyman-Pearson检验原理就是控制犯第一 类错误的概率在给定的范围内,寻找检验使得 犯第二类错误的概率尽可能的小,即就是使检 验的功效尽可能的大。这样就是在给定一个较
H0 : 0 , H1 : 1 (1 0 )
似然比为
(x)
p( x1 ,, xn , 1 ) p( x1 ,, x, 0 )
1
2
n exp
1
2 2
n
( xi
i 1
1
)2
1
2
n exp
1
2 2
n
( xi
i 1
0
)2
exp
1
2 2
n
[(xi
i 1
1 )2 ( xi
H0为简单假设(Simple Hypothesis), 否则称为复 合假设(Composite Hypothesis), 对备择假设也有 简单假设和复合假设。
拒绝域、接受域、检验统计量
检验一个假设,就是根据某一法则在原 假设和备择假设之间做出选择,而基于样本x
社会统计学,卢淑华(第4版),第7,8章.pptx
假设检验的基本步骤
第1步:提出原假设和备择假设。 支持的命题为:备择假设 备择假设的对立面则为原假设 第2步:选择适当的检验统计量(test statistic) ,并 根据样本信息计算检验统计量的值
估计量-假设(H 0 )值 标准化检验统计量= 标准误差
第3步:选择显著性水平,确定临界值
总体参数的区间估计
用样本信息检验总体信息
第七章 假设检验 Hypothesis testing
一、假设检验的基本内容
(一)假设检验的基本思想 假设检验(hypothesis testing)是除参数估计之 外的另一类重要的统计推断问题。它的基本思想可以 用小概率原理来解释。所谓小概率原理,就是认为小 概率事件在一次试验中是几乎不可能发生的。也就是 说,如果对于总体的某个假设是真实的,那么不利于 或不可能支持这一假设的小概率事件A在一次试验中 几乎是不可能发生的,要是一次试验中事件A竟然发 生了,我们就有理由怀疑这一假设的真实性,拒绝这 一假设。
原假设 H0 原假设(null hypothesis)通常是研究 者想收集证据予以反对的假设,也称为 零假设,用表示。一般来说,原假设建 立的依据都是已有的、具有稳定性的, 从经验看,没有发生条件的变化,是不 会被轻易否定的。换句话讲,进行假设 检验的基本目的,就在于作出决策:接 受原假设还是拒绝原假设。
临界值计算 比较判断
由于 z 2.77 z 1.645
故不能拒绝原假设。
例6(P251) H0:μ≤20
右侧检验 H1:μ>20 假设设定
分析:正态总体,方差未知,小样本
统计量选择
统计量计算
23.5 20 t 3.5 s/ n 3/ 9
x 0
第7章-假设检验0916PPT课件
利用样本信息判断(检验)假设是否成立
.
5
内容提要
假设检验的概念
假设检验的基本思想
假设检验的步骤
假设检验中的两型错误
.
6
假设检验的基本思想
小概率反证法
在一次研究或观察中,如果出现了假设H0成立 情况下的小概率事件,由于推理过程是严密的, 就只能认为假设不成立,应予拒绝或否定,并 接受它的对立面H1(或HA)
31.821 6.965 4.541
63.657 9.925 5.841
127.321 14.089
7.453
318.309 22.327 10.215
636.619 31.599 12.924
1.190 2.132 2.776 3.747 4.604 5.598 7.173 8.610
…
…
…
…
…
1.055 1.697 2.042 2.457 2.750
检验形式 双侧检验
单侧检验
本例中单双侧检验假设的形式
目的 是否0 是否>0 是否<0
研究假设 0 >0 <0
H0 =0 =0 =0
H1 0 >0 <0
.
14
1.建立检验假设,确定检验水准
H0: =140g/L,高原地区成年男子平均Hb量
与一般人群相等
H1: >140,高原地区成年男子平均Hb量高于
|t|界值表(P316)
概
率, P
0.150 0.050 0.025 0.010 0.005 0.0025 0.001 0.0005
0.300 0.100 0.050 0.020 0.010 0.005 0.002 0.001
第7章假设检验
第七章假设检验上一章介绍了总体均数的估计方法—区间估计,即在给定的置信度下(如95%),采用样本统计量X估计总体参数 的可能范围。
区间估计属于统计推断(statistical inference)的内容之一,本章介绍另一类重要的统计推断方法―假设检验(hypothesis test)。
第一节基本思想下面通过两个例子介绍假设检验的目的和基本思想。
例7.1 将病情相似的某病患者随机分配到两组,分别接受A和B两种不同的治疗方法,观察两组疗效的差异,结果见表7.1。
表7.1 两组患者的疗效比较治疗方法疗效合计有效率(%) 有效无效A 46 48 94 48.9B 34 60 94 36.2合计80 108 188 42.6 在本例中,A治疗方法共治疗了94例病人,其中46例有效,有效率为48.9%;B治疗方法也治疗了94例病人,其中34例有效,有效率为36.2%。
两种方法有效率的差异为12.7%,可否据此认为A治疗方法的疗效优于B方法呢?如果真实的情况是A方法与B方法具有相同的疗效,那么理论上A治疗组的有效率应该等于B治疗组的有效率。
但是,由于个体之间存在变异,即使两组使用同样的治疗方法,实际上也不一定得到完全相同的样本有效率。
A组的有效率48.9%是一个样本率,可以看成A治疗方法的总体有效率的一个样本估计值;B组的有效率36.2%也是一个样本率,也可以看成B治疗方法的总体有效率的一个样本估计值。
因此,这里不能立刻得出A治疗方法优于B治疗方法的结论。
A组与B组有效率之差为12.7%,其产生的原因可能有两种:一是仅由于抽样误差造成;二是总体率之差造成,即体现了两种疗法效果的本质差异。
这里所谓的“抽样误差造成”,指的是两种疗法的总体有效率本相同,样本率之差是由于偶然性造成的。
那么,本例中12.7%的有效率之差究竟是偶然性造成的,还是体现了两种疗法总体有效率的差异呢?假设检验可以帮助回答这个问题。
假设A 疗法和B 疗法的总体有效率相等,那么由于偶然性得到两组有效率相差12.7%以及更极端的情况(大于12.7%)的可能性有多大?如果能够算出这个可能性(即概率P 值)的大小,就可以下结论了。
假设检验(Hypothesis Testing)
假设检验(HypothesisTesting)假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
假设检验的基本思想1.小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
2.假设的形式H0——原假设,H1——备择假设双尾检验:H0:μ = μ0,单尾检验:,H1:μ < μ0,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
[精选]第五章假设检验研--资料
一般来说,推断结论应包括统计结论与专业
结论两部分
P ≤ ,按 水准,拒绝 H0 ,接受 H1 ,差异
有统计学意义(统计结论),可认为……不
同或不等(专业结论)
P > ,按 水准,不拒绝H0 ,差异无统计学
意义,尚不能认为……不同或不等
28 Hypothesis Testing
32
Hypothesis Testing
一、I型错误和II型错误的概念
Health Statistics
I型错误(type
I error): H0实际上是
成立的,但由于抽样的原因,拒绝了H0 , 这类“弃真”的错位称为I型错误,其最大 概率为
33
Hypothesis Testing
Health Statistics
t 2.1835 , P 0.0569 , 按 0.05 水 准 , 不 拒 绝
H0,差别无统计学意义,尚不能认为平原地区与高
原地区的红细胞均数不同
31 Hypothesis Testing
Health Statistics
【问题7-2】 上述结论是否正确?为什么?
【分析】
上述结论不正确。假设检验的结论不是绝 对正确的,可能犯错误
用概率来衡量证据的强度,概率越小拒绝
原假设的证据越强
30 Hypothesis Testing
第二节 I型错误和II型错误
Health Statistics
【例 7-2】假设平原地区正常成年男子红细胞数的参
12 12 数为 5.0010 / L , 0.4310 / L ;高原地区正常
20 Hypothesis Testing
Hypothesis Testing假设检验讲义(中英文版)(ppt 34页)
Or
不是全虚性假设(相同)就是选择性假设(相区别的)
20
Hypothesis Testing Guilty vs. Innocent Example
The American justice system can be used to illustrate the concept of hypothesis testing.
Sample Means, Sample Standard
deviation, Sample Variances and other sample statistics are known
as Point Estimators because
they are single values used to represent population parameters
process.
How should the sample be taken?
See section 5.
7
样本? 为何使用样本?
为何采用样本而非总体?
采用样本可减少时间和成本消耗 即使可能,获取总体数据也是非常困难的.
何时采用样本?
我们利用样本定流程基线 利用样本对过程的可控变化结果进行评估.
We will use confidence intervals and tests of sample means, variances and sample standard deviation to investigate difference and cause/ effect relationships using data.
第7章假设检验(新)
H1:
10 CM
2014-8-20
单侧检验----左侧检验
(原假设与备择假设的确定)
【例4】一项研究表明,改进生产工艺后,会使产 品的废品率降低到 2% 以下。检验这一结论是否成 立。 研究者总是想证明自己的研究结论 ( 废品率降 低)是正确的 备择假设的方向为“ <”( 废品率降低 ) (左侧 检验) 建立的原假设与备择假设应为
我认为该地区新生婴儿 的平均体重为3190克!
•假设是对总体参数的 一种看法 •总体参数包括总体均 值、比例、方差 •要对总体参数取确定 的值
2014-8-20
2、什么是假设检验(hypothesis test) ? 概念 先对总体的参数或分布形式提出某种假设, 然后利用样本信息判断假设是否成立的过 程。 类型 参数假设检验 非参数假设检验
第七章
2014-8-20
本章内容
第一节 假设检验的基本原理 第二节 总体参数的假设检验
2014-8-20
第一节 假设检验的基本原理
一、假设检验的基本问题
二、假设检验的两类错误 三、检验功效 四、P值检验
2014-8-20
(一)什么是假设检验
1、什么是假设?
假设:一个调研者或管理者对被调查总体的 某些特征所做的一种假定或猜想。
双侧检验(3)
抽样分布假设为标准正态分布 置信水平
z z / 2 , 应拒绝 H0
/2 1- /2
0 临界值 不能拒绝区域临界值 拒绝域 拒绝域 Z/ 检验统计量z
2014-8-20
Z/2
2
左侧检验(1)
抽样分布假设为标准正态分布 置信水平
1-
拒绝域 临界值 Z
假设检验(HypothesisTesting)
假设检验(HypothesisTesting)假设检验的定义假设检验:先对总体参数提出某种假设,然后利⽤样本数据判断假设是否成⽴。
在逻辑上,假设检验采⽤了反证法,即先提出假设,再通过适当的统计学⽅法证明这个假设基本不可能是真的。
(说“基本”是因为统计得出的结果来⾃于随机样本,结论不可能是绝对的,所以我们只能根据概率上的⼀些依据进⾏相关的判断。
)假设检验依据的是⼩概率思想,即⼩概率事件在⼀次试验中基本上不会发⽣。
如果样本数据拒绝该假设,那么我们说该假设检验结果具有统计显著性。
⼀项检验结果在统计上是“显著的”,意思是指样本和总体之间的差别不是由于抽样误差或偶然⽽造成的。
假设检验的术语零假设(null hypothesis):是试验者想收集证据予以反对的假设,也称为原假设,通常记为 H0。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值。
备择假设(alternative hypothesis):是试验者想收集证据予以⽀持的假设,通常记为H1或 Ha。
例如:备择假设是测试版本的指标均值⼤于原始版本的指标均值。
双尾检验(two-tailed test):如果备择假设没有特定的⽅向性,并含有符号“=”,这样的检验称为双尾检验。
例如:零假设是测试版本的指标均值等于原始版本的指标均值,备择假设是测试版本的指标均值不等于原始版本的指标均值。
单尾检验(one-tailed test):如果备择假设具有特定的⽅向性,并含有符号 “>” 或 “<” ,这样的检验称为单尾检验。
单尾检验分为左尾(lower tail)和右尾(upper tail)。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值,备择假设是测试版本的指标均值⼤于原始版本的指标均值。
检验统计量(test statistic):⽤于假设检验计算的统计量。
例如:Z值、t值、F值、卡⽅值。
显著性⽔平(level of significance):当零假设为真时,错误拒绝零假设的临界概率,即犯第⼀类错误的最⼤概率,⽤α表⽰。
第7章假设检验
概率
probability
◆概率(probability) :是指某事件发生的可能性大小常
用 P 表示 。A事件发生的概率记为P(A) 。
抗氧化剂 若P(A)=0,则称A事件为不可能事件
若P(A)=1,则称A事件为必然事件
乙酰胆碱酯酶抑制剂 若0<P(A)<1,则称 A事件为随机事件 抗炎药物
基本原则——小概率事件在一次试验中是不可能发生的。
1、假设检验的基本思想
假设检验是利用小概率反证法思想,从问
题的对立面(H计算检验统计量,最后获得P值来判断。
基本概念
引例:已知某班《应用数学》的期末考试成绩服从 正态分布。根据平时的学习情况及试卷的难易程度,估 计平均成绩为75分,考试后随机抽样5位同学的试卷, 得平均成绩为72分,试问所估计的75分是否正确? ―全班平均成绩是75分”,这就是一个假设 根据样本均值为72分,和已有的定理结论,对EX=75 是否正确作出判断,这就是检验,对总体均值的检验。
hypothesistesting根据分析目的资料类型设计类型样本大小方法的适用条件等选择相应的检验方法并计算检验统计量成立的条件下计算出来的它是用于决定是否拒绝的统计量其统计分布在统计推断中至关重要hypothesistesting确定p值作出推断结论根据算出的检验统计量如tz值查相应的界值表即可得到概率p然后将p值与事先规定的检验水准进行比较而得出结论hypothesistestinghealthstatistics692查表t005241711现有统计量检验统计量规定的总体中作随机抽样获得等于及大于或等于及小于现有统计量如t005值的概率当p时表示在h0成立的条件下出现等于及大于现有统计量的概率是小概率根据小概率事件原理现有样本信息不支持h0因而拒绝h0结论为按所取检验水准拒绝h0接受h1即差异有统计示在h0成立的条件下出现等于及大于现有统计量的概率不是小概率现有样本信息还不能拒绝h0结论为按所取检验水准不拒绝h0差异无统计意义若检验统计量现有统计量则p结论为按所取的检验水准拒绝h有统计学意义统计结论
07假设检验基础泰山医学院
t
| 1.33 | 7.91 12
0.58
(3)确定 P 值,作出推断结论 , =n-1=12-1=11, 查 附 表 2 , t 界 值 表 , 得 单 侧 t0.05/2 , 11=2.201, 现 t=0.58 <t0.05/2,11=2.201,故P > 0.05。按α=0.05 水准,不拒绝H0, 差异无统计学意义。 结论:故尚不能认为该减肥药有减肥效果。
34
23.01
(1)建立检验假设 H0:μ1 =μ2 ,即病人与健康人的尿中17酮类固醇的 排出量相同 H1: μ1 ≠μ2 ,即病人与健康人的尿中17酮类固醇的 排出量不同 α =0.05 (2)计算t值
x1 15.17 x2 19.15
35
S1=5.02 S2=6.01
n1=14 n2=11
假设检验基础
内容
1 假设检验原理
2
T检验、z检验
3
假设检验与区间估计
4
假设检验功效
2
统计资料处理 统计描述(statistical description)
统计推断 (statistical inference)
1、参数估计estimation of parameter 2、假设检验 hypothesis testing
12
选择单双侧检验
(1) H0:μ=μ0;H1:μ≠μ0(双侧检验) (2) H0:μ=μ0;H1:μ>μ0 ;(单侧检验)
或者
H0:μ=μ0;H1:μ<μ0 (单侧检验)
13
对于假设检验,需注意:
检验假设是针对总体而言,而不是针对样本;
H0与H1是相互对立、相互联系的,最后的结论 是根据H0与H1做出的,两者缺一不可;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chapter 7 Hypothesis testingStatistical hypothesis testing is another core issue in statistical inference . Wecalled the thesis about population distribution the statistical assumptions in Mathematical Statistics . A statistical hypothesis is an assertion about the distribution of one or more random variables. A test of statistical hypothesis is a rule which, when the experimental sample values have been obtained, leads to a decision to accept or to reject the hypothesis under consideration. Hypothesis testing owns an important status both in theoretical research and practical applications . In this chapter we will introduce the basic concepts of hypothesis testing and the hypothesis testing methods in normal population station .§7.1 The basic concepts of hypothesis testingThe theses about the population distribution have two forms. One is the thesis aboutthe population distribution types, known as non-parametric hypothesis ; another is thatthe type of population distribution is known but with unknown parameters, we called the thesis about the unknown parameters parametric hypothesis. We will only introduce parametric hypothesis testing in this chapter .1 An exampleIn this section, we will introduce some important concepts th rough an example ofhypothesis test.Example 7.1 We selected 20 newborns randomly from a region in 2002, the average weight of them is 3160g, the sample standard deviation of the weigh t is 300g, and based on past statistics, the average weight of newborn is 3140g. If the weight of X obeys normal distribution. Is there any significant difference about the weight between the newborn in 2002 and the old ones?Let X denote the weight of newborn, then based on the hypothesis , wehave 2~(,)X N μσ.The problem is that whether the mean of population is equal to 3140g or not, which can be expressed as0:3140H μ=,This hypothesis is called zero hypotheses or the original hypothesis. If 0:3140H μ=is not correct, so 1:3140H μ≠ is correct. This hypothesis could be called the alternativehypothesis . The above hypothesis testing problem is often expressed as01:3140:3140H H μμ=↔≠.2 significant testAccording to statistics, in the past, the average weight of newborns is 3140g,while in 2002, the average weight of newborn samples is 3160g, a difference in 20g, this difference may arise in two situations. O ne is that there is no essential difference in them, the difference in 20g is only caused by the randomness of the sample; another is caused by the essential difference in them . So the point is whether the difference can be explained by the randomness of sample or not.The sample mean is a good estimation of the population mean , if 3140μ=,|3140|X -should be relatively small, we should establish a reasonable limit C , When|3140|X C -<,we accept the zero hypothesis ;Otherwise ,we will accept alternativehy pothesis .We know that~(1)X T t n =-,Setting α=0.01,0.005(||(1))0.01P T t n α≥-==, if the observation of ||T satisfies||t 0.005(1)t n ≥-,that is to say the small probability event 0.005{||(1)}T t n ≥- occur.Generally speaking, small probability events will not occur in one experiment, so we believe 0H is unreasonable, we call 0.005{||(1)}t t n ≥- critical region . Otherwise, we have not enough evidence to reject 0H ,so we accept 0H .Which is called significant test . In this example,0.00520,(19) 2.861,n t ==and 0.298 2.861,x t ==<So we cannot reject 0H ,thus wecan believe no significant difference between the newborn in 2002 and the old ones.Noticing 0.005||(1)T t n ≥-is equivalent to 0.005||(1)X t n S μ-≥-0.005(1)C t n S =-,Afterward, we can make judgment only by the sample value of ||T .3 Two types of errorsAs mentioned above, a significant test is based on the fact that small probability event will not occur in one experiment. However, small probability events still may occur, therefore using the above hypothesis testing method still may make wrong judgments, there are two situations:1. The original hypothesis is actually correct, but the test result wrongly reject it, which commit "abandoning true" errors, often referred to as type I error.2. The original hypothesis is not right, but the test result wrongly accept it, which commit "maintaining false " errors, often referred to as type II error.As the sample is random, so we are committing two types of errors on certain probability . In statistics, we call the probability of committing type I error the significance level , abbreviated as the level. Naturally, people desire the probability of committing two types of errors as small as possible, but for a given sample size, We can not reduce the probability of committing two types of errors simultaneously, Commonly, we often fix the upper bound of the probability of committing type I error , and then select a test with smaller probability of committing type II error .§7.2 single normal population hypothesis testingLet 1(,,)n X X denote a random sample from a normal distribution 2~(,)X N μσ,α issignificance level.1 Test of mean1.1 Variance knownThe problem as follows0010::H H μμμμ=↔≠When 0H is true, then~(0,1)X U N =,thus/2(||)P U u αα≥=,So the critical region is /2{||}u u α≥.Example 7.2 Let us assume 2(4.55,0.108)X N ,we have nine random samples,and themean is 4.484,suppose the variance have no change, testing the following problem with the significance level 0.05,α=01: 4.55: 4.55H H μμ=↔≠.0.025u =1.96, 0.108, 4.484,9x n σ===,we get4.484 4.55|||| 1.83 1.960.108/3u -==<,Then 0H can be accepted.1.2 Variance unknownThe problem as follows0010::H H μμμμ=↔≠,When 0H is true, then~(1)X T t n =-,Thus/2(||(1))P T t n αα≥-=,So the critical region is /2{||(1)}t t n α≥-.Example 7.3 Let us assume X have normal distribution,we have 25 random samples,and themean is 66.5,and the standard deviation of sample is 15, testing the following problem with the significance level 0.05,α=01:70:70H H μμ=↔≠.25n =,0.025(24)t =2.06,66.5x =,we get66.570|||| 1.167 2.0615/5t -==<,Then 0H can be accepted.There are still two other kinds of problem of testing mean as follows0010::H H μμμμ=↔>; 0010::H H μμμμ=↔<.Using similar methods above to discuss,we can get the result in table 7.12 Test of varianceThe problem as follows22220010::H H σσσσ=↔≠,When 0H is true, then2222(1)~(1)n S n χχσ-=-,thus22221/2/2((1)(1))P n n ααχχχχα-≤-≥-=或,So the critical region is 22221/2/2{(1)}{(1)}n n ααχχχχ-≤-≥-.Example 7.4 Let us assume X have normal distribution,we have 5 random samples,1.32, 1.55, 1.36, 1.40, 1.44,and the standard deviation is 0.048σ=, testing the following problem with the significance level 0.05,α=222201:0.048:0.048H H σσ=↔≠.5n =,220.0250.975(4)11.14,(4)0.484χχ==,Fromthe givensample,we have20.00778S =,hence2240.0077813.5111.140.048χ⨯==>,So we reject 0H .There are still two other kinds of problem of testing variance as follows22220010::H H σσσσ=↔>; 22220010::H H σσσσ=↔<.Using similar methods above to discuss,we can get the result in table 7.2§7.3 double normal population hypothesis testingLet 112(,,...,)n X X X denote a random sample of size 1n from a distribution that is211(,),N μσ 212(,,...,)n Y Y Y denote a random sample of size 2n from a distributionthat is 222(,),N μσwhere 211,μσ ,222,μσ are unknown parameters, the two random samples are independent1.2212σσ=, testing of 12μμ-The problem as follows012112::H a H a μμμμ-=↔-≠,When 0H is true, then12~(2)X Y T t n n =+-,Thus/212(||(2))P T t n n αα≥+-=,So the critical region is /212{||(2)}T t n n α≥+-.Example 7.4 Let us assume X and Y both have normal distribution with equalvariances,we have the following random samples,X 24.3, 20.8, 23.7, 21.3, 17.4; Y 18.2, 16.9, 20.2, 16.7.testing the following problem with the significance level 0.05,α=012112::H H μμμμ=↔≠.0a =.125,4n n ==,0.025(7) 2.365t =,221221.5,7.505,18, 2.593X S Y S ====,hence2.324S ω==,| 2.245 2.365|T =<=,So we accept 0H .Using similar methods above to discuss the following problems012112::H a H a μμμμ-≤↔->; 012112::H a H a μμμμ-≥↔-<.we can get the result in table 7.3.2 testing of 2212/σσThe problem as follows2222012112::H H σσσσ=↔≠,When 0H is true, then221212(1,1)F S S F n n =--,hence1212212((1,1)(1,1))P F F n n F F n n ααα-≤--≥--=或,So the critical region is 112212{(1,1)(1,1)}F F n n F F n n αα-≤--≥--或. Using similar methods above to discuss the following problems,2222012112::H H σσσσ≤↔>,we can get the result in table 7.4.1(1,F n -1(1,F n -Example 7.5 There are two team A and B participate a paper contest, A team have 9 people, andB team have 8 people, the score as follows:A team 85, 59, 66, 81, 35, 57, 76, 63, 78,B team 65, 72, 69, 65, 58, 68, 52, 64,Can we believe the variance of B team is significantly greater than A team ’s concerning the significance level 0.05?Testing the following problem2222012112::,H H σσσσ≤↔>0.025(8,7) 3.73F =,so the critical region is { 3.73}F ≥,from the given sample we have2212240.75,40.98S S ==,hence21225.875 3.73S F S ==>,So we can believe the variance of B team is significantly greater than A team ’s.Exercises1.Let us assume that the life of a tire in mile, say X ,is normally distributed with mean θ and standard deviation 5000.Past experience indicates that 3000θ=.The manufacturer claims that the tires made by a new process have mean 3000θ>,we observe 10 independent values of X ,the sample mean is 5100,under the significance level 0.05,can we believe the manufacturer ’s claim?2. Let us assume the temperature of certain substance is normally distributed, we have 5 sample values:1250, 1265, 1245, 1260, 1275,Can we believe the temperature of this substance is 1277?(α=0.05).3.Let us assume that the life of a electronic product is normally distributed, and standard deviation 1.6.Now the technique is improved, we draw 9 products in the new products, the mean life is 52.8,sample standard deviation is 1.19,can we believe the variance of the life is changed? (α=0.05).4. Seeds of a particular variety of plant were randomly assigned to either a nutritionally rich environment (the treatment) or standard conditions (the control). After a predetermined period, allProviding that the two sample are from normal population, concluding that is there any difference between the mean weights due to environmental conditions? (α=0.05) 5.Let population (,9)XN μ,μ is unknown parameter, 125(,,)X X is a samplefrom population, considering the testing problem:0010::H H μμμμ=↔≠,Critical region is 1250{(,,)|||}C x x x c μ=-≥.Please find the constant c ,thesignificance level is 0.05.。