第六章 假设检验 第一节 假设检验的基本逻辑
第六章 假设检验2006
第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
第一讲 假设检验1
于是
x k 0 P x 0 k P 0 n 0 n
k P Z 0 n 由于正态分布的对称性,可使
பைடு நூலகம்
k P Z P Z z / 2 1 0 n 查标准正态分布表得到 ( z / 2 ) 1 / 2
然而,由于样本的随机性,如何才能根据抽样结
果判断总体(所有产品)的次品率是否不超过2%?
解
用假设检验法,步骤: 其中 p为总体的次品率.
1°提出假设 H0: p 0.02
1, 第i次抽取的产品是次品 2 设X i 否则 0,
则
Xi ~ b(1, p)
(i =1,2,3,∙∙∙,100)
故当p 0.02时, f ( p)单调增加
5 f ( p) P{Y 5; p} C100 p5 1 p95
( p 0 .02)
f (0.02) 0.035 0.05
从 而P { Y 5 ; p } 0.05
故{Y 5 }是小概率事件 .
解
用假设检验法,步骤:
1°提出假设 H0: 0 称为零假设或原假设
H1 : 0 称为对立假设或备择假设
如果零假设H 0 : 0 成立,那么的估计值 x 与 0 误差的绝对值 x 0 应该较小,一旦 x 0 太大,就应拒绝零假设H 0,即认为零 假设H 0不成立. 选定一个适当大的正数 k 当 x 0 k时,否定零假设H0 当 x 0 k时,接受零假设H0
第六章 假设检验
第一讲
一 假设检验 二 假设检验中的两类 错误
§1
假设检验
一、假设检验的基本原理 在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高?
第六章 假设检验1
二,假设检验的过程
1,提出假设 3,作出决策
拒绝假设 别无选择
总体
我认为人口的 平均年龄是50 50岁 平均年龄是50岁
2,抽取随机样本
均值 X = 20
二,假设检验的过程 假设检验的具体步骤: 假设检验的具体步骤: 第一,提出原假设 第一,提出原假设(null hypothesis)和备择假设 和备择假设 (alternative hypothesis); ; 第二,确定合适的检验统计量; 第二,确定合适的检验统计量; 第三,规定显著性水平 ; 第三,规定显著性水平α; 第四,根据数据计算检验统计量的实现值; 第四,根据数据计算检验统计量的实现值; 第五,统计决策. 第五,统计决策.
原假设
(null hypothesis)
1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称"0假设" 总是有符号 =, ≤ 或 ≥ 表示为 H0
– – –
H0 : = 某一数值 指定为符号 =,≤ 或 ≥ ≤ 例如, H0 : = 10cm
备择假设
(alternative hypothesis)
什么是P 值?
(P-value)
1.p值(p-value)是在零假设下, 1.p值(p-value)是在零假设下,检验统计量取其实现 是在零假设下 值及(沿着备择假设的方向)更加极端值的概率. 值及(沿着备择假设的方向)更加极端值的概率.
第六章 假设检验.
n 即 z A,没有落入拒绝域内 , 所以没有足够的理由 来拒绝原假设 H 0,该样本的信息说明生 产正常
检验统计量的 P 值为: P( Z 1.8) 1 - P( Z 1.8) 1 - 0.9281 0.0719 0.05 因此,拒绝原假设的证 据也不强。
2.单侧检验 对于单侧检验,以左侧检验为例,要检验的 假设: H0 : 0对H1 : 0 1)假定原假设 H 0 : 0成立, 并令
S是样本标准方差,即检验统计量服从自 由度为n-1的t分布,我们称之为t检验统 计量,n>30, 可用z检验代替
例6.6 解:根据问题的要求,确定原假设与备择假设
H0 : 1000 对H1 : 1000
这是一个双侧检验 , S 24 已知, 可用t检验。 x 986, 0.05, 查表,t / 2 (n 1) t / 2 (8) 2.306, 因此,拒绝域A {t ; t 2.306}, 计算t检验统计量的值
P( Z za)
2)通过查标准正态分布表求出临界值za.由此临界 值确定由检验统计量表示的拒绝域
A {z; z z / 2 }
3)对于样本 x ( x1 , x2 ,..., xn )计算检验统计量的值
n 不能拒绝原假设
z
x 0
, 若 z A,则拒绝原假设,否则
即 z A {z, z 1.645},落入拒绝域内 , 所以没有充分的理由 接受原假设H 0,接受备择假设,该样 本的数据支持该公司的 自我声称
三、正态总体方差的假设检验
2 2 设原假设H 0 : 2 0 , H1 : 2 0
检验统计量为
第6章 假设检验
三、假设检验中的相关概念
(一)原假设和备择假设 1、原假设和备择假设的定义
原假设:假设检验中,通常将所要检验的假 设称为原假设,也称为零假设,用H0表示。 备择假设:原假设的对立假设称为备择假设 或备选假设,用H1表示。
例如:设μ 0为总体均值μ 的某一确定值。
0
1.检验总体均值μ 是否等于某一确定值μ
2、原假设和备择假设的形式
(双侧检验和单侧检验)
若原假设是总体参数等于某一数值,
如H0:μ=μ0 ;H1:μ≠μ0。
这种假设检验称为双侧检验 若原假设是总体参数大于等于或小于等于某一数值, 如H0:μ≥μ0 ;H1:μ<μ0 或H0 :μ≤μ0 ;H1:μ>μ0
这种假设检验称为单侧检验。又分为左侧检验和右侧检验。
一、总体均值的检验
(一)提出假设
1. 双侧检验:H0 : m =m0;H1 : m m0
2. 3.
左侧检验:H0 : m m0;H1 : m <m0 右侧检验:H0 : m m0 ;H1 : m >m0
一、总体均值的检验
(二)选择检验统计量,并确定其分布形式
大
样本容量n
否 是
小(正态总体)
设检验。
一、什么是假设检验
参数假设检验 指对总体分布函数中的未知参数提出某种 假设,然后利用样本信息对所提的假设进 行检验并做出判断的过程。 非参假设检验 指对总体分布函数形式等的假设进行检验 的过程。
参数假设检验实例
例1:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要求, 这时需要进口商对供货商的说法是否真实作出 判断。进口商可以先假设该批钢筋的平均拉力 强度不低于2000克,然后用样本的平均拉力 强度来检验假设是否正确。
第六章--假设检验基础课件
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效
大学统计学 第6章 假设检验与方差分析
35%
16
30%
14
12
25%
10
20%
8
`
15%
6
10%
4
2
5%
0
0%
50-60
70-80
90-100
统计学导论
第六章 假设检验与方差分析
第一节 假设检验的基本原理 第二节 总体均值的假设检验 第三节 总体比例的假设检验 第四节 单因子方差分析 第五节 双因子方差分析 第六节 Excel在假设检验与方差分析
记为 H1:。150
整理课件
6-7
三、检验统计量
所谓检验统计量,就是根据所抽取的样本计 算的用于检验原假设是否成立的随机变量。
检验统计量中应当含有所要检验的总体参数, 以便在“总体参数等于某数值”的假定下研 究样本统计量的观测结果。
检验统计量还应该在“H0成立”的前提下有 已知的分布,从而便于计算出现某种特定的 观测结果的概率。
为 =x 149.8克,样本标准差s=0.872克。问该
生产线的装袋净重的期望值是否为150克(即 问生产线是否处于控制状态)?
整理课件
6-4
所谓假设检验,就是事先对总体的参数 或总体分布形式做出一个假设,然后利用抽 取的样本信息来判断这个假设(原假设)是 否合理,即判断总体的真实情况与原假设是 否存在显著的系统性差异,所以假设检验又 被称为显著性检验。
量所得结果落入接受域的概率。
问题,对于 和 大小的选择有
不同的考虑。例如,在例 6-1 中,如果检验者站在卖方 的立场上,他较为关心的是不要犯第一类错误,即不 要发生产品本来合格却被错误地拒收这样的事情,这
时, 要较小。反之,如果检验者站在买者的立场上,
(卫生统计学)第六章 假设检验基础
药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
编号 1 2 3 4 5 6 7 8 9 10 11 12
用药前 1206.4 921.69 1294.08 945.36 721.36 692.32 980.01 691.01 910.39 568.56 1105.52 757.43
用药后 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
目的
H0
H1
双侧检验 是否μ1≠μ2
μ1=μ2
μ1≠μ2
单侧检验 是否μ1>μ2
μ1=μ2
μ1>μ2
或是否μ1<μ2
μ1=μ2
μ1<μ2
返回
选定检验方法和计算检验统计量
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如 成组设计的两样本均数的比较用t检验(小样本)或Z检验(大样本), 两样本方差的比较用F检验。
(卫生统计学)第六章 假设检验基础
第一节、假设检验的概念与原理 一、假设检验的思维逻辑
1.小概率原理 小概率事件在一次随机试验中几乎是不可能发生
2.假设检验处理问题的特点 ⑴从全局的范围,即从总体上对问题作出判断 ⑵不可能对总体的每个个体均作观察
二、假设检验步骤
例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名 儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月 龄的均数是否大于一般儿童?
四、方差齐性检验 homogeneity of variance test
第十三讲统计学-讲义
H0 的实际状态
H0 为真
H0 为非真
决策正确
犯第二类错误
犯第一类错误
决策正确
因为假设检验是根据样本数据对总体参数或概率分布所作的假设进 行统计推断,也就是说,由部分来推断整体,所以它不可能绝对准 确。我们希望犯这两类错误的可能性都尽可能小,但在样本容量一 定的情况下,不能同时做到α 和β 都很小,减少α 会使β 增大,减 少β 会使α 增大。如果想使α 和β 同时都很小,只有增加样本容量。 在实际应用中,一般先控制犯第一类错误的概率α ,给它规定一个 上限,而不考虑犯第二类错误的概率β ,我们把这种假设检验称为 显著性检验,把犯第一类错误的最大概率α 称为检验的显著性水平, 相应的检验称为水平α 的显著性检验。
α =P(V|H0 真)
对于第 3 种情况,H0 本来是非真的,却根据检验统计 量的值把它给接受了,在统计上,称为第二类错误,也称 取伪错误,这种错误发生的概率通常用β 表示,即
β =P(V |H0 非真)
表 6.1.1 给出了上述 4 种情况。
表 6.1.1 假设检验的四种可能结果
对假设 H0 采取的决策
原假设和备择假设的选取说明
• 假设检验是控制犯第一类错误的概率,所以检验本身对原假设起 保护的作用,决不轻易拒绝原假设,因此原假设与备择假设的地 位是不相等的,正因为如此,常常把那些保守的、历史的、经验 的取为原假设,而把那些猜测的、可能的、预期的取为备择假设。
• 比如:对于双侧检验,这选择问题应该比较简单,一般都是“是 不是”、“等不等于”和“变没变”这一类的问题,一般我们期 待的结果多为“不是”、“不等于”和“变了”这样的结果,所 以把不等号的设为备择假设的。
• 对于单侧检验,一般都是“增加了”、“提高了”或“减少了”、 “降低了”这一类问题,比如某产品的在使用了新技术生产后, 问产品质量是否提高了,我们期待的结果是提高了,这样就把大 于号定为备择假设,相反的小于等于号定为原假设。
第六章 假设检验
第一节 假设检验的基本原理
第二节 总体参数假设检验
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
第一节 假设检验的基本原理
一、假种假设,然后利
用样本信息来判断原假设是否成立,决定应接受或
否定假设。假设检验也称为显著性检验。
在此,我们关心的是新机床加工零件的椭圆度总体均值 与老机床加工零件的椭圆度总体均值为0.081mm是否有 不同,可作如下假设 原假设 H 0 : 0.081mm 没有明显差异 备择假设 H1 : 0.081mm 有显著差异, 这是一个双侧检验问题,所以只要 > 0 或 < 0 二者之间有一个成立就可以拒绝原假设。
例某机床厂加工一种零件,根据经验知道,该厂加工零件的椭
圆度近似服从正态分布,其总体均值为0=0.081mm,总体标
准差为= 0.025 今换一种新机床进行加工,抽取n=200个零件 进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的 椭圆度的均值与以前有无显著差异?(=0.05)
H 0 : 0.081mm H1 : 0.081mm < 0 或 > 0 有一个成立就可以拒绝原假设。
为了减少冤枉好人的概率,应尽可能接受原假设, 判被告无罪,这可能增大了放过坏人的概率。
第二节总体参数假设检验
一、总体均值的假设检验
总体均值的检验
(检验统计量)
是
总体 是否已知 ?
否
小 样本容量 n
用样本标 准差S代替
大
z 检验
z 检验
t 检验
Z
X 0
n
Z
X 0 S n
t
第六章 假设检验
x 0 t S/ n
立信会计出版社
(三)总体为非正态分布 (四) 两总体平均数之差的假设检验 在各门学科中经常遇到的问题之一,是把 一个试验的结果与控制的目标进行比较, 以观察试验是否产生了有意义的结果。解 决这种问题的一个方法是:检验被试验的 两个总体的平均值是否在本质上相同。当 两个总体均为正态分布或近似正态分布, 2 2 , 且两总体的方差 1 2 为已知, x1 , x2 表示两总体的平均数。
立信会计出版社
假设检验的基本过程为: (1) 根据要求,提出原假设H0和替代假设H1, 在检验进行中,假设H0是真实的。 (2) 选定合适的检验统计量。 (3) 决定显著性水平α ,α 常取0.05或0.01。
立信会计出版社
(4) 根据显著性水平确定统计量的临界区 域,同时注意是双边检验还是单边检验。 (5) 根据计算的统计量及所确定的显著水 平作出决策,如果统计量的值落在临界区 域,说明原假设和样本描述的情况有显著 差异,应该否定原假设;如果统计量的值 落在非临界区域(接受区域内),说明样本 和原假设的值差异不显著。
立信会计出版社
则可用统计量Z进行检验:
Z
( x1 x2 ) ( 1 2 )
2 1
n1
2 2
n2
立信会计出版社
二、 总体成数的假设检验 (一) 单一总体成数的假设检验 上一章我们讨论了平均数的分布及成数p的 分布。一般来说,在大样本情况下,即np >5,n(1-p)>5时,可将成数p的分布转化 为正态分布,通常地可将样本成数p看成近 似地服从均值为p,方差为(1/n)p(1-p) 的正态分布。
立信会计出版社
贾俊平统计学第6章假设检验
正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
《概率论》第六章假设检验
例1 某服务系统的相应时间服从正态分布,需求 其平均相应时间在0.5秒之内。若16次抽样测试得 到样本平均值为x=0.56秒,样本标准差为s=0.12秒, 该服务系统工作是否正常?(=0.05)
解:H0 : 0.5 n=16 =0.05 t1 1.753 t x 0 0.56 0.5 =2 >1.753 s n 0.12 16
因此否定H0 即该服务系统工作不正常
(二)未知方差2,关于期望的检验
1.检验假设(单边)H0 : 0 H1 : 0
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t (n 1),
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t1 (n 1),
P T t1 (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t t1 (n 1),则否定H0; 若t t1 (n 1),则接受H0.
因此这实际上需要比较第二个正态总体 的期望值是与第一个正态总体期望值相 等还是比它高?
这种作为检验对象的假设称为原假设, 通常用 H0表示。比如, 例2中的待检假设为:H0:Eξ=3140
如何根据样本的信息来判断关于总体分布的 某个设想是否成立,也就是检验假设H0成立 与否的方法是本章要介绍的主要内容。
P T t (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t<t (n 1),则否定H0; 若t>t (n 1),则接受H0.
(二)未知方差2,关于期望的检验
假设检验
第一节 假设检验的基本原理 第二节 单个正态总体的假设检验 第三节 两个正态总体的假设检验
第一节:假设检验的基本原理
一、基本概念 假设检验是统计推断的另一种重要形式,
其任务是通过样本对未知的总体分布特征作 出合理的推测。
先对总体分布中的某些参数或对总体分布类 型做某种假设,然后根据样本值做出接受还 是拒绝所做假设的结论。
例如 若H0 : m = m0, 则H1 有以下三种情况: (1) H0 : m = m0, H1: m m0 (2) H0 : m = m0, H1 : m > m0 (3) H0 : m = m 0, H1 : m < m0
其中(1)称为双边检验.
其中(2), (3)称为单边检验.
第二步:选取一个合适的检验统计量,并根据原假设 H0和备择假设 H1 确定H0的拒绝域.
0.05 6
因为4.9>1.96 ,即观测值落在拒绝域内
所以拒绝原假设。
二 当2未知时, 均值m的检验(t检验)
1 (双边检验) H0: m = m0 H1: m m0
此时2未知, 不能用
U
X
m0
n
用
T
X
m0
S
n
当H0成立时,
T
X m0
S
~ t(n 1)
n
因此, 对给定的, 查t分布表, 使
X
m0
~ N(0, 1)
n
当H0 成立时, u的值不应太大.
而当H1 成立时, u的值往往偏大.
因此, P{uu}=
于是得到H0的拒绝域为 (u, )
类似地, 若检验的假设是
计量经济学必备知识点总结
计量经济学必备知识点总结一、基本概念1. 变量与参数:在计量经济学中,经济模型通常会涉及到各种变量和参数,其中变量是指可以随着时间或其他因素而变化的量,而参数是指在模型中不变的常量。
2. 线性关系与非线性关系:线性关系是指两个变量之间的关系可以用一条直线来表示,而非线性关系则不符合这一特点。
3. 动态关系与静态关系:动态关系是指变量之间的关系随着时间的推移而变化,而静态关系则在一个时间点上成立。
二、假设检验1. 假设检验的基本逻辑:假设检验是计量经济学中最基本的一种统计推断方法,其基本逻辑是通过对样本数据进行分析,判断某一经济理论假设的合理性。
2. 一类和二类错误:在假设检验中,如果我们拒绝了一个实际上是真实的假设,就犯了一类错误;而如果我们接受了一个实际上是错误的假设,就犯了二类错误。
三、最小二乘法1. 最小二乘估计的基本原理:最小二乘法是一种常用的参数估计方法,其基本原理是选择使得残差平方和最小的参数值作为估计值。
2. 普通最小二乘法和加权最小二乘法:普通最小二乘法是指在残差的平方和最小化的情况下对参数进行估计,而加权最小二乘法则是在普通最小二乘法的基础上引入了加权因素。
3. 最小二乘估计的性质:最小二乘估计具有无偏性、有效性和一致性等重要性质。
四、多元回归分析1. 多元回归模型的建立:在多元回归分析中,我们通常会建立包括多个自变量和一个因变量的回归模型,用来描述自变量对因变量的影响。
2. 多元回归模型的识别:在多元回归分析中,识别问题是指通过样本数据估计出的回归系数能否代表总体数据中的真实关系。
五、时间序列分析1. 时间序列数据的特点:时间序列数据是指在一段时间内观察到的一系列数据,其特点包括趋势、季节性和周期性等。
2. 平稳性的检验:在时间序列分析中,平稳性是一个重要的假设,其检验包括单位根检验和差分平稳性检验等方法。
3. ARMA模型和ARCH模型:ARMA模型是时间序列数据的经典模型,用来描述时间序列数据的自回归和移动平均关系;而ARCH模型则是用来描述时间序列数据的异方差性。
第六章假设检验基础
表1 12名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)
编号
1 2 3 4 5 6 7 8 9 10 11 12
标准品
12.0 14.5 15.5 12.0 13.0 12.0 10.5
7.5 9.0 15.0 13.0 10.5
新制品
10.0 10.0 12.5 13.0 10.0
5.5 8.5 6.5 5.5 8.0 6.5 9.5
解析:已知μ0=20mg/L, n=11, X 2 0 .9 8 4 m g / L
S 1.068m g / L
一个总体: N(μ,σ2),检验μ是否不同于20mg/L。 建立检验假设并确定检验水准 H0:μ=20mg/L H1:μ≠ 20mg/L α=0.05
21
一、单组样本资料的t 检验
出在零假设的前提下,出现目前样本数据对应的统计 量数值乃至比它更极端数值的概率P值; 如果P ≤α,则结论为:按所取的检验水准拒绝H0,接 受H1,认为差异有统计学意义; 如果P >α ,则结论为:按所取的检验水准不拒绝H0, 尚不能认为差异有统计学意义。
15
统计决策 不拒绝H0
实际情况
H0为真
H0为假
例5 两组小白鼠分别饲以高蛋白和低蛋白饲料, 四周后记录小白鼠体重增加量(g)如下表所示 ,问两组动物体重增加量的均数是否相等?
编号 1 2 3 4 5 6 7 8 9 10 11 12
高蛋白组(X1) 50 47 42 43 39 51 43 48 51 42 50 43
X 45.750 S12 17.659
Sta tterXStnh1112wXaSni2t222e~近t 似(法( S(n1S211/2n/11n)12
第六章 假设检验
第一步:建立假设 第一步:
H0 : µ = 8000; H1 : µ > 8000
原假设的选取原则: 原假设的选取原则:没有充分理由 不能轻易否定的命题。 不能轻易否定的命题。
对立假设的选取原则:没有把握不 对立假设的选取原则: 能轻易肯定的命题。 能轻易肯定的命题。
第二步:寻找检验统计量 第二步:
2
第三步:给定显著性水平和临界值 第三步:
• 在原假设 H0 为真时,X 应该接近8000。 为真时, 如果 X 远离8000 ,就有理由怀疑原 假设为真。 假设为真。 • 例中,8300与8000之间算近还是算远? 例中, 之间算近还是算远? • 需要定一个界限,记此界限为c。 需要定一个界限,记此界限为c
假设检验是要根据样本的观测值对原假作 出判断,接受原假设或者拒绝。 出判断,接受原假设或者拒绝。 由于样本的随机性,客观情况未知, 由于样本的随机性,客观情况未知,有可 能犯错误。 能犯错误。 例:产品验收,有时面对的整批产品是合 产品验收, 格的,有时面对的整批产品是不合格的。 格的,有时面对的整批产品是不合格的。 拒收了合格率高的产品或者接受了合格率 低的产品都是犯了错误。 低的产品都是犯了错误。
例:餐厅的营业额问题: 餐厅的营业额问题:
H0 : µ = 8000; H1 : µ பைடு நூலகம் 8000
N(µ0 ,σ )
2 0
N(µ,σ )
2
在原假设成立的条件下,新菜单挂出后, 在原假设成立的条件下,新菜单挂出后, 每天营业额仍然服从正态分布
N(8000,640 )
如今获得了一个容量为9的样本, 如今获得了一个容量为9的样本,此时样 服从: 本均值 X 服从: 1 2 N(8000, ×640 ) 9
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、该矿区的自然社会条件并不影响新生儿发育,矿 区新生儿总体的头围均值μ 1与一般新生儿(总体) 头围均值μ 0相等( μ 1 = μ 0 ),样本均值与总体 均值的差异来源于抽样误差,也就是说我们抽到了 一个头围偏小的样本,由此造成的差异不具有显著 性(significance),即没有统计学意义。 2、差异不仅仅由抽样误差造成,矿区新生儿总体头 围均值小于一般新生儿总体头围均值( μ 1 < μ 0 ),这种差异被认为具有显著性,亦即有统计 学意义。 在这两者之间如何抉择呢?关键在于两个均值的 差异能否用抽样误差来解释。
处理组 68 对照组 65
65 66 67 62 64 65
66 64
66 59
64 63
69 65
63 58
66 65
第四节 大样本比例的假设检验
当n较大,且比例不接近于0和1时,大样本比
例(或百分率)的比较可采用z检验。具体应 用条件如下: n较大,且每组例数都大于60; 样本比例p和1-p都不接近于100%和0; np和n(1-p)均大于5。
二、成立假设:
在统计学里,上述问题是用反证法的方式来解 决的,首先假设差异可由抽样误差解释,两总体均 值相等,然后再来分析在μ 1 = μ 0的总体中随机抽 样,得到头围均值小到Xbar=33.89这个程度的可能 性有多大。如果这个可能性很小,则拒绝这一假设, 而采纳相反的假设。
所以,我们首先要成立两个相互对立的假设: 虚无假设H0和备择假设H1。虚无假设(null hypothesis,或译为无效假设,)主张,差异可以 由抽样误差来解释,也就是说差异在总体中不存在 或无效。备择假设与虚无假设对立,主张样本数据 表现出的差异来源于总体差异。在假设检验中,直 接检验的是虚无假设,所以虚无假设又称检验假设 (hypothesis to be tested)。 在本例中,我们可成立如下假设: H0: μ 1 = μ 0 H1: μ 1 < μ 0
一、单样本比例的z检验
比例是均值的一种特殊情况,对比例进行 检验,其思想是将属性数据转化为(二分变 量),然后对其均值进行检验。 对某高校随机抽样n=200的样本,根据样本计 算出学生中城市户口为40%。问该高校城市户 口学生比例是否高于35%。(显著性水平为 0.05) P Q 40% 35%
练习: 有趣的环境是否会对脑发育产生影响呢?美国 某生物学家对老鼠进行了实验。他随机抽出10窝新 出生的老鼠,每窝中分别随机抽取出1只到处理组, 1只到对照组。两组老鼠所受待遇相同,所不同的只 是处理组的老鼠都住在一个笼子里,还放了许多好 玩的东西;而对照组的老鼠却用隔板分开,也没有 什么玩具。一个月后,取出每只老鼠的脑皮质,各 窝中10对老鼠脑皮质重量如下表(单位:厘克):
四、计算概率值(p值),做出决策。 在这个情况下,我们是否接受无效假设H0呢? 我们先计算在H0成立的条件下,抽到头围均值小到 Xbar=33.89这个程度的样本的可能性。 查表可知,p(z<-2.273)=0.0116。 这样,如果接受H0,则说明我们抽到了一个均 值严重偏小的样本,抽到这么偏的样本的可能性只 有1.16%。
决策的风险 两种选择: 1、接受H0,我们的运气太差,抽到了一个很偏 的样本; 2、拒绝H0,犯错误的概率为1.16%。
P值的含义 在本例中,p=0.0116意味着在H0条件下,抽到 如此偏小的样本的可能性只有0.0116。 一般来说, 1、概值意味着在H0条件下,抽到比实有样本更偏的样 本的可能性; 2、或者表述为,p值意味着样本数据对虚无假设的支 持程度(或两者之间的一致性程度); 3、在假设检验过程中,如果p值较小,我们拒绝H0,p 就是我们要冒的风险。
第三节 均值比较的Z检验
两个均值的比较
这里讨论的是从两个总体中分别抽取随机样 本,通过对样本数据的分析来推断总体均值 差异的方法,亦即两个均值差异的比较问题。 多均值比较在方差分析中另行介绍。
基本思路:
设两总体均值分别为U1和U2,成立虚无假 设H0:U1-U2=0,或U1=U2;在H0条件下,两样 本是从总体中随机抽取的,其均值差异X1-X2 可以等于零,也可以不等于零,是一个围绕 零值波动的随机分布。 统计研究表明,样本均值差值X1-X2服从于 均值为0,标准差为SE的正态分布。其中X1X2的方差正好是X1和X2的方差之和。 故两样本均值Z检验的统计量计算公式为: Z= X1-X2/SE。
第六章 假设检验
X 1 n X Xi n i 1
第一节 假设检验的基本逻辑
例:通过以往大规模调查,已知某地新生儿头围均 值为34.50cm,标准差为1.99cm。为研究该地某矿区 新生儿发育状况,从该矿区随机抽取新生儿55人, 测得其头围均值为33.89cm。问该矿区新生儿头围均 值是否小于一般新生儿头围均值? 一、分析差异来源 根据题意, Xbar =33.89, μ 0=34.50,两者差 值为0.61cm。该差异来源有两种可能性:
Байду номын сангаас
三、在H0条件下计算检验统计量。 如果H0成立,根据中心极限定理,均值的抽样 分布服从正态分布,从研究总体中随机抽取样本量 为55的样本,其均值会落在正态曲线横轴的任一位 置,但大多数会落在总体均值μ 1 = μ 0附近,远离 中心点的可能性较小。样本均值偏离中心点的距离 可由其标准值来衡量。
本例中,n=55,σ =1.99,在H0: μ 1 =34.50条件下,将观测值Xbar标准化,即 Xbar=33.89与中心点之间的距离(以标准差 为单位来衡量)为: z=(33.89-34.50)/(1.99/n1/2 )=-2.273 由此可见Xbar=33.89落在距中心点较远的 位置。
结论: P值反映了拒绝原假设时所犯错误的可能 性,在进行假设检验时,我们通常要设定一 个我们所能接受的犯这种错误的风险水平α 值 ,称为检验水准或显著性水平。 p<α ,拒绝原假设; p>α ,不拒绝原假设。
第二节 进一步的讨论
一、检验的方向
二、两类错误 三、假设检验的统计意义
x