五章节统计假设测验
教育与心理统计学 第五章 假设检验考研笔记-精品
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
统计假设测验
例如:已知 x ~ N ( ,52 ), 现从此总体中随机抽取一个容量为 n =25 的样本, 算得样本平均数 x 38 , 问: 1. 总体平均数 是多少? 2. 总体平均数 假设检验 用于解决第1个问题
有95%的可能落在什么区间?
区间估计 用于解决第2个问题
本章先介绍 假设检验
假设检验test of hypothesis
问这种药剂对玉米的单穗重有无影响?
解决这个问题 分三步来进行
二、假设检验的步骤(how?)
[例4-1] 已知某品种玉米单穗重 x~N(0=300, 2 = 9.5 2) 。现对这个品种施 加了一种药剂,随机调查了n = 9 个果穗,算得样本平均数为 308 g。
问这种药剂对玉米的单穗重有无影响?
p(| u | 2.526) 0.012
㈡ 计算概率
在HO为正确的前提下,计算获得样本结果的概率
如果HO:=0 =300g是正确的,则按抽样分布理论,样本平均数
x N (x , x ) N (, 2 / n) N (0 , 2 / n)
2
于是可以计算得到试验结果 x 308 的两尾概率:
第4讲 资料的整理与分析
资料的整理 资料的描述 资料的分析
一、资料的整理
1、次数分布表 对于观察值不多、变异范围不大的计数资料,以每一观 察值为一组进行分组,然后制成次数分布表 例如 100个麦穗的每穗小穗数
18 17 17 18 17 17 17 18 18 15 15 18 16 15 19 19 19 19 17 16 17 17 17 16 15 19 16 18 18 18 19 16 19 18 17 17 16 18 20 17 16 18 18 18 17 19 17 19 19 18 15 20 18 18 17 17 17 19 16 17 20 19 17 17 16 18 17 20 18 17 18 17 17 20 17 16 15 17 19 16 19 16 17 19 18 18 17 16 17 19 17 18 18 18 18 17 16 19 16 17
应用统计学第5章 假设检验ppt课件
总体 (某种假设)
抽样
样本 (观察结果)
检验
(接受)
(拒绝)
小概率事件
小概率事件
未发生
整理版课件
发生
25
三.单边检验
1.单边检验与双边检验的不同 ➢假设:右边检验 -H0:μ≤μ0, H1:μ>μ0
左边检验-H0:μ≥μ0, H1:μ<μ0 ➢拒绝域:
设总体X∼N(μ, σ2), σ为未知,X1,X2,….,Xn是来自 X的样本.给定显著性水平.
在海湾战争的“沙漠风暴”行动中,也应用了相同的 分析。
整理版课件
12
假设检验分类:
参数的检验 分布的检验
参数的检验包括:
➢一个正态总体(均值和方差)的假设检验 ➢两个正态总体(均值和方差)的假设检验
假设检验形式:
双边检验(等号成立) 单边检验(不等号成立)
整理版课件
13
5.1 统计假设检验的基本问题
❖原假设一定要设为“≤或 ≥”.
❖拒绝域在图形的左侧或右侧大体上与原假 设H0中的不等式开口方向一致.
整理版课件
30
四.统计假设检验中的两类判断错误
❖第H称0生一判产类断者错,的误因风:此险零也度假称,设为记H“0为弃本α真是. 错真误的”,。而在做管出理了中否也定 其大小为: P{拒绝/H0真}=α
2 1
/
2 2
~F(n1―1,n2―1)
其中s12 和s22 分别是总体X和Y的样本方 差。
整理版课件
8
二. 样本特征数与总体特征数的关系
❖总体X的特征数:E(X)= μ
D(X)= σ2
❖样本特征数: X
1 n
n k 1
Xk
第五章-统计假设测验
适于统计测验旳假设
单个平均数旳假设
两个平均数相比较旳假设
2023/12/30
9
(一)单个平均数旳假设
一种样本是从具有平均数μ0旳总体中随机抽出旳, 记作H0: μ= μ0。例如: 1、某一小麦品种旳产量具有原地方品种旳产量,这指新品
种旳产量体现乃原地方品种产量体现旳一种随机样本, 其平均产量μ等于某一指定值μ0,故记为
品种这个总体是否有明显差别呢?
2023/12/30
15
☺(一)对所研究旳总体首先提出一种无效假设
H0:μ= μ0 或: H0:μ= 300
即新品种与老品种之间不存在真实旳差别,样本平
均数
_
y
与
0之间旳差数:
330-300=30 (kg)属随机误差。
相应假设为: HA:μ≠ μ0 。
2023/12/30
345
270.6
329.4
不小于329.4(kg)和不不小
图5.1 5%明显水平假设测验图示 于270.6(kg)旳概率只有 (表达接受区域和否定区域) 5%。
2023/12/30
23
(三)根据“小概率事件实际上不可能发生”原理 接受或否定假设
上章述及,当一事件旳概率很小时可以为该事件
在一次试验中几乎是不可能事件。当 y 由随机
误差造成旳概率不大于5%或1%时,就可以为它不可 能属于抽样误差,从而否定假设。
2023/12/30
24
假如因随机误差而得到某差数旳概率P<0.05,则 称这个差数是明显旳。假如因随机误差而得到某差 数旳概率P<0.01,则称这个差数是极明显旳。而这种 假设测验也叫明显性测验。
用来测验假设旳概率原则5%或1%等,称为明
简述统计假设测验的步骤
简述统计假设测验的步骤统计假设测验是用来检查不能直接用频数描述的统计量(参数),或者用作推断总体参数之间关系的统计方法。
这种统计测验一般由2个测验构成:第一测验先给被试呈现一些刺激或者未知数,第二测验则要求被试对第一测验中呈现的结果做出解释。
1、确定假设的总体,并根据研究目的和问题,确定问题的可能性水平。
最常见的测验工具为二项分布、正态分布和X 2分布等。
有时还要确定问题的类型和抽取样本的数量。
例如,为了回答“你在进行某次聚会时,是否去过卡拉OK”的问题,应该采用正态分布,因为在高于1的概率下你应该去过卡拉OK。
然而,在回答“你在进行某次聚会时,是否饮过酒”的问题时,应该采用二项分布。
这样才有助于回答“你在进行某次聚会时是否去过卡拉OK”的问题。
又例如,为了回答“你是否进行过某项运动”的问题,应该采用正态分布。
2、提出概率度量,即确定样本观察值(X值)的标准差,从而确定“样本估计值”的标准差。
例如,如果希望用Y=10代替X的正态分布的总体,应该提出的标准差为20,而希望用Y=25代替X 2分布的总体,则提出的标准差为5。
有了标准差之后,我们就可以算出总体的期望和方差。
此外,应该提出适当的置信区间,以便进行假设检验。
假设检验的第一步,也就是要先求出总体X的均值和方差。
方差σ的公式为σ=∑x/X3、计算“样本观察值”的平均值,并且用这个平均值除以标准差,得到“样本观察值”的期望值(ΔL),再将样本观察值代入假设检验的第一个公式,得到两个参数之间的相互关系。
样本观察值的标准差用它除以期望值,就可以得到平均变异数,这个平均变异数就是抽样平均误差,它等于样本观察值的标准差乘以总体均值与样本观察值的期望值的比值,或者等于样本观察值的标准差除以方差。
如果只有正态分布和X 2分布的总体,而没有说明总体期望值的大小,则需要用样本容量(N)除以样本标准差(σ/2)得到样本均值,然后把均值代入样本观察值,即得到样本的期望值。
生物统计与田间试验:第五章 统计假设测验
因此,在假设测验时需进行连续性矫正。
(1)在n<30,而 npˆ <5时这种矫正是必须的;经过连续性
矫正的正态离差u值或t 值,分别以uC 或 tC 表示。
npˆ 或 nqˆ<30但>5时进行连续性矫正。
第五章 统计假设测验 (显著性检验)
§5.1 统计假设测验的基本原理 §5.2 平均数的假设测验 §5.3 二项资料的百分数假设测验 §5.4 参数的区间估计
单个样本平均数的假设测验
1. 从总体方差已知的正态总体的抽样→ 样本 平均数为 正态分布→ u测验
2. 从未知总体抽样,只要n ≥ 30→ 样本平 均数服从 正态分布 → u测验
在分析试验结果时,只要假设两样本的总体差数的平
均数 d
1 2
0
,而不必假定两样本的总体方差
12和
2 2
相同。
类似单组设
计(单个平
均数)进行
分析
第三节 二项资料的百分数假设测验
许多生物试验的结果是用百分数或成数表示的,如结实率、 发芽率等,这些百分数系由计数某一属性的个体数目求得,属 间断性的计数资料.
3. 从正态总体的抽样,总体方差未知, n<30 → t分布 → t测验
两个样本平均数相比较的假设测验
由两个样本平均数的相差,以测验这两个样本所属 的总体平均数有无显著差异。
成组数据的平均数比较 测验方法
成对数据的比较
成组数据的平均数比较又依两个样本所属的总体方
差(
2 1
和
2 2
)是否已知、是否相等而采用不同的测验方法。
2.4统计假设测验课件
小题教学计划2.4统计假设测验一、统计假设测验的基本原理(一)统计假设测验的基本概念由一个样本或一系列所得的结果去推断总体,即统计推断。
参数估计:由样本的结果对总体参数作出点估计和区间估计。
假设测验点估计:以统计数估计相应的参数,例如以x估计μ;参数估计区间估计:以一定的概率作保证估计总体参数位于某两个数之间。
但是试验工作更关心的是有关估计值的利用,即利用估计值去作统计假设测验。
此法首先是根据试验目的对试验总体提出两种彼此对立的假设,然后由样本的实际结果,经过计算作出在概率意义上应接受哪种假设的推断。
这就是统计假设测验。
(二)统计假设测验的意义在科研中得到的数据资料,要深入反复地进行分析,从中找出科学的结论,防止作绝对肯定和绝对否定的简单的结论这是十分重要的。
例题:某苹果园土壤肥力一致,品种A调查了6株,品种B调查了7株,其单株结果量如下表:苹果品种单株结果量比较表(kg/株)从上表看,BA x问题1:A、B本身单株产量就很不一致,2:A的个别单株也有高于B的,说明A、B二品种是互有高低。
因为受试验误差的影响,就不能作出肯定或绝对否定的简单结论。
要从试验的表面效应中分析,是试验处理(或品种)的效应,还是试验误差的效应,要在这两者中权衡主次,再作出结论。
(三)统计假设测验的基本方法某地区金红苹果多年种植记录的平均单果重60g(μ0),其标准差为5g(σ0),从中选出一个新品种,经设有16次重复(n=16)的小区试验结果得知其平均单果重x =65g ,为辨明x -μ0=5g 这一差异是否反映新品种与原品种的总体平均数间的真实差异,在统计上,作如下步骤的假设测验。
1、提出统计假设首先对样本所属的未知总体提出某种假设,通常是一对假设:无效假设(H 0也称零值假设)和备择假设(记作H A ),两者是对立的。
本例题的H 0假设:x 所属的未知总体的平均数μ是和已知总体的平均数μ0相等。
即:H 0 :μ-μ0=0(或μ=μ0) x -μ0=5g 是误差造成的,H A :μ-μ0 ≠0 x -μ0=5g 不是误差造成的。
第五章 统计假设测验-统计推断
因而划出两个否定区域为: y 1.96 y 和 y 1.96 y
(4) 将规定的值和算得的u值的概率相比较,或者将试
验结果和否定区域相比较,从而作出接受或否定无效假设的 推断。
三、两尾测验与一尾测验
如果统计假设为 H0 : 0 , 则备择假设为 H A : 0 , 在 假设测验时所考虑的概率为曲线左边一尾概率(小于 0 )和右 边一尾概率(大于 0 )的总和。这类测验称为两尾测验( twotailed test ),它具有两个否定区域。
y
或2.58
,即得两个否定区域的临界值。
y
0.03 fN(y)
如上述小麦新品种例,
0 =300, y 15 ,
1.96 y =29.4(kg)。因之, 0.02
它的两个2.5%概率
的否定区域为
y ≤300-29.4和
0.01
否定区 域
2.5%
接 受区域
否定区 域
2.5%
y ≥300+29.4,即
围绕其平均数
t向两0 0.35
0.30
侧递降。和正态曲线比较,0.25
正 态分 布
t 分布曲线稍为扁平,峰 0.20
0.15
顶略低,尾部稍高(图5.5)。0.10
t分 布 (df=4)
t 分布是一组随自由度v 0.05
0.00
而改变的曲线,但当v>
-4
-2
0
2
4
30时接近正态曲线,当 v=∞时和正态曲
例:已知总体的均值 0=300,其平均数抽样标准误为15,
被抽样总体的平均数 315kg、标准误也为15,由此可以
统计假设测验
3.正态分布曲线与横轴间的总面积为1(图6-4)
区间µ±1σ面积或概率68.26%
µ±2σ95.45%
(三)正态分布的概率计算
正态分布在某个区间上的概率在统计上经常用到,如果直接计算需要利用该随机变量的概率密度函数在该区间上的积分(即函数分布曲线下某个区间的面积)来求得。而正态分布的概率函数较为复杂,积分的计算又较为困难,这里介绍正态分布概率计算的两种简便方法。
1.利用计算机软件来计算
本书实训部分介绍了用Excel所提供的粘贴函数进行计算,参看实训七。
µ±3σ99.73%
µ±1.96σ95%
µ±2.58σ99%
图6-2σ相同,μ不同时的三条正态分布曲线图6-3σ不同,μ相同时的三条正态分布曲线
(二)正态分布的标准化
正态分布的标准化,是将观测值x的离均差(x-μ)以标准差σ为单位进行度量,所得的随机变数称为u,即:
随机变数u也服从正态分布,且平均数μ=0、标准差σ=1。统计学上把μ=0、σ=1的正态分布称为标准正态分布,记作N(0,1)。标准正态分布只有一条曲线,如图6-5。
3.互斥事件:如果事件A与事件B不能同时发生,则称事件A和事件B为互斥事件或不相容事件。如一个黑色袋子里装有红、黄二种颜色的球,每次从中摸一个球,所摸的球要么红球,要么黄球,因此红球和黄球事件为互斥事件。
以上三种事件可以推广到n个事件。
4.对立事件:如果事件A和事件B必发生其一,但又不能同时发生,则事件A和事件B为对立事件。即“A+B”是必然事件,“AB”是互斥事件。如一粒种子的出苗与不出苗,还有上例中一个黑色袋子里装有红、黄二种不同颜色的球,每次从中摸一个球,所摸的球要么红球,要么黄球,红球和黄球也是对立事件。
教育统计学第五章 假设检验
Exercise
第五章 假设检验
一、假设检验的一般步骤 二、单侧检验与双侧检验 三、两类错误 四、关于样本平均数差异的显著性检验
(两个样本的“t”检验) 五、相关系数的显著性检验 六、方差差异的显著性检验
精品文档
假设检验的一般步骤
(1)建立虚无假设和备择假设 双侧检验为:H0:µ=µ0 H1:µ‡µ0 单侧检验为:H0:µ<=µ0 或 H0:µ>=µ0 H1:µ>µ0 或 H1:µ<µ0 (2)寻找合适的统计量及其抽样分布,并计算统计量的
得Z a 。
精品文档
单侧检验的例子
有人调查早期教育对儿童智力发展的影响,从受过良 好早期教育的儿童中随机抽取70人进行韦氏儿童智力 测验(µ0=100, Ô 0=15),结果平均数为103.3,能否 认为受过良好早期教育的儿童智力高于一般水平?
Z1.84;SE1.793
精品文档
两类错误
H0为真
某心理学家认为一般司机的视反应时平均175毫秒 ,有人随机抽取36名汽车司机作为研究样本进行了 测定,结果平均值为180毫秒,标准差25毫秒.能否根 据测试结果否定该心理学家的结论.(假定人的视 反应时符合正态分布)
精品文档
X
总体平均数的假设检验例题3
某省进行数学竞赛,结果分数的分布不是正态, 总平均分43.5.其中某县参加竞赛的学生168 人,平均分45.1,标准差18.7,该县平均分与全省 平均分有否显著差异?
第5章 统计假设测验1
第一节 统计假设测验的基本原理
两尾测验与一尾测验
备择假设只有一种可能性,是左边一尾概率或者右边一尾 概率,这类测验称为一尾测验。
否定区域 95%
否定区域 95%
-
0
1.64
4
- - 4 - 1.64
0
检验某种白酒的甲醇含量是否合格(国家标准不得超过0.1% ), 实际上是检验 这批白酒甲醇含量是否超过0.1% 。(H0: P≤0.1%,对HA:P>0.1%)
第一节 统计假设测验的基本原理
接受区域 接受区域 1-α 1-α
0
0
第一节 统计假设测验的基本原理
犯这两类型错误的概率( 与 )之间的关系。
⑴ 如果样本容量n不变,减少,则增大。 ⑵ 对于相同的n和, 与 0 相距越远,则 越小。 ⑶ 当n、、与0都相同时, 越小则 越小。
1. 统计假设
注意:
(1)由无效假设和备择假设两部分构成,两者应为对立事 件,等号出现在无效假设中,且无效假设是主要的。 (2)统计假设必须是针对总体参数的假设; (3)无效假设必须是有意义的,据此可以利用抽样分布计 算出事件发生的概率,再者要能够区分是否有效。
第一节 统计假设测验的基本原理
2. 确定测验的显著水平
第二节 平均数的假设测验
[例] 某春小麦良种的千粒重 34g,现自外地引入一高产品种,在8个 小区种植,得其千粒重 (g) 为: 35.6 、 37.6 、 33.4 、 35.1 、 32.7 、 36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差异?
第二节 平均数的假设测验
第5章 统计假设测验
of
statistical hypothesis)。
假 设 检 验 又叫 显著性 检验 (test of significance)。显著性检验的方法很多 ,常用 的有u检验、t检验、F检验和2检验等。尽管这 些检验方法的用途及使用条件不同,但其检验的
基本原理是相同的。本章主要介绍统计假设测验
的基本原理和方法,然 后 介 绍 总 体 参 数 的 区 间 估计(interval estimation)。
在提高显著水平,即减小α值时,为了减小犯Ⅱ 型错误的概率,可 适 当 增 大 样 本 含 量 。因为 增 大 样 本 含 量 可 使 样本平均数分 布 的 方 差 变小, 使图 5-1左右两曲线变得比较“高”、 “瘦”,叠加部分减少,即 β 值变小。 我们希望 α 值不越过某个给定值, 比如α=0.05或 0.01的前提下, β 值越小越好 。 因 为 在 具 体 问 题 中μ1、μ2 和σ相对不变,所以β 值的大小主要 取决于样本含量的大小。
两类错误的关系可归纳如下:
表5-1 两类错误的关系 测验结果 H0被否定 H0被接受 如果是H0是正确的 如果是H0是错误的 Ⅰ型错误(α) 推断正确(1- α) 推断正确(1-β) Ⅱ型错误(β)
关于两类错误的讨论可以总结如下: (1)在样本容量n固定的条件下,提高显著水平α , 如从5%变为1%则将增大第二类错误β的概率。 (2)在n和显著水平相同的条件下,真总体平均数μ 和假设平均数μ0的相差(以标准误为单位)愈大, 则犯第二类错误的概率值愈小。 (3)为了降低犯两类错误的概率,需采用一个较低 的显著水平,如α =0.05, 同时适当增加样本容量 n,或适当减少总体方差σ 2,或兼有之。 (4)如果显著水平α 已经固定,改进试验技术和增 加样本容量可以有效降低犯第二类错误的概率。因 此良好的试验设计是非常重要的。
第五章 统计推断
为研究电渗处理对草莓果实中钙离子含量的影响, 选用10个草莓品种来进行电渗处理与对照的对比试验, 结果如下,问电渗处理对草莓钙离子含量是否有影响?
电渗处理草莓果实钙离子含量
品种号
1
2
3
4
5
6
7
8
910电渗ຫໍສະໝຸດ 理22.2323.42
23.25
21.38
24.45
22.42
24.37
21.75
19.82
三,假设测验的基本方法 ①对所研究的总体首先提出一个无效假设 ②规定测验的显著水平α(一般α=0.05有时α=0.01) ③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计 算假设正确的概率 ④根据"小概率事件实际上不可能发生"的原理接受或否定无效假 设 如小麦品种 旧品种:0=300kg/亩 σ=75kg 新品种:1=330kg/亩 y=330kg 第一步:首先提出假设: HA:1≠0 第二步:平均数的抽样分布,计算概率: = 15 ( kg ) σ y = σ / n = 75 / 25 样本容量n=25 H0:1=0=300kg
135.2
135.2
133.5
(二),成对资料平均数的假设测验
若试验设计是将性质相同 若试验设计是将性质相同的两个供试单位配成一对, 性质相同的两个供试单位配成一对 配成一对, 并设多个配对,然后对每一配对的两个供试单位分别随机 成对数据. 地给予不同处理,所得的观察值为成对数据 地给予不同处理,所得的观察值为成对数据.
1.提出假设.H0:1-2=0,即两条生产线的平均日产量无显著 差异.对HA:1-2≠0,即两条生产线上的平均日产量有显著差 异. 2.确定显著水平.α=0.01. .确定显著水平.α 0.01. 3.检验计算. y1 = 65 . 83 S 2 = 59.7299 y 2 = 59 .77 S 2 2 = 42.8747
统计假设测验
y2(对照)
160
170
160
270
200
180
160
250
200
270
170
290
150 210
270 230 170
从理论上判断,喷施矮壮素只可能矮化无效而不可能促
进植物长高。
H0:μ1≥μ2 ,即喷施矮壮素的株高与未喷的相同或更高;
HA:μ1<μ2 ,即喷施矮壮素的株高较未喷的为矮。
2、在n和显著水平α相同的条件下,总体平均数μ 和假设平均数μ0 相差愈大,则犯第二类错误的概率 β愈小。 3、为了降低犯两类错误的概率,需要采用一个较低 的显著水平,如α=0.05;同时适当增加样本容量, 或适当减小总体方差,或两者兼有之。 4、如果显著水平α已经确定,则改进试验技术和增 加样本容量,可以有效地降低犯第二类错误的概率。
> y
_
μ0 时, 需要否定H0;但如果 不
_
y
< μ0 ,
即可能是一批不合格产品。因此,测验的假设应为H0:μ
> μ0(产品合格); HA:μ<μ0 (产品不合格)。这样否定
区在左尾。 反之,如果H0:μ < μ0 ; HA:μ>μ0 。这时否定区就只 有右尾。
17
左 尾 测 验
否定区
α=0.05
接受区 0.95
μ0
否定区
_
y
接受区
0.95
α=0.05
右 尾 测 验
_
μ0
y
18
四、统计假设的两类错误
统计假设测验是根据一定的概率标准对总体特征
作出推断。否定了H0,并不等于已证明H0不真实;接 受了H0 ,也不等于已证明H0是真实的。 如果H0是正确的,通过测验却否定了它,就犯了 一个否定真实假设的错误。这叫第一类错误或I型错
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机误差;对应假设则为 HA:0。
➢如果测验两个平均数,则假设两个样本的总体平均数相等,
即 H0:1,也2就是假设两个样本平均数的差数
y1 y2 属随机误差,而非真实差异;其对应假设则为
HA:12。
(二) 在承认上述无效假设的前提下,获得平均数的
机样本,其平均产量 等于某一指定值 0 ,故记 为 H0:0 。
(2) 某一棉花品种的纤维长度( )具有工业上某一 指定的标准(C ),这可记为H0:C。
(二) 两个平均数相比较的假设 两个样本乃从两个具有相等参数的总体中随机抽出
的,记为 H0:12 或 H0:120。例如:
(1)两个小麦品种的产量是相同的。 (2)两种杀虫药剂对于某种害虫的药效是相等的。
一试验结果:y 0=30(kg),属于抽样误差的概率小于5%。
2. 计算接受区和否定区 在假设H0为正确的条件下,根据 y 的 抽样分布划出一个区间,如 y 在这一区间内则接受H0,如 y 在
这一区间外则否定H0 。 如何确定这一区间呢?
根据上章所述 y 和 u y 的分布,可知:
y
P { 1 .9y 6 y 1 .9y 6 } 0 .95
( acceptance region );y1.96y和 y1.96y为否定
假设的区域,简称否定区( rejection region )。
同理,若以1%作为接受或否定H0的界限,则
( 2.58 y, 2.58 y)为接受区域,y2.58y和
y2.58y为否定区域。
所以在测验时需先计算1.96 y 或2.58 y ,然后从y 加
第五章 统计假设测验
第一节 统计假设测验的基本原理 第二节 平均数的假设测验 第三节 二项资料的百分数假设测验 第四节 参数的区间估计
(一) 单个平均数的假设 一个样本是从一个具有平均数 0的总体中随机抽
出的,记作:H0:0。例如:
(1) 某一小麦品种的产量具有原地方品种的产量, 这指新品种的产量表现乃原地方品种产量表现的一个随
P{y1.96}0.025 y
P{y1.96}0.025 y
P {y(1.96 y)} 0.02P 5 {y(1.96y)} 0.025
因此,在 y 的抽样分布中,落在(1.96 y, 1.96 y)
区间内的有95%,落在这一区间外的只有5%。
如果以5%概率作为接受或否定H0的界限,则上述区间
( 1.96 y, 1.96 y)为接受假设的区域,简称接受区
种这个总体是否有显著差异呢?以下将说明对此假设进 行统计测验的方法。
(一) 对所研究的总体首先提出一个无效假设
通常所做的无效假设常为所比较的两个总体间无差异。
➢测验单个平均数,则假设该样本是从一已知总体(总体平均
数为指定值 0)中随机抽出的,即 H0:0。如上例,即 假定新品种的总体平均数 等于原品种的总体平均数 0
上述两种假设称为无效假设(null hypothesis)。因为假设 总体参数(平均数)与某一指定值相等或假设两个总体参数相 等,即假设其没有效应差异,或者说实得差异是由误差造 成的。
和无效假设相对应的应有一个统计假设,叫对应 假设或备择假设( alternative hypothesis ),记作
法有以下两种:
1. 计算概率 在假设H 0 为正确的条件下,根据的抽样分布算出
获得 y =330kg的概率,或者说算得出现随机误差 y 0=30(kg)
的概率:在此,根据u 测验公式可算得:
uy3303002
y
15
因为假设是新品种产量有大于或小于当地品种产量的可能
性,所以需用两尾测验。
查附表3,当u=2时,P(概率)界于0.04和0.05之间,即这
HA:0或 HA:12。
如果否定了无效假设,则必接受备择假设;同理, 如果接受了无效假设,当然也就否定了备择假设。
二、统计假设测验的基本方法
(一) 对所研究的总体首先提出一个统计假设 (二) 在承认上述无效假设的前提下,获得平均数 的抽样分布,计算该假设正确的概率 (三) 根据“小概率事件实际上不可能发生”原理 接受或否定假设
下面以一个例子说明假设测验方法的具体内容。 设某地区的当地小麦品种一般667m2产300kg,即 当地品种这个总体的平均数 0 =300(kg),并从多年种植 结果获得其标准差=75(kg),而现有某新品种通过25个 小区的试验,计得其样本平均产量为每667m2330kg, 即
y =330,那么新品种样本所属总体与 0 =300的当地品
上和减去1.96
y 或2.58
,即得两个否定区域的临界值。
y
0.03 fN(y)
如上述小麦新品种例,
0 =300, y 15 ,
1.96 y =29.4(kg)。因之, 0.02
它的两个2.5%概率
的否定区域为
y ≤300-29.4和
0.01
否定区 域
2.5%
接 受区域Leabharlann 否定区 域2.5%
y ≥300+29.4,即
认为它不可能属于抽样误差,从而否定假设。
如果因随机误差而得到某差数的概率P<0.05,则称这个
差数是显著的。如果因随机误差而得到某差数的概率P<0.01,
则称这个差数是极显著的。而这种假设测验也叫显著性测验。
抽样分布,计算假设正确的概率
先承认无效假设,从已知总体中抽取样本容量为
n=25的样本,该样本平均数的抽样分布具正态分布形状,
平均数
y=300(kg),标准误
y
n75 25
=15(kg)。通过试验,如果新品种的平均产量很接近300
kg,例如301kg或299kg等,则试验结果当然与假设相符,
于是应接受H0。如果新品种的平均产量为500kg,与总 体假设相差很大,那当然应否定H0 。但如果试验结果与 总体假设并不相差悬殊 , 就要借助于概率原理,具体做
大于329.4(kg)和小于
0.00
y
255
270
285
300
315
330
345
270.6
329.4
270.6(kg)的概率只有 5%(见图5.1)。
图5.1 5%显著水平假设测验图示 (表示接受区域和否定区域)
(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设
当 y 由随机误差造成的概率小于5%或1%时,就可