试验设计与统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用来测验假设的概率标准5%或1%等,称为显著水平
( significance level )。 一般以 表示,如 =0.05或 =0.01。
二、假设测验的步骤
综合上述,统计假设测验的步骤可总结如下: (1) 对样本所属的总体提出统计假设,包括无效假设和备 择假设。 (2) 规定测验的显著水平 值。
330kg的概率,或者说算得出现随机误差 x 0
u x 330 300 2 15
30(kg)的概率:在此,
x
查附表,当u=2时,P(概率)界于0.04和0.05之间,即这一 试验结果: x 0 30(kg),属于抽样误差的概率小于5%。
二、假设测验的步骤
四、假设测验的两类错误
假设测验的两类错误
H0正确 否定H0 接受H0 错误() 推断正确(1-) H0 错误 推断正确(1-) 错误()
第一类错误(type I error),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误
第一类错误的概率为显著水平 值。
一、t分布
标准正态分布 t 分布自由度9 t 分布自由度2
0
一、t分布
t 分布图形与正态分布图形相似
都具有对称于零、单峰及钟形的特性
t 分布图形的散布(spread)比正态分布图形
大的变异性。
大, t 分布图形的尾端具有较大的概率 以 s / n 替代 / n 来标准化,使得t分布有较
左尾
0.025 -1.96x 否定区
0.95 0 接受区
0.025 +1.96x 否定区
右尾
Hale Waihona Puke Baidu
双尾测验
(two-sided test)
三、两尾测验与一尾测验
单尾测验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
H0 : ≥0 HA : < 0
0.95
0.05
0.05
0.95
接受区 1.64 否定区
-1.64 接受区
右尾测验
左尾测验
三、两尾测验与一尾测验
2 2
双尾 测验 分位数
u 0.05=1.96 u 0.01=2.58

否定区
接受区
否定区
接受区
否定区
单尾 测验 分位数
u 0.05=1.64 u 0.01=2.33
查表时,单尾概率等于双尾概率乘以2
0.01 0.03
fN(y)
0 =300, 15 , x
0.02
接 受区域 否 定 区域
2.5%
否 定 区域
2.5%
x ≤300-29.4和 x ≥300+29.4,即
大于329.4(kg)和小于 270.6(kg)的概率只有5%。
0.00 255 270 285 300 315 330 345
为 H A : 0 。因而,这个对应的备择假设仅有一种可能性, 而统计假设仅有一个否定区域,即曲线的右边一尾。这类测 验称一尾测验( one-tailed test )。一尾测验还有另一种情况, 即 H0 : 0 , H A : 0 , 这时否定区域在左边一尾.
三、两尾测验与一尾测验
小概率原理
二、假设测验的步骤
例 某地区的当地小麦品种一般667m2产300kg,即当地
品种这个总体的平均数 0 =300(kg),并从多年种植结果
获得其标准差=75(kg),而现有某新品种通过25个小区 的试验,计得其样本平均产量为每667m2330kg, 即
y
=330,问新品种产量与当地品种产量是否有显著差
第二类错误的概率为 值。
四、假设测验的两类错误
关于两类错误的讨论可总结如下: (1) 在样本容量n固定的条件下,提高显著水平 (取较小的 值), 如从5%变为1%则将增大第二类错误的概率 值。 (2) 在n和显著水平 相同的条件下,真总体平均数 和假设平均 数 0 的相差(以标准误为单位)愈大,则犯第二类错误的概率 值愈小。
x=300(kg) ,标准误
x
n 75
25
=15(kg)。如果新品种的平均产量很接近300 kg,应接受 H0。如果新品种的平均产量与300相差很大,应否定H0 。
但如果试验结果与300不很接近也不相差悬殊 , 就要借助
于概率原理,具体做法有以下两种:
二、假设测验的步骤
1. 计算概率 在假设H 0 为正确的条件下,根据的抽样分布算出 获得 x
同理,若以1%作为接受或否定H0的界限,则 ( 2.58 x, 2.58 x )为接受区域, x 2.58 x 和
x 2.58 x 为否定区域。
二、假设测验的步骤
如上述小麦新品种例,
1.96 x =29.4(kg)。因之, 它的两个2.5%概率 的否定区域为
面积为/2
面积为/2
t / 2,
0
t / 2,
t
一、t分布
在自由度为 的t分布曲线图下, t , 右方的 面积为 ,则称 t , 为自由度为 的t分布概 率为 的单侧临界值。可查表。
面积为
0
t ,
t
一、t分布
-t
0 t
附表 t 界值表
自由度 单侧 双侧 1 2 3 4 5 6 7 8 9 10 21 22 23 24 25 0.25 0.50 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.686 0.686 0.685 0.685 0.684 0.20 0.40 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.859 0.858 0.858 0.857 0.856 0.10 0.20 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.323 1.321 1.319 1.318 1.316 0.05 0.10 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.721 1.717 1.714 1.711 1.708 概 率,P 0.025 0.01 0.05 0.02 12.706 31.821 4.303 6.965 3.182 4.541 2.776 3.747 2.571 3.365 2.447 2.365 2.306 2.262 2.228 2.080 2.074 2.069 2.064 2.060 3.143 2.998 2.896 2.821 2.764 2.518 2.508 2.500 2.492 2.485 0.005 0.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 2.831 2.819 2.807 2.797 2.787 0.0025 0.001 0.005 0.002 127.321 318.309 14.089 22.327 7.453 10.215 5.598 7.173 4.773 5.893 4.317 4.029 3.833 3.690 3.581 3.135 3.119 3.104 3.091 3.078 5.208 4.785 4.501 4.297 4.144 3.527 3.505 3.485 3.467 3.450 0.0005 0.001 636.619 31.599 12.924 8.610 6.869 5.959 5.408 5.041 4.781 4.587 3.819 3.792 3.768 3.745 3.725
数据来自正态总体N(,2 )的假设下,随机 样本的均数 x 服从正态 N(,2/n ) 标准差σ未知,用样本标准差s估计 x 以 / n 标准化后服从标准正态 x 以 s / n 标准化后则服从 t 分布
x t s/ n
t (n 1)
x 的标准差估计值 s / n 又称为 x 的标准误 (standard error of mean, 简记为 sx )
假设测验
Tests of Significance
Section 5.1 Principle of Significance Tests 假设测验的基本原理
一、假设测验的理论基础
某人宣称自由球命中率有80%。
命中率有80%的射手,实地投射只有8/20命中 率的机会不大。 实地投射结果显示投20球中8球。 结论:命中率有80%的宣称不可信。
命中率有80%的自由球射手投20球命中的次 数应服从二项分布B(20, 0.8)。
命中的次数小于或等于8的概率约为 0.0001。 即重复实地投射20球10,000次只中8球以下的 情形约只发生一次。
一、假设测验的理论基础
假设宣称的叙述为真(命中率有80%) ,可推 得实验结果发生的可能性很低,则该实验结 果的发生(实地投射20球中8球),即为宣称 的叙述不真的好证据。 “Prove by Contradiction”
二、假设测验的步骤
如果以5%概率作为接受或否定H0的界限,则上述区间 ( 1.96 x, 1.96 x )为接受假设的区域,简称接受区 ( acceptance region );x 1.96 x 和 x 1.96 x为否定
假设的区域,简称否定区( rejection region )。
三、两尾测验与一尾测验
如果统计假设为 H0 : 0 , 则备择假设为 H A : 0 , 在 假设测验时所考虑的概率为曲线左边一尾概率和右边一尾概率 的总和。这类测验称为两尾测验( two-tailed test ),它具有两个 否定区域。
如果统计假设为 H0 : 0 , 则其对应的备择假设必
(3) 在 H 0为正确的假定下,根据平均数(
的抽样分布,获得实际差数(如 域如x : 1.96 x
x
x )或其他统计数
等)由误差造成的概
=0.05,划出两个否定区 率(P值)。或者根据已规定概率,如
x 1.96 x 和

(4) 将规定的 值和算得的P值相比较,或者将试验结果 和否定区域相比较,从而作出接受或否定无效假设的推断。
2. 计算接受区和否定区 在假设H0为正确的条件下,根据 x 的 抽样分布划出一个区间,如 这一区间外则否定H0 。由于
x
在这一区间内则接受H0,如x 在
P{ 1.96 x x 1.96 x } 0.95
因此,在x 的抽样分布中,落在( 1.96 x, 1.96 x ) 区间内的有95%,落在这一区间外的只有5%。
异?
二、假设测验的步骤
(一) 先假设新品种产量与当地品种产量无差异,记作
H0 : 0
H A : 0
无效假设或零假设
对立假设或备择假设
二、假设测验的步骤
(二) 在承认上述无效假设的前提下,获得平均数的 抽样分布,计算假设正确的概率
先承认无效假设,从已知总体中抽取样本容量为
n=25的样本,该样本平均数的抽样分布具正态分布形状, 平均数
y
270.6
329.4
图 5%显著水平假设测验图示 (表示接受区域和否定区域)
二、假设测验的步骤
(三) 根据“小概率事件实际上不可能发生”原理接受或否定假设

x 由随机误差造成的概率P小于5%或1%时,就
可认为它不可能属于抽样误差,从而否定假设。 如P<0.05,则称这个差数是显著的。 如P<0.01,则称这个差数是极显著的。
(3) 为了降低犯两类错误的概率,需采用一个较低的显著水平,如

=0.05;或适当增加样本容量。
(4) 如果显著水平 已固定下来,则改进试验技术和增加样本容量 可以有效地降低犯第二类错误的概率。
Section 5.2
Significance Tests for Means
平均数的假设测验
一、t分布
t分布自由度越大图形越接近正态。 样本容量越大s估计σ越可靠,估计值造成的
额外变异性越小。
一、t分布
在自由度为 的t分布曲线图下, t / 2, 右方 与 t / 2, 左方的面积和为 ,则称 t / 2, 为自 由度为 的t分布概率为 的双侧临界值。 可查表。
相关文档
最新文档