第四章-统计推断PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验中则几乎不可能发生。
=0.05/0.01
.
6
平均数的检验
参数检验
频率的检验
假
设
方差的检验
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
P<
.
显著水平*
极显著水平**
14
3 、选定检验方法,计算检验统计量,确定概率值
根据研究设计的类型和统计推断的目的选择使
用不同的检验方法。
检
秩和检验
验
符号检验
非参数检验
游程检验
.
秩相关检验 7
统计假设测验的基本思想
设某地区的当地小麦品种一般667m2产300kg,即当
地品种这个总体的平均数为μ0=300(kg),并从多年种植
结果获得其方差σ2=(75)2kg。若从这一总体中随机抽 取n个个体构成样本,则样本观察值可表示为:
yi= μ0 +εi (i=1,2,…,n)
0.025 -1.96x
否定区
0.95
0.025
0 +1.96x
接受区
否定区
临界值: + ux
.
+ 1.96x
19
P(-2.58x <x< +2.58x) =0.99
0.005 -2.58x
否定区
0.99
0.005
0 +2.58x
接受区
否定区
临界值: + 2.58x
.
双尾检验
(two-sided test)
一 概念 :
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
.
5
小概率原理
20
但在某些情况下,双尾测验不一定符合实际需要。
在已知μ不可能小于μ0时,则备择假设为HA:μ>μ0
在已知μ不可能大于μ0时,则备择假设为HA:μ<μ0
例:研究矮壮素使玉米矮化的效果,从理论上判断, 喷施矮壮素只可能矮化无效而不可能促进植物长高, 因此假设
H0:喷施矮壮素的株高与未喷的相同或更高,即H0: μ≥μ0 ,对应HA: μ<μ0 ,即喷施矮壮素的株高较未
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
.
11
1 、提出假设
H0
无效假设 /零假设 /检验假设
0 =
误差 效应
备择假设 /对应假设
0
. HA
处理 效应
12
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。
平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
现有某新品种通过25个小区的试验,计算其样本平均产 量为每667m2为330kg。新品种的样本观察值可表示为:
xi= μ +εi (i=1,2,…,n)
式中μ为新品种的总体平均数。新品种与地方品种的差 异(品种效应)用τ表示,则
τ
=
μ-
.
μ0
8
代入上式得:
xi= μ0 + τ + εi (i=1,2,…,n)
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
接受. 区
否定区
15
4、作出推断结论:是否接受假设
小 概
P> 可能正确
率
原
理 P< 可能错误
.
接受H0 否定HA 否定H0 接受HA
H0:μ=μ0 =126(mg/L)
HA:μ≠μ0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数
和治疗前的平均数来自不同总体,即克矽平有疗效。
.
13
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。
16
例:上例中
P >0.05
所以接受H0,从而得出结论:使用克 矽平治疗前后血红蛋白含量未发现有 显著差异,其差值10应归于误差所致。
.
17
0.025 0.95
0.025
u >1.96 u >2.58
P( u ) <0.05 差异达显著水平 P( u ) <0.01 差异达极显著水平
.
18
三 、双尾检验与单尾检验 P(-1.96x <x< +1.96x) =0.95
统计推断
(statistical inference)
.
1
统
由一个样 本或一糸
计
列样本所
推
得的结果
断
来推断总 体的特征
.
假设检验 参数估计
2
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
.
3
.
4
第一节 假设检验
对xi求平均数,并将式子稍作变形得:
x - μ0 = τ + i
x 0 为表型效应, 在本例中,x033030030
τ为处理效应, i 为误差效应。
. 9
x 从式 - μ0 = τ + i 可知表型效应的构成有二种可能性
(1)处理效应与误差效应; (2)全为试验误差。
由于处理效应τ = μ- μ0 无法计算,统
喷的为矮。 . 21
例:生产某种纺织品,要求棉花纤维长度平均为30mm以上,现 有一棉花品种,以n=400进行抽查,测得其纤维平均长度为 30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否ห้องสมุดไป่ตู้合纺织品的生产要求?
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
. 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),