第四章 统计推断PPT课件
合集下载
第4章 统计推断(g)1PPT课件
原品种 µ0 =300kg ,σ=75kg
新品系 n=25,-x=330kg
µ
? µ≠µ0
3
一、数据结构
从服从正态分布N(μ0=300,σ=75)的原品种总体中,随 机抽取n个个体构成样本,则样本观察值可表示为
xi = μ0 + εi (i=1,2 ,… ,n)
(4.1)
而从新品系总体中随机抽取的样本观察值,则为
xi = μ + εi (i=1,2 ,… ,n)
(4.2)
新品系与原品种的产量差异为
τ = μ - μ0
(4.3)
将(4.3)代入(4.2)得
xi = μ0 + τ + εi (i=1,2 ,… ,n)
(4.4)
4
二、统计假设测验的基本思路
对一个样本的n个观察值xi求平均数,由(4.4)有
x0i
为试验误差的概率。
9
标准正态离差 u=
x- _ µ0 σ x-
=
330-300 75/√25
=2
(σ
x-
=σ √n
)
查附表2,即得u值对应的概率p<0.05。表明30Kg差异 属于试验误差的概率小于5%。
根据小概率事件实际不可能性原理,这个假设应被否定, 即表面差异不全为试验误差,新品系与原品种之间存在真实 差异。
12Байду номын сангаас
四、统计假设测验的几何意义
α=0.05时,由附表2得u=1.96
若要在0.05水平上接受H0: µ= µ0
则
u=
︳x- _ µ0 σ x-
︳ <
1.96
(σ
x
=σ √n
)
假设接受区域(acceptance region)
第4章统计推断PPT课件
x x (3.41)
t
s x
sn
9
t分布的特征:
(1)曲线左右对称,围绕平均数μt=0向两侧递降。
(2) t分布受自由度df=n-1的制约,每个自由度都有一
条t分布曲线。
(3)和正态分布相比,t分布的顶部偏低,尾部偏高, df〉30时,其曲线接近正态分布曲线,当df→+∞时,则和正态 曲线重合。
拒绝域比较,若没落入,则认为有显著差异,单未 达极显著差异,拒绝H0
若也落入α=0.01拒绝域,则认为差异极显著,拒
绝H0
36
例3.1 已知豌豆重量(mg)服从N(377.2,3.32)。
在改善栽培条件后,随机抽取9粒,籽粒平均重 X =379.2,若标准差仍为3.3,问改善栽培条件是否显 著提高了豌豆籽粒重量?
解:1.小麦的株高是服从正态分布的随机变量
2.假设:
H0: σ=σ0(14cm)
HA: σ<σ0(14cm)
关于备择假设的说明:小麦经过提纯后株高只 能变得更整齐,绝不会变得更离散。即σ只能小于σ0 。因此, HA: σ<σ0
3.显著性水平:规定α=0.01
40
4.统计量的值: 2n 1 0 2S2 ~2n1
正态分布和t分布:双侧检验--取绝对值与分位数 比 ;单侧检验--下单尾是小于负分位数拒绝H0; 上单尾是大于分位数拒绝H0。
χ2分布:下侧分位数和上侧分位数
35
5.计算统计量
把样本观测值代入统计量公式,求得统计量取值 ,检查是否落入拒绝域。
若没落入,则认为无显著差异,接受H0
若落入α=0.05的拒绝域,则应进一步与α=0.01的
10
注: t1(n)t(n) 分位点
统计推断PPT课件
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
. 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
统计推断
(statistical inference)
.
1
统
由一个样 本或一糸
计
列样本所
推
得的结果
断
来推断总 体的特征
.
假设检验 参数估计
2
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
.
3
.
4
第一节 假设检验
0.025 -1.96x
否定区
0.95
0.025
0 +1.96x
接受区
否定区
临界值: + ux
.
+ 1.96x
19
P(-2.58x <x< +2.58x) =0.99
0.005 -2.58x
否定区
0.99
0.005
0 +2.58x
接受区
否定区
临界值: + 2.58x
.
双尾检验
(two-sided test)
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
. 10
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
统计推断
(statistical inference)
.
1
统
由一个样 本或一糸
计
列样本所
推
得的结果
断
来推断总 体的特征
.
假设检验 参数估计
2
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
.
3
.
4
第一节 假设检验
0.025 -1.96x
否定区
0.95
0.025
0 +1.96x
接受区
否定区
临界值: + ux
.
+ 1.96x
19
P(-2.58x <x< +2.58x) =0.99
0.005 -2.58x
否定区
0.99
0.005
0 +2.58x
接受区
否定区
临界值: + 2.58x
.
双尾检验
(two-sided test)
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
《推断统计》课件
推断统计的局限性和注意事项
1 样本误差
样本数据有限,推断结果可能存在误差和不确定性。
2 样本偏倚
样本选择不充分或不具有代表性,推断结果可能失真。
总结和展望
推断统计学为我们提供了一种解释和利用数据的有效方法。随着技术的发展, 推断统计学在各个领域的应用将继续扩大。
推断和解释
4
行分析和解读。
基于样本结果,对总体特征进行推断 和解释。
案例分析:推断统计在市场调研中的应 用
研究目标
探索消费者购买行为和偏好,为市场推广提 供依据。
数据分析
运用推断统计方法对数据进行分析,发现消 费者喜好和购买模式。
数据收集
通过在线调查和购物记录采集大量消费者数 据。
结果解释
根据分析结果制定市场策略,提高销售和市 场份额。
《推断统计》PPT课件
探索统计学的定义及其在实践中的重要性,介绍推断统计学的概念,原理以 及广泛应用的领域。探讨推断统计学的方法和步骤,并以市场调研案例分析 其实际应用。总结推断统计学的局限性和注意事项,并展望未来发展。
统计学的定义和重要性
什么是统计学?
统计学是研究收集、分析、解释和展示数据 的科学领域。
为什么统计学重要?
统计学帮助我们掌握信息,做出准确的决策, 并从数据中发现隐藏的模式和趋势。
推断统计的概念和原理
1 什么是推断统计学?
2 推断统计学的原理
推断统计学是通过样本数据对总体特征进 行推断和预测的过程。
基于概率理论和数理统计学的基础,推断 统计学利用样本信息来推理总体特征。
推断统计的应用领域
市场调研
推断统计学在市场调研中帮助了解消费者需求、 市场趋势和产品定位。
统计学第四章 统计推断1
求解似然方程
ˆ
1 1 7 i1 xi x 4
27
7
27
【例】总体均匀分布 X ∼ U(a,b),其中,a,b 是未知参数。设 X1,..., X n 为来自该总体的随机样本, x1 ,..., xn 为样本观察值,求未知参 数 a,b 的极大似然估计
1 x [a, b] b a f (x, a, b) 解:总体服从均匀分布,即 0 x [a, b]
ˆ X,
n n 1 1 ˆ 2 X i2 X 2 ( X i X ) 2 . n i 1 n i 1
16
16
例总体X的概分布为
X
1
1
2
„
1 „
θ
1
试求未知参数θ的估计量。
pi
E ( X ) 1
1 1 1 1 1 (1 ) (1 ) 2 (1 2 ) [ ] 2 2
12
(一) 矩估计法
统计学中,矩是指以期望值为基础而定 义的数字特征,如数学期望、方差、协方差等。 矩估计法是英国统计学家K.皮尔逊最早提 出来的,其理论基础是大数定理。 设X为随机变量,对任意的正整数k ,称E(Xk)、
E[(X-EX)] k分别为随机变量X的k 阶原点矩和k 阶中心矩。
由样本矩去估计总体矩的方法称为矩估计法; 由矩估计法得到的估计量称为矩估计量。
13
k E ( X ) 存在,则 由大数定律,若总体 k 阶原点矩
1 n k lim P X i E ( X k ) 0 n ,即样本的 n i 1
k 阶原点矩依概率收敛于总体
k k E ( X ) E ( X ) 知时,自然会想到用子样 k 阶 k 阶原点矩 ,所以当
第4章 统计推断 120
H0
1 2
1 2 1 2
H1
1 2
1 2 1 2
医学统计学
12
三 、双尾检验与单尾检验
2
否定区 接受区
2
否定区
双尾 检验
接受区 否定 区
单尾 检验
二 、假设检验的步骤
2.确定检验水准 检验水准(size of a test)亦称显著 性根水据准选(定sig的ni显fic著an性ce水le平ve(l)0,.0符5或号0为.0α1。),决定接受 还它是是拒判绝别H差0. 异有无统计意义的概率水准,其大小 应根据分析的要求确定。通常取α= 0.05。
u值。
医学统计学
15
二 、假设检验的步骤
4.确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于
或及的样大前本于提(下间出或的小现差于观异)察由样现抽有本样统以误计及差更量所的极致概端的率情概。况即的率概在。率H0为。真
│t│≥ tα,υ ,则P≤ α;
可以认为差别不由抽样误差引起,可以拒绝H0
医学统计学
14
二 、假设检验的步骤
3.选定检验方法和计算统计量
的根选检据验择研方究法适设。计当如的完类的全型随统和机统计设计计推方中断,法的两目计样的本要算均求数H选的用0比不较同 可不成同用的t立检统验计的,检样可验本方能含法量,性较可大即得时到(概不n同>率1的00有统)计,可多量用,大Z如检t验值。和
假设检验的原理
反证法:当一件事情的发生只有两种可能A和B, 为了肯定其中的一种情况A,但又不能直接证实A, 这时否定另一种可能B,则间接的肯定了A。
小概率原理:概率很小的事件在一次抽样试验中
第四章 统计推断3PPT课件
u x
x
其中平均数标准误为:
x
n
由于假设H0:μ=μ0,故:
x
u
0
x
由于总体标准差不易求得,若为大样本, 可以用样本标准差估计总体标准差,则样 本平均数的标准误及u值为:
sx
s n
x
u
0
sx
如果实得 u u ,则否定H0,接受HA。当
时 u u ,接受H0。
大样本平均数的检验
❖ 例4.1 ❖ 解题思路:总体标准差已知,故采用u双尾检
本例利U分 用布 了来|u估 |2.5计 6的 2 尾区概率, u检所 验以 。称
ux0 称为检验统计量。 / n
3 双侧检验与单侧检验
在例一里,HA 备 :择 0。 假 HA实 设际 是上包 0含 或 0这两种情水 况平 ,的 此拒 时 ( , 绝 u/域 2] 为
和 [u/2,)。
这种利用两的 个检 尾验 部称 进作 行 双 双侧 侧检 检验 验的 。
首先对样本所 作在 一的 假总 设体 。假 药设 剂喷 的洒 玉了 米单
总体平与 均原 数来的玉米 体单 平穗 均 0之重 数 间总 没有真实 即=0。也就是说表 x面 0)差 是异 由( 抽样误 。差造成
0被称为零假设 设或 ,无 记 H0效 :为 假 0.
所谓“零”就是指处理(药剂) 没有效果
H0是待检验的假 可设 能, 被它 接有 受, 被也 否有 定可 。 因此,需要设 立定 的一 假个 设对 ,称 设为 。备择假
验 ❖ 检验步骤: ❖ 无效假设H0:1=2.即新育苗方法与常规育
苗方法所育鱼苗体长相同 ❖ 备择假设HA:12即新育苗方法与常规育
苗方法所育鱼苗体长不相同
❖ 选取显著水平α=0.05
《统计推断》课件
01
单因素方差分析用于比较一个分类变量对数值型因 变量的影响。
02
它通过分析不同组之间的均值差异,判断各组之间 是否存在显著差异。
03
通常使用F统计量进行检验,并结合显著性水平判断 结果的可靠性。
双因素方差分析
1
双因素方差分析用于比较两个分类变量对数值型 因变量的影响。
2
它通过分析两个因素不同水平组合下的均值差异 ,判断各组合之间是否存在显著差异。
非参数回归分析
总结词
一种回归分析方法,不假设响应变量和 解释变量之间的关系形式,而是通过数 据驱动的方法来探索变量之间的关系。
VS
详细描述
非参数回归分析是一种回归分析方法,它 不假设响应变量和解释变量之间的关系形 式,而是通过数据驱动的方法来探索变量 之间的关系。这种方法能够适应各种复杂 的回归模型,并且能够有效地处理解释变 量和响应变量之间的非线性关系。
非参数秩次检验
总结词
一种不依赖于总体分布假设的统计检验方法,通过对观察值进行排序并比较秩次来推断统计显著性。
详细描述
非参数秩次检验是一种不依赖于总体分布假设的统计检验方法,它通过对观察值进行排序并比较秩次 来推断统计显著性。这种方法适用于总体分布未知或不符合正态分布的情况,能够提供稳健和可靠的 统计推断结果。
02
03
04
社会学
在调查研究中,统计推断用于 估计人口特征和趋势,如性别
比例、年龄分布等。
医学
统计推断用于临床试验和流行 病学研究,以评估治疗效果、
疾病发病率和死亡率等。
经济学
统计推断用于预测市场趋势、 评估政策效果和评估经济指标
等。
商业
统计推断用于市场调查、消费 者行为分析、产品质量控制等
第四章 统计推断 ppt课件
H0:μ≤ μ0=30(cm),即该棉花品种纤维长度达不到 纺织品生产的要求。 HA:μ>μ0
24
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
返回 H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
12
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
(3)检验
x
x n 4.421 s
x2
(x)2
n
0.267
n1
(tn1
x
sx
0.9 4
t 0.05(9) =2.262
P>0.05
在0.05显著水平上,接受H0,否定HA;
认为该次抽样所测结果与多年平均值无显著差别,
属于随机误差。
45
二、两个样本平均数 的假设检验
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
24
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
返回 H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
12
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
(3)检验
x
x n 4.421 s
x2
(x)2
n
0.267
n1
(tn1
x
sx
0.9 4
t 0.05(9) =2.262
P>0.05
在0.05显著水平上,接受H0,否定HA;
认为该次抽样所测结果与多年平均值无显著差别,
属于随机误差。
45
二、两个样本平均数 的假设检验
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
统计推断的概要(ppt 共24页)
样本均值的分布
从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为 了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均 值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确.
推断的概要
10
随样本容量变化的平均标准误差(平均值的标准偏差)
平均值的标准偏差称平均的标准误差(SE Mean),如下定义. 一般标准误差越小推断值越好.
统计推断的概要
(分析阶段) (ZTE-GB303-V1.5)
推断的概要
1
主要内容
1. 统计推断 2. 误差的来源 3. 置信统计推断
统计推断是通过抽取样本,然后对样本进行分析,以样本的分析结果 推测出“总体可能是这样”结论,对总体下一个正确判断的行为,即总
体
是否发生了变动。而且,一般以推测总体平均值,总体的比率,总体标 准偏差等显示总体分布特征值的统计程序称为统计推断。
95% Confidence Interval for Median 95% Confidence Interval for Median 49.315 60.494
对总体区间推断值 -95%置信度总体平均值 的置信区间 -95%置信度下总体标准 偏差的置信区间 -95%置信度总体中位 数的置信区间
弯曲点 标 准 误 差
Sx Sx n
Sx = Sx =
平均的标准误差 样本的标准偏差 n = 样本大小
0
10
20
30
标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大
小应为5以上,为了得到更精确的平均推断值,样本大小应为30以上.
推断的概要
11
3. 区间推断
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设某地区的当地小麦品种一般667m2产300kg,即当
地品种这个总体的平均数为μ0=300(kg),并从多年种植
结果获得其方差σ2=(75)2kg。若从这一总体中随机抽 取n个个体构成样本,则样本观察值可表示为:
yi= μ0 +εi (i=1,2,…,n)
现有某新品种通过25个小区的试验,计算其样本平均产 量为每667m2为330kg。新品种的样本观察值可表示为:
.
1 、提出假设
H0
无效假设 /零假设 /检验假设
0 =
误差 效应
备择假设 /对应假设
0
. HA
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。
平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025 否定区0 -1.96x
0.95
0 接受. 区
0.025 0+1.9否6定x 区
4、作出推断结论:是否接受假设
小 概
P> 可能正确
率
原
理 P< 可能错误
.
接受H0 否定HA 否定H0 接受HA
τ为处理效应, i 为误差效应。
.
x 从式 - μ0 = τ + i 可知表型效应的构成有二种可能性
(1)处理效应与误差效应; (2)全为试验误差。
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
但在某些情况下,双尾测验不一定符合实际需要。
在已知μ不可能小于μ0时,则备择假设为HA:μ>μ0
在已知μ不可能大于μ0时,则备择假设为HA:μ<μ0
例:研究矮壮素使玉米矮化的效果,从理论上判断, 喷施矮壮素只可能矮化无效而不可能促进植物长高, 因此假设
H0:喷施矮壮素的株高与未喷的相同或更高,即H0: μ≥μ0 ,对应HA: μ<μ0 ,即喷施矮壮素的株高较未
喷的为矮。 .
例:生产某种纺织品,要求棉花纤维长度平均为30mm以上,现 有一棉花品种,以n=400进行抽查,测得其纤维平均长度为 30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否符合纺织品的生产要求?
注:备择假设比无效假设重要,具体选择要由实际问 题来确定,一般把期望出现的结论作为备选假设。
.
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
xi= μ +εi (i=1,2,…,n) 式中μ为新品种的总体平均数。新品种与地方品种的差 异(品种效应)用τ表示,则
τ
=
μ-
.
μ0
代入上式得:
xi= μ0 + τ + εi (i=1,2,…,n)
对xi求平均数,并将式子稍作变形得:
x - μ0 = τ + i x 0 为表型效应, 在本例中,x033030030
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验中则几乎不可能发生。
=0.05/0.01
.
平均数的检验
参数检验
频率的检验
假
设
方差的检验
检
秩和检验
验
符号检验
非参数检验
游程检验
.
秩相关检验
统计假设测验的基本思想
统计推断
(statistical inference)
.
统
由一个样 本或一糸
假设检验
计
列样本所推ຫໍສະໝຸດ 得的结果断来推断总 体的特征
参数估计
.
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节
方差的同质性检验
.
.
第一节 假设检验
一 概念 :
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
.
小概率原理
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
P<
.
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值
根据研究设计的类型和统计推断的目的选择使
用不同的检验方法。
H0:μ=μ0 =126(mg/L)
HA:μ≠μ0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
.
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。
0.025 否定区-1.96x
0.95
0.025
0 接受区
+1.9否6定x 区
临界值: + ux
.
+ 1.96x
P(-2.58x <x< +2.58x) =0.99
0.005 否定区-2.58x
0.99
0.005
0 接受区
+2.5否8定x 区
临界值: + 2.58x
.
双尾检验
(two-sided test)
例:上例中 P >0.05
所以接受H0,从而得出结论:使用克 矽平治疗前后血红蛋白含量未发现有 显著差异,其差值10应归于误差所致。
.
0.025 0.95
0.025
u >1.96 u >2.58
P( u ) <0.05 差异达显著水平 P( u ) <0.01 差异达极显著水平
.
三 、双尾检验与单尾检验 P(-1.96x <x< +1.96x) =0.95
地品种这个总体的平均数为μ0=300(kg),并从多年种植
结果获得其方差σ2=(75)2kg。若从这一总体中随机抽 取n个个体构成样本,则样本观察值可表示为:
yi= μ0 +εi (i=1,2,…,n)
现有某新品种通过25个小区的试验,计算其样本平均产 量为每667m2为330kg。新品种的样本观察值可表示为:
.
1 、提出假设
H0
无效假设 /零假设 /检验假设
0 =
误差 效应
备择假设 /对应假设
0
. HA
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。
平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025 否定区0 -1.96x
0.95
0 接受. 区
0.025 0+1.9否6定x 区
4、作出推断结论:是否接受假设
小 概
P> 可能正确
率
原
理 P< 可能错误
.
接受H0 否定HA 否定H0 接受HA
τ为处理效应, i 为误差效应。
.
x 从式 - μ0 = τ + i 可知表型效应的构成有二种可能性
(1)处理效应与误差效应; (2)全为试验误差。
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
但在某些情况下,双尾测验不一定符合实际需要。
在已知μ不可能小于μ0时,则备择假设为HA:μ>μ0
在已知μ不可能大于μ0时,则备择假设为HA:μ<μ0
例:研究矮壮素使玉米矮化的效果,从理论上判断, 喷施矮壮素只可能矮化无效而不可能促进植物长高, 因此假设
H0:喷施矮壮素的株高与未喷的相同或更高,即H0: μ≥μ0 ,对应HA: μ<μ0 ,即喷施矮壮素的株高较未
喷的为矮。 .
例:生产某种纺织品,要求棉花纤维长度平均为30mm以上,现 有一棉花品种,以n=400进行抽查,测得其纤维平均长度为 30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否符合纺织品的生产要求?
注:备择假设比无效假设重要,具体选择要由实际问 题来确定,一般把期望出现的结论作为备选假设。
.
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
xi= μ +εi (i=1,2,…,n) 式中μ为新品种的总体平均数。新品种与地方品种的差 异(品种效应)用τ表示,则
τ
=
μ-
.
μ0
代入上式得:
xi= μ0 + τ + εi (i=1,2,…,n)
对xi求平均数,并将式子稍作变形得:
x - μ0 = τ + i x 0 为表型效应, 在本例中,x033030030
如果假设一些条件,并在假设的条件下能够准确地算 出事件A出现的概率α 为很小,则在假设条件下的n次独 立重复试验中,事件A将按预定的概率发生,而在一次试 验中则几乎不可能发生。
=0.05/0.01
.
平均数的检验
参数检验
频率的检验
假
设
方差的检验
检
秩和检验
验
符号检验
非参数检验
游程检验
.
秩相关检验
统计假设测验的基本思想
统计推断
(statistical inference)
.
统
由一个样 本或一糸
假设检验
计
列样本所推ຫໍສະໝຸດ 得的结果断来推断总 体的特征
参数估计
.
第一节 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节
方差的同质性检验
.
.
第一节 假设检验
一 概念 :
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
.
小概率原理
概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。
统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验也 常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
P<
.
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值
根据研究设计的类型和统计推断的目的选择使
用不同的检验方法。
H0:μ=μ0 =126(mg/L)
HA:μ≠μ0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
.
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。
0.025 否定区-1.96x
0.95
0.025
0 接受区
+1.9否6定x 区
临界值: + ux
.
+ 1.96x
P(-2.58x <x< +2.58x) =0.99
0.005 否定区-2.58x
0.99
0.005
0 接受区
+2.5否8定x 区
临界值: + 2.58x
.
双尾检验
(two-sided test)
例:上例中 P >0.05
所以接受H0,从而得出结论:使用克 矽平治疗前后血红蛋白含量未发现有 显著差异,其差值10应归于误差所致。
.
0.025 0.95
0.025
u >1.96 u >2.58
P( u ) <0.05 差异达显著水平 P( u ) <0.01 差异达极显著水平
.
三 、双尾检验与单尾检验 P(-1.96x <x< +1.96x) =0.95