第四章 统计推断(1)

合集下载

多元正态总体的统计推断.

多元正态总体的统计推断.

0z

0z
条件 检验条件量 H0、H1
n1p1≥5 n1q1≥5n2
u

p2≥5
n2q2≥5

p1 p2

pq pq n1 n2
(1) H0:P1=P2 H1:P1 ≠P2 (2) H0: P1 ≤P2
H1:P1 > P2



p

n1
p1
n2
p2
n1 n2
(3) H0:P1 ≥P2 H1:P1 <P2
总体参数
的值是多大?
推断估计
抽样分布
参数估计
统计量
随机原则
假设检验
检验未知参数
的值是 0 吗
一、参数估计
参数估计分为点估计和区间估计两种。
点估计:用某一具体的值去估计某一未知参数
区间估计:给出未知参数在一定把握程度 (概率或置信度下的取值区间,也称为置信 区间。
对总体的未知参数 作区间估计,就是要给出
确定α,就确定了临界点c。 1、随机抽样:样本均值
2、 X 标准化:
3、确定α值
4、查概率表,知临界值 | Z |
2
5、计算Z值,作出判断
检验步骤
1
建立总体假设 H0,H1
2
抽样得到样
3
选择统计量
4
根据具体决策
本观察值
确定H0为真 时的抽样分布
要求确定α
6
计算检验统
5
确定分布上的临
计量的数值
7
第四章 多元正态总体的统计推断
第一节 一元正态总体的统计推断
推断统计: 利用样本统计量对总体某些性质或数 量特征进行推断。

统计推断1

统计推断1

小概率事件在一次观察中是不应发生的, 但是它现在发生了!!说明了什么? 一个合理的解释就是它本不是“小概率事件”, 是人们把概率算错了,算错的原因就是在 一开始就做了一个错误的假设 米
换句话说,此时应该认为: 即年来男孩的身高有明显增长。
【例2 】某地进行了两个水稻品种对比试验, 在相同条件下,两个水稻品种分别种植10个 小区,获得两个水稻品种的平均产量(kg/亩) 为:
第四章 统计推断
第一节 统计推断概述
研究样本的目的是以各种样本统计量的 抽样分布为基础去推断总体。 如何从一些包含有随机误差,又不完全的信息 中得出科学的、尽可能正确的结论是统计学 要解决的主要问题。
从样本中获得的信息所包含的不确定性,
主要来自以下几个方面:
(1)测量过程引入的随机误差;
(2)取样随机性所带来的变化,由于只取出 少数样品测量,那么取出的这一批样品的测量 结果与抽取另外一批当然会有差别; (3)我们所关心的性质确实发生了某种变化。 显然,只有第三种变化才是我们要检测的。
对于从有误差的实验数据中得出结论的科学工作者
来说,统计学是一种不可或缺的工具。
一、 统计推断的途径
1、 统计假设检验** 2、总体参量估计。
二、假设检验的基本思想 先看两个实例 【例1】 某地区10年前普查时,13岁男孩子的 平均身高是1.51米,现抽查200个12.5~13.5岁 的男孩子,身高平均值为1.53米,标准差为 0.073米,问:10年来该地区男孩身高是否有 明显增长?
3、选择显著性水平与建立拒绝域 (2)建立拒绝域
① 分位数法(临界值法) ② 概率法(P值法) 利用显著性水平(概率值)构成接受域和拒绝域。 根据统计量数值的大小,先计算(或查表)出 (X>统计量数值)出现的概率,这个概率称为P值, 用P值与显著性水平相比较进行判断。

生物统计学习题集答案

生物统计学习题集答案

.. 生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为 连续 变量和 非连续 变量。

2 样本统计数是总体 参数 的估计量。

3 生物统计学是研究生命过程中以样本来推断 总体 的一门学科。

4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。

5 统计学的发展过程经历了 古典记录统计学、 近代描述统计学现代推断统计学 3个阶段。

6 生物学研究中,一般将样本容量 n大于等于 30称为大样本。

7 试验误差可以分为__随机误差 、系统误差 两类。

二、判断(-)1 对于有限总体不必用统计推断方法。

(-)2 资料的精确性高,其准确性也一定高。

(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。

(+)4 统计学上的试验误差,通常指随机误差。

三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。

总体:具有相同的个体所构成的集合称为总体。

连续变量:是指在变量范围内可抽出某一范围的所有值。

非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。

准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。

精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。

第二章 试验资料的整理与特征数的计算一、填空1 1 资料按生物的性状特征可分为资料按生物的性状特征可分为资料按生物的性状特征可分为_________数量性状资料数量性状资料数量性状资料__变量和变量和______变量性变量性状资料状资料__变量。

2 2 直方图适合于表示直方图适合于表示直方图适合于表示______计量计量计量 、、 连续变量连续变量__资料的次数分布。

3 3 变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即__集中性集中性__和____离散性离散性离散性__。

4 4 反映变量集中性的特征数是反映变量集中性的特征数是反映变量集中性的特征数是______平均数平均数平均数______,反映变量离散性的特征,反映变量离散性的特征数是数是______变异数(标准差)变异数(标准差)变异数(标准差)__。

生物统计第4章 统计推断

生物统计第4章 统计推断
2014-8-4
4.1.5 变异性的显著性检验:2检验
一个混杂的小麦品种,株高标准差0 =14cm,经 提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察 提纯后的群体是否比原群体整齐?
1、小麦株高是服从正态分布的随机变量 2、提出假设 关于备择假设的说明:小麦经提纯后只 能变得更整齐,绝不会更离散,即只能 小于0,因此HA:< 0 。
2014-8-4
4.1.5 变异性的显著性检验:2检验(续) 3、显著性水平规定=0.05 4、统计量的值:
5、建立的拒绝域:因HA: < 0 ,故为下尾 单侧检验,当2<21-时拒绝H0 ,从附表6中可 以查ቤተ መጻሕፍቲ ባይዱ29,0.99 = 2.09 6、结论,因2<29,0.99,拒绝H0 ,接受HA , 提纯后株高比原株高整齐。
2014-8-4
小概率原理
在一次试验中,几乎是不会发生的,若根 据一定的假设条件计算出来的该事件发生 的概率很小,而在一次试验中它竟然发生 了,则可认为原假设条件不正确,给予否 定。 在生物统计的显著性检验中,通常取5%或 1%小概率为显著性水平,记为“”
2014-8-4
小概率原理用于显著性检验
2014-8-4
两种类型的错误
–Ⅰ型错误:假设是正确的,却错误地拒绝了它。 犯Ⅰ型错误的概率不会大于 。(以真为假) –Ⅱ型错误:当 0但错误地接受了 = 假设时所犯的错误。(以假为真)
0的
2014-8-4
关于两种类型错误的三点解释
• 当1越接近于0时,犯Ⅱ型错误的概率愈 大;当1越远离0时,犯Ⅱ型错误的概率 愈小。 • 在样本含量和样本平均数都固定时,为了 降低犯Ⅰ型错误的概率 (就应将图5-2 中的竖线右移),必然增加犯Ⅱ型错误的 概率。 • 为了同时降低和就需增加样本含量。

第4章 统计推断

第4章 统计推断
第四章 统计推断
第一节 假设检验的方法 第二节 单个样本平均数假设测验 第三节 两个样本平均数假设测验 第四节 参数的区间估计
学习目的
理解假设检验与区间估计的原理
掌握假设检验的步骤 对实际问题进行统计测验及总体参数估 计
第一节 假设检验的方法
统 计 推 断 的 概 念
总体
抽样分布
样本1
表2 两种栽培方法的地瓜产量 单位(kg/亩)
有机
2722.2
2866.7
2675.9
2169.2
2253.9
2315.1
标准
951.4
1417
1275.3
2228.5
2462.6
2715.4
(一) 成组数据的平均数比较
1. u检验
两个样本总体方差已知,或总体方差未知, 但为大样本时采用 例1 已知早稻佳辐品种σ2=1.35,用A、B两种方 法取样,A取15个样点,平均产量x1=7.69;B法取9 个样点,平均产量x2=8.77。检验两种取样法测得
t = d sd
[例4-7] 选生长期、发育
进度、植株大小和其他方
面皆比较一致的两块地的 红心地瓜苗配成一对,共 有6对。每对中一块地按 标准化栽培,另一块地进
表 两种栽培方法的地瓜产量 单位(kg/亩)
有机 2722.2 2866.7 2675.9 2169.2 2253.9 2315.1
标准 951.4 1417 1275.3 2228.5 2462.6 2715.4
两尾测验与一尾测验
假设 双尾测验 左尾测验 右尾测验
H0 HA
μ=μ0 μ≠μ0
μ≥μ0 μ<μ0
μ≤μ0 μ>μ0

第四章 统计推断

第四章 统计推断

.
二、双侧检验与单侧检验 (一)双侧检验 H0:µ =µ 0, HA:µ ≠ µ 0 H0的拒绝域 :|U| > ua/2 ; H0的接受域: |U| < ua/2 。(见图示) (二)单侧检验 H0:µ =µ 0, HA:µ < µ 0 或 HA:µ > µ 0 1、下尾检验 H0:µ =µ 0, HA:µ < µ 0 H0的拒绝域 :U< -ua ;
.
u=
x m0
s
x
s s x = n
.
10.23 10 u= = 3.15 0.40 30
根据u值的大小,即可判定假设H0:µ=µ 0 ( m =10㎏)是否正确?
.
.
.
查附表2,实得u=3.15值对应的概率p< 0.05。表明0.23Kg差异属于抽样误差的概 率小于5%。 (三)根据小概率事件实际不可能性原理, 推断 H0是否正确。 判定假设H0是否正确的小概率标准称为
.
2 s1 193.4 F = 2 = = 0.206 s2 937.7
.
④H0的拒绝域:因为是下尾检验,当F<F0.95时拒 绝 H 0。
F19,19,0.95 =
.
1 F19,19,0.05
2 n 1 s 10 124.23 2 = = = 1.113
.
.
14 2 ④H0的拒绝域:当a=0.01时,拒绝域为2 <20.99 从附表6中查出20.99,9=2.088 。
s 02
⑤结论:因实得2 < 2.088 ,P < 0.01,所以拒 绝H 。推断经过提纯后株高已变得非常整齐。
s F = s
2 1 2 2

统计学第四章 统计推断1

统计学第四章  统计推断1

求解似然方程
ˆ
1 1 7 i1 xi x 4
27
7
27
【例】总体均匀分布 X ∼ U(a,b),其中,a,b 是未知参数。设 X1,..., X n 为来自该总体的随机样本, x1 ,..., xn 为样本观察值,求未知参 数 a,b 的极大似然估计
1 x [a, b] b a f (x, a, b) 解:总体服从均匀分布,即 0 x [a, b]
ˆ X,
n n 1 1 ˆ 2 X i2 X 2 ( X i X ) 2 . n i 1 n i 1
16
16
例总体X的概分布为
X
1
1
2

1 „
θ
1
试求未知参数θ的估计量。
pi
E ( X ) 1
1 1 1 1 1 (1 ) (1 ) 2 (1 2 ) [ ] 2 2
12
(一) 矩估计法
统计学中,矩是指以期望值为基础而定 义的数字特征,如数学期望、方差、协方差等。 矩估计法是英国统计学家K.皮尔逊最早提 出来的,其理论基础是大数定理。 设X为随机变量,对任意的正整数k ,称E(Xk)、
E[(X-EX)] k分别为随机变量X的k 阶原点矩和k 阶中心矩。
由样本矩去估计总体矩的方法称为矩估计法; 由矩估计法得到的估计量称为矩估计量。
13
k E ( X ) 存在,则 由大数定律,若总体 k 阶原点矩
1 n k lim P X i E ( X k ) 0 n ,即样本的 n i 1
k 阶原点矩依概率收敛于总体
k k E ( X ) E ( X ) 知时,自然会想到用子样 k 阶 k 阶原点矩 ,所以当

第4章 统计推断 120

第4章   统计推断 120

H0
1 2
1 2 1 2
H1
1 2
1 2 1 2
医学统计学
12
三 、双尾检验与单尾检验


否定区 接受区


否定区
双尾 检验
接受区 否定 区
单尾 检验
二 、假设检验的步骤
2.确定检验水准 检验水准(size of a test)亦称显著 性根水据准选(定sig的ni显fic著an性ce水le平ve(l)0,.0符5或号0为.0α1。),决定接受 还它是是拒判绝别H差0. 异有无统计意义的概率水准,其大小 应根据分析的要求确定。通常取α= 0.05。
u值。
医学统计学
15
二 、假设检验的步骤
4.确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于
或及的样大前本于提(下间出或的小现差于观异)察由样现抽有本样统以误计及差更量所的极致概端的率情概。况即的率概在。率H0为。真
│t│≥ tα,υ ,则P≤ α;
可以认为差别不由抽样误差引起,可以拒绝H0
医学统计学
14
二 、假设检验的步骤
3.选定检验方法和计算统计量
的根选检据验择研方究法适设。计当如的完类的全型随统和机统计设计计推方中断,法的两目计样的本要算均求数H选的用0比不较同 可不成同用的t立检统验计的,检样可验本方能含法量,性较可大即得时到(概不n同>率1的00有统)计,可多量用,大Z如检t验值。和
假设检验的原理
反证法:当一件事情的发生只有两种可能A和B, 为了肯定其中的一种情况A,但又不能直接证实A, 这时否定另一种可能B,则间接的肯定了A。
小概率原理:概率很小的事件在一次抽样试验中

统计学 第四章 推断统计概述

统计学 第四章  推断统计概述

第四章 推断统计概述第一部分 概率论基本知识← 一、概率的定义;二、概率的性质;三、概率的加法定理和乘法定理← 四、概率分布类型四、概率分布类型← 概率分布(probability distribution )是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。

← 依不同的标准,对概率分布可作不同的分类。

1、离散型分布与连续型分布← 依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。

← 教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。

2、经验分布与理论分布← 依分布函数的来源,可将概率分布分为经验分布与理论分布。

← 经验分布(empirical distribution )是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。

← 理论分布(theoretical distribution )是按某种数学模型计算出的概率分布。

3、基本随机变量分布与抽样分布← 依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布(sampling distribution )。

← 基本随机变量分布是随机变量各种不同取值情况的概率分布,← 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。

第二部分 几种常见的概率分布← 一、二项分布← 二项分布(binomial distribution )是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。

← 2.二项分布函数← 二项分布是一种离散型随机变量的概率分布。

← 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X =0,1…,n )的概率分布,叫做二项分布函数。

← 二项展开式的通式(即二项分布函数):← ←← ← ←← 成功概率 p ;样本容量 n← 在成功概率为p 的总体中随机抽样,抽取样本容量为n 的样本中,有X 次为成()011111100q p C q p C q p C q p C q p n n n n n n n n n n n ++++=+---Λ()Xn X X n X q p C P -⋅⋅=()X n X q p X n X n -⋅-=!!!功的概率: ←(X =0,1…,n ) ←称X 服从参数为n ,p 的二项分布,记为: ←X ~B(n ,p ) 其中,0<p<1 ←二项分布的性质 ←二项分布有如下性质: ←①当p=q 时,图形是对称的。

第四章统计推断

第四章统计推断

第四章统计推断第四章统计推断⼀、单项选择题1.⽆偏估计是指()。

A、本统计量的值恰好等于待估的总体参数B、所有可能样本估计值的数学期望等于待估总体参数C、样本估计值围绕待估参数使其误差最⼩D、样本量扩⼤到和总体单元相等时与总体参数⼀致2.当样本容量⼀定时,置信区间的宽度()。

A、随着置信⽔平的增⼤⽽减⼩B、随着置信⽔平的增⼤⽽增⼤C、与置信⽔平的⼤⼩⽆关D、与置信⽔平的平⽅成反⽐3.95%的置信⽔平是指()。

A、总体参数落在置信区间内的概率为95%B、总体参数落在置信区间内的概率为5%C、总体参数落在⼀个特定的样本所构造的区间内的概率为5%D、在⽤同样⽅法构造的总体参数的多个区间中,包含总体参数的⽐率为5%4.从⼀个正态总体中随机抽取⼀个容量为n的样本,其均值和标准差分别为50和8。

当n=25 时,构造总体均值µ的95%置信区间为()。

A、50±3.14B、50±3.3C、50±0.63D、50±3.295、将由显著性⽔平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性⽔平的⼆分之⼀,这是()。

A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验6.在假设检验问题中,原假设为H0,给定显著性⽔平为α,则正确的是()。

A、P(接受H0|H0正确)=αB、P(拒绝H0|H0正确)=αC、P(接受H0|H0不正确)=1-αD、P(拒绝H0|H0不正确)=1-α7.下列说法正确的是()。

A、原假设正确的概率为αB、如果原假设被拒绝,就可以证明备择假设是正确的C、如果原假设未被拒绝,就可以证明原假设是正确的D、如果原假设未被拒绝,也不能证明原假设是正确的8.若检验的假设为H0:µ=µ0,H1:µ≠µ0,则拒绝域为()。

A、z>zαB、zC、z>zα/2或z<-zα/2D、z>zα或z<-zα9.若假设形式为H0:µ≥µ0,H1:µ<µ0,当随机抽取⼀个样本,其均值⼤于µ0,则__________()。

生物统计学第四版李春喜课后习题答案

生物统计学第四版李春喜课后习题答案

生物统计学第四版李春喜课后习题答案work Information Technology Company.2020YEARFor personal use only in study and research; not for commercial use2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。

24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。

【答案】1=20,s1=1.247,CV1=6.235%; 2=20,s2=3.400,CV2=17.0%。

2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;若侵犯了您的版权利益,敬请来信通知我们!℡课后答案网 ,s=0.866,CV=18.27%2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。

24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。

【答案】1=20,s1=1.247,CV1=6.235%; 2=20,s2=3.400,CV2=17.0%。

2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;若侵犯了您的版权利益,敬请来信通知我们!℡课后答案网 ,R=30,s1=7.078,CV1=16.58%; 2=52.1,R=30,s2=6.335,CV2=12.16%。

第四章统计推断

第四章统计推断

概率。从样本平均数的 抽样分布入手。
第三章里讲到:
x
~
N (x
,
2 x
),
其中 x
, x
n
所以,u x x x ~ N (0,1) x / n
在本题中, x 308, 300, 9.5, n 9,带入上式得到
从本题中样本观察到的 u 308 300 2.526 9.5 / 9
5 总结:假设检验的基本程序
(a)根据题意,书写零假设H0和备择假设HA (b)确定检验所需的统计量,如u统计量,t统计量等,并计 算其数值 (c)根据备择假设确定拒绝域 (d)如果统计量的值落在拒绝域内,则否定H0接受HA,如果 统计量的值落在拒绝域外,则不否定H0
第二节 样本平均数的假设检验
用来否定或接受零假设的小概率标准称为显著性水平,记 为α。在生物学研究中,常取α=0.05,称为显著;或α= 0.01,称为极显著。
在例一中, 0.05,因为尾区概率 P(| u | 2.562) 0.014 ,所以否定H0。
u (双侧) u /2 1.96
这一推断过程等同于将u 2.562同 0.05的
(三)假设检验的两类错误
(1)第一类错误:若客观上H0为真,我们 的结论却是“拒绝H0”,就会犯第一类错误。
犯第一类错误的概率恰好等于显著水平α。
(2)第二类错误:若客观上H0为假,而我 们的结论却是“不拒绝H0”,就会犯第二类
错误。第二类错误的概率用β表示。凡是有
利于做出“拒绝H0”的结论的措施,都能降
但是,在我们的实验中确实得到了现有的样本,这只能说明H0成立 的前提是错误的。因此,我们在显著性水平为0.05的情况下,否定 H0,而接受HA。所以这种药剂对玉米单穗重有显著的影响。

统计推断案例

统计推断案例

案例2 公司总经理的平均年收入 是否有效
公司总经理的报酬是多少?为了回答这 个问题,《商业周刊》(美)每年都要 对公司经理作一次调查。1994年这家杂 志调查了360家公司的经理,书上表4-2 是其中20家大公司总经理1993年的总收 入(薪金、各种费用、红利等等)。假 定这些数据代表了美国高收入公司经理 的一个样本。
(
),
即这些高收入公司总经理1993年平均收入的 95%置信区间为(5930.3,45999.1)千美元。
(3)由上述分析可知,该置信区间有效的条件 就是这些高收入公司总经理薪金近似服从正态 分布。
(4)因为这20位总经理样本并非随机抽取,所 以这个高收入置信区间,有可能右偏。
案例3 生产过程的运行状况是否令人满意
(4)当显著水平变大时,暗示着什么?这时,哪 种错误或误差将增大?
• 分析过程 1. 设计规格要求该生产过程的均值为12,
Quality Associates建议采用如下形式的 假设检验:
只要H0被拒绝,就应采取纠正措施。
• 2.计算每一样本的标准差。
• 从每一个样本的标准差来看,假设总体 标准差为0.21基本合理。
公司考虑多售机票以提高上座率,不知是否 可行。于是想了解如下3个问题: (1)预订78张机票,出现75人以上登机的概率 (2)每张机票价格200元,当出现75人以上登 机时,对未能登机者按票价加倍补偿,应否 多预售机票?
(3)预售机票多少张时,平均收益最大?
• 方法的确定
泊松分布适合于描述单位时间(或空间)内随 机事件发生的次数。根据所收集的信息,了解 数据的概率分布特征,用泊松分布进行近似分 析。
根据以上数据,我们要讨论下列几个问题:
(1)计算和s; (2)计算这些高收入公司总经理1993年平均收

第四章 统计推断-

第四章 统计推断-
差异显著时用u检验法进行检验
1、总体方差σ2已知,无论n是否大于30都可采用u检验法
例:某鱼场按常规方法所育鲢鱼一月龄的平均体长为7.25cm,
标准差为1.58cm,现采用一新方法进行育苗,一月龄时随机抽 取100尾进行测量,其平均体长为7.65cm, 问新育苗方法与常规方法有无显著差异?
分 析
(1)这是一个样本平均数的假设检验,因总体σ2已知 采用u检验; (2)新育苗方法的鱼苗体长≥ 或≤常规方法鱼苗体长, 应进行双尾检验。
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
H0:μ=μ0 =126(mg/L)
HA:μ ≠μ
0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。 而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
双尾 检验 分位数
u 0.05=1.96 u 0.01=2.58

否定区
接受区
否定区
接受区
否定区
单尾 检验 分位数
u 0.05=1.64 u 0.01=2.33
查表求正态离差时,单尾概率等于双 尾概率乘以2
四 、两类错误
第一类错误(type I error),H0正确,假设检验却 否定了它,又称弃真错误或 错误; 第二类错误( type II error ) , H0错误,假设检 验却接受了它,又称纳伪错误或 错误
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。 统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验 也常取=0.05和=0.01两个显著水平 。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


(二)假设检验的基本思想
根据抽样分布的规律,判断样本发生的概率 例4-1中就是看在2.00


0.20公斤/只的鸭子总体
中抽取100只鸭子,鸭子平均重量小于1.88公斤/
只得概率,如果概率小于α ,说明是小概率事件, 鸭子明显偏轻。
8


(三)假设检验的过程:
1、提出原假设和备择假设 2、确定适当的检验统计量 3、规定显著性水平 4、计算检验统计量的值 5、作出统计决策
0

显著水平:α =0.05
计算统计量: u x μ 0 1.88 2.00 0.12 6
σ n 0.2 100 0.02


建立拒绝域:u<-U0.05; -U0.05=-1.645 ;
结论:养鸭户送来的鸭子重量非常明显的小于2.00公斤/只, 16 不符合要求
右 尾 测 验
_
μ0
y
20

双尾检验与单尾检验的选择:应根据专业知识在
试验设计时就确定。

一般若事先不知道所比较的两个处理效果谁好谁
坏,分析的目的在于推断两个处理之间有无显著
差异,则选用双尾检验;

若根据理知识或实践经验判断甲处理的效果不会
比乙处理的效果差,分析的目的在于推断甲处理
是否真的比乙处理好,这时应用单尾检验。
关于假设检验的几个注意点

1. 对于H0只能说拒绝与不拒绝,而对H1只能说接受。
2. P≤α,则拒绝H0,接受H1,差异有统计学意义,(有足够的证据) 可认为„„不同或不等。

3. P>α,则不拒绝H0,差异无统计学意义(“阴性”结果),尚不能
认为„„不同或不等(或拒绝H0的证据尚不足)

4. 做 统 计 检 验 结 论 时 只 能 说 有 无 统 计 学 意 义 ( statistical significance),而不能说明专业上的差异大小。P值越小只能说明: 作出拒绝H0,接受H1的统计学证据越充分,推论时犯错误的机会越小, 与专业上|μ-μ0|差异的大小无直接关系。


关于备择假设的说明:由于改善栽培条件,只会 使籽粒重量提高,不会使籽粒重量降低,因此备择假设HA 为μ>μ0 。
34

3 显著性水平:根据实验要求(籽粒重量是否有“显著” 提高)规定α=0.05。
4 统计量的值:由于s 已知可使用u 检验,



u=(x-μ0 )/(s/√n)代入数值,得:

三、变异性的显著性检验――2 检验(2- test)
29
一、在 s 已知的情况下,单个平均数的显著性 检验—— u 检验(u- test)
已知的总体平均数一般 为一些公认的理论数值 。如畜禽正常 的生理指标、怀孕期、 生产性能指标等,都可 以样本平均数 与之比较,检验差异显 著性。

检验的基本程序如下: 1. 假设从s已知的正态总体,或近似正态总体中, 随机抽取含量为的 n 样本。

如果实验中难以控制的因素很多,试验精度不是很高,
则显著性水平α的值可稍大点;

如果实验的精度很高,真实差异不容易被误差所掩盖, 处理的作用容易被检验出来,这时显著性水平α可适当 取小些。

无论如何,显著性水平α的值必须在实验开始前就已经 确定下来。
14

(四) 计算检验统计量的值,建立拒绝域
u yμ 0 1.88 2.00 0.12 6 σ 0.2 0.02 100 n

5.应事先确定α 。选α =0.05只是一种习惯,而不是绝对的标准。
17
三、双尾检验与单尾检验

(一)假设的形式(以方差已知,单个样本的平均 数显著性检验为例)
拒绝区域是检验统计量取值的小概率区域,我们可以将这个小概率区 域安排在检验统计量分布的两端,也可以安排在分布的一侧,分别称 作双尾检验(two-tailed test)与单尾检验(one-tailed test)。
33

例4-2 已知豌豆籽粒重量( 克/100) 服从正态分布N (37.72,0.332)。在改善栽培条件后,随机抽取 9 粒, 其重量平均数 Y=37.92,若标准差仍为0.33,问改善条 栽培件是否显著提高了豌豆籽粒重量?
解 根据检验的基本程序: 1 已知豌豆的重量是服从正态分布的随机变量,s已知。 2 假设: H0:μ=μ0 =37.72 HA:μ>μ0 =37.72

11


(二)确定适当的检验统计量
大样本还是小样本? 总体方差已知还是未知?

选择正确的检验统计量,计算结果
12



(三)规定显著性水平α
1、小概率事件原理
(1)小概率事件:统计学上指在一次试验中,一个几乎不可能发生的事 件发生的概率,称为小概率事件实际不可能原理。

(2)在一次试验中小概率事件一旦发生,原假设就是错误的。 2、小概率值α的概念及统计学意义: α表示原假设为真时,拒绝原假设
犯错误的概率,被称为抽样分布的拒绝域,1-α称为置信水平,表示接
受原假设的可信度或可靠程度,被称为抽样分布的接受域。

3、α值大小的确定:常用的α=0.01、0.05由研究者事先确定。当α取
0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为
95%。
13

注意:假设检验选用的显著性水平应根据实验的要求而 定。
第四章 统计推断
1
学习要求:

掌握:样本平均数和频率的u检验及t检验的
方法和适用范围;区间估计的原理和方法。

熟悉:不同条件下使用的统计量,方差的同 质性检验方法。

了解:假设检验的原理和方法。
2
讲授内容

第一节 假设检验的原理和方法 第二节 单个样本的统计假设检验 第三节 两个样本差异显著性检验
30

2. 零假设
H0:m=m0。


备择假设可有以下三种情况:
(1)HA:μ>μ0 ,若已知μ不可能小于μ0 。 (2)HA:μ<μ0 ,若已知μ不可能大于μ0 。 (3)HA:μ≠μ0 ,包括μ>μ0 和μ<μ0
( 2)
(1)
u
u
(3)
u / 2
u /0称为“差异显著”。
9




假设检验在统计方法中的地位
统计方法
描述统计 推断统计 假设检验 参数估计
10
二、假设检验的步骤

( 一 ) 对 试 验 样 本 所 在 的 总 体 提 出 原 假 设 ( null hypothesis)和备择假设(alternative hypothesis ):

H0:μ=2.00公斤/只, 即送来的鸭子符合要求。 H1 :μ≠μ0(或μ>2.00公斤/只或μ<2.00公斤/只)即送来的鸭子不符 合要求,偏轻
第四节 参数的区间估计与点估计
3

指根据于某种实际需要,对未知的或不完全 知道的统计总体提出一些假设;然后由样本的
假设检验


(显著性检验) 实际结果,经过一定的计算,作出在概率意义
上应当接受哪种假设的测验。


参数估计
参数估计是指由样本结果对总体参数作出点估 计 (point estimate) 或 者 区 间 估 计 (interval estimate)。
在=0.01水平上,拒绝H0称为“差异极其显著”。

4. 检验的统计量:
u
x m0
s
n
32


5. 相应于2 中个备择假设的H0的拒绝域分别为:
(1)u>u (2)u<-u (3)│u│>u /2 ,或表示为│u│>u (双侧) 正态分布的分位数,可以从附表中查出。 6. 根据以上所做的分析,得出结论,并给予生物学解释。
u=1.82 5 建立H0的拒绝域:因HA:μ>μ0 ,故为单侧检验,当 u>u0.05时拒绝H0。α=0.05时u0.05=1.645。 6 结论:因为u>u0.05 ,所以结论是拒绝H0,接受HA。

上述样本很可能不是抽自N(37.72,0.332)的总体,抽 出样本的那个总体的平均数是大于37.72的某个值,即栽 培条件的改善显著地提高了豌豆籽粒重量。
型错误就会增大;反之II型错误减小,I型错误就会增大。比 如,将显著性水平α从0.05提高到0.01,就更容易接受H0, 因此犯I型错误的概率就减小,但相应地增加了犯II型错误的 28 概率。
第二节 单个样本的统计假设检验

一、σ已知时单个平均数的显著性检验—— u 检验 (u- test)

二、 s 未知时平均数的显著性检验――t 检验(t test)
35
二、s 未知时平均数的显著性检验――t 检验 (t -test)

在s 未知时,平均数的显著性检验有两种解决方法。
21

单尾检验比双尾检验的辨别力强,灵敏度高
(同一显著性水平,双尾检验的分位数大于 单尾检验的分位数),但若无判断的依据, 不可随意将双尾检验改为单尾检验。

作单尾检验,查附表2或3时,需要将双尾概 率乘以2再进行查表
22
四、统计假设的两类错误

统计假设测验是根据一定的概率标准对总体特征作出
推断。否定了H0,并不等于已证明H0不真实;接受了H0, 也不等于已证明H0是真实的。
24
假设检验结果 客观实际
H0正确 H0不正确 否定H0 接受H0
I型错误(α) 推断正确(1-β )
推断正确(1-α) II型错误(β )
相关文档
最新文档