第四章统计推断
统计推断1
小概率事件在一次观察中是不应发生的, 但是它现在发生了!!说明了什么? 一个合理的解释就是它本不是“小概率事件”, 是人们把概率算错了,算错的原因就是在 一开始就做了一个错误的假设 米
换句话说,此时应该认为: 即年来男孩的身高有明显增长。
【例2 】某地进行了两个水稻品种对比试验, 在相同条件下,两个水稻品种分别种植10个 小区,获得两个水稻品种的平均产量(kg/亩) 为:
第四章 统计推断
第一节 统计推断概述
研究样本的目的是以各种样本统计量的 抽样分布为基础去推断总体。 如何从一些包含有随机误差,又不完全的信息 中得出科学的、尽可能正确的结论是统计学 要解决的主要问题。
从样本中获得的信息所包含的不确定性,
主要来自以下几个方面:
(1)测量过程引入的随机误差;
(2)取样随机性所带来的变化,由于只取出 少数样品测量,那么取出的这一批样品的测量 结果与抽取另外一批当然会有差别; (3)我们所关心的性质确实发生了某种变化。 显然,只有第三种变化才是我们要检测的。
对于从有误差的实验数据中得出结论的科学工作者
来说,统计学是一种不可或缺的工具。
一、 统计推断的途径
1、 统计假设检验** 2、总体参量估计。
二、假设检验的基本思想 先看两个实例 【例1】 某地区10年前普查时,13岁男孩子的 平均身高是1.51米,现抽查200个12.5~13.5岁 的男孩子,身高平均值为1.53米,标准差为 0.073米,问:10年来该地区男孩身高是否有 明显增长?
3、选择显著性水平与建立拒绝域 (2)建立拒绝域
① 分位数法(临界值法) ② 概率法(P值法) 利用显著性水平(概率值)构成接受域和拒绝域。 根据统计量数值的大小,先计算(或查表)出 (X>统计量数值)出现的概率,这个概率称为P值, 用P值与显著性水平相比较进行判断。
生物统计学习题集答案
.. 生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为 连续 变量和 非连续 变量。
2 样本统计数是总体 参数 的估计量。
3 生物统计学是研究生命过程中以样本来推断 总体 的一门学科。
4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5 统计学的发展过程经历了 古典记录统计学、 近代描述统计学现代推断统计学 3个阶段。
6 生物学研究中,一般将样本容量 n大于等于 30称为大样本。
7 试验误差可以分为__随机误差 、系统误差 两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
(-)2 资料的精确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。
总体:具有相同的个体所构成的集合称为总体。
连续变量:是指在变量范围内可抽出某一范围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章 试验资料的整理与特征数的计算一、填空1 1 资料按生物的性状特征可分为资料按生物的性状特征可分为资料按生物的性状特征可分为_________数量性状资料数量性状资料数量性状资料__变量和变量和______变量性变量性状资料状资料__变量。
2 2 直方图适合于表示直方图适合于表示直方图适合于表示______计量计量计量 、、 连续变量连续变量__资料的次数分布。
3 3 变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即__集中性集中性__和____离散性离散性离散性__。
4 4 反映变量集中性的特征数是反映变量集中性的特征数是反映变量集中性的特征数是______平均数平均数平均数______,反映变量离散性的特征,反映变量离散性的特征数是数是______变异数(标准差)变异数(标准差)变异数(标准差)__。
第4章 统计推断
第一节 假设检验的方法 第二节 单个样本平均数假设测验 第三节 两个样本平均数假设测验 第四节 参数的区间估计
学习目的
理解假设检验与区间估计的原理
掌握假设检验的步骤 对实际问题进行统计测验及总体参数估 计
第一节 假设检验的方法
统 计 推 断 的 概 念
总体
抽样分布
样本1
表2 两种栽培方法的地瓜产量 单位(kg/亩)
有机
2722.2
2866.7
2675.9
2169.2
2253.9
2315.1
标准
951.4
1417
1275.3
2228.5
2462.6
2715.4
(一) 成组数据的平均数比较
1. u检验
两个样本总体方差已知,或总体方差未知, 但为大样本时采用 例1 已知早稻佳辐品种σ2=1.35,用A、B两种方 法取样,A取15个样点,平均产量x1=7.69;B法取9 个样点,平均产量x2=8.77。检验两种取样法测得
t = d sd
[例4-7] 选生长期、发育
进度、植株大小和其他方
面皆比较一致的两块地的 红心地瓜苗配成一对,共 有6对。每对中一块地按 标准化栽培,另一块地进
表 两种栽培方法的地瓜产量 单位(kg/亩)
有机 2722.2 2866.7 2675.9 2169.2 2253.9 2315.1
标准 951.4 1417 1275.3 2228.5 2462.6 2715.4
两尾测验与一尾测验
假设 双尾测验 左尾测验 右尾测验
H0 HA
μ=μ0 μ≠μ0
μ≥μ0 μ<μ0
μ≤μ0 μ>μ0
最新生物统计学课后习题解答-李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
统计学第四章 统计推断1
求解似然方程
ˆ
1 1 7 i1 xi x 4
27
7
27
【例】总体均匀分布 X ∼ U(a,b),其中,a,b 是未知参数。设 X1,..., X n 为来自该总体的随机样本, x1 ,..., xn 为样本观察值,求未知参 数 a,b 的极大似然估计
1 x [a, b] b a f (x, a, b) 解:总体服从均匀分布,即 0 x [a, b]
ˆ X,
n n 1 1 ˆ 2 X i2 X 2 ( X i X ) 2 . n i 1 n i 1
16
16
例总体X的概分布为
X
1
1
2
„
1 „
θ
1
试求未知参数θ的估计量。
pi
E ( X ) 1
1 1 1 1 1 (1 ) (1 ) 2 (1 2 ) [ ] 2 2
12
(一) 矩估计法
统计学中,矩是指以期望值为基础而定 义的数字特征,如数学期望、方差、协方差等。 矩估计法是英国统计学家K.皮尔逊最早提 出来的,其理论基础是大数定理。 设X为随机变量,对任意的正整数k ,称E(Xk)、
E[(X-EX)] k分别为随机变量X的k 阶原点矩和k 阶中心矩。
由样本矩去估计总体矩的方法称为矩估计法; 由矩估计法得到的估计量称为矩估计量。
13
k E ( X ) 存在,则 由大数定律,若总体 k 阶原点矩
1 n k lim P X i E ( X k ) 0 n ,即样本的 n i 1
k 阶原点矩依概率收敛于总体
k k E ( X ) E ( X ) 知时,自然会想到用子样 k 阶 k 阶原点矩 ,所以当
统计推断(StatisticalInference)第二版课后习题答案(下)
统计推断第二版课后习题答案(下)第一章估计与检验的基本概念习题1a.样本均值的估计是样本观测值的算术平均数。
b.估计量的偏差是指样本估计值与总体参数值之间的差异。
c.偏差的绝对估计误差是指估计量与总体参数的差异的绝对值。
习题2a.确定估计量的抽样分布的方法有:–数理统计方法–模拟方法b.方差是指估计量在多次抽样中估计误差的离散程度。
c.中位数是指有50%的估计值小于该值,50%的估计值大于该值。
习题3a.均方根误差衡量了估计方法的总体误差。
b.样本均值的均方误差是样本均值与总体均值之间的差异的平方。
c.均方误差是样本估计量的方差和偏差之和。
习题4a.一个无偏估计的特点是其期望值等于被估计参数的真实值。
b.偏差是指估计量从真实参数值偏离的程度。
c.便宜的估计方法在不同样本下估计值的平均值与总体参数的差异接近于零。
习题5a.置信区间是指总体参数一个区间估计的结果。
b.置信水平是指置信区间的覆盖总体参数的概率。
c.通过增加置信水平,置信区间的宽度将增加。
第二章单样本推断习题1a.在单样本问题中,当总体的分布未知且样本容量较小时,通常使用t分布。
b.当总体的分布未知且样本容量较大时,通常使用标准正态分布。
c.当总体的分布已知时,可以根据总体分布选择相应的抽样分布。
习题2a.在单样本问题中,使用z统计量时,需要知道总体的标准差。
b.当总体的标准差未知且样本容量较小时,通常使用t统计量。
c.t统计量的分布在自由度较大时趋向于标准正态分布。
习题3a.当总体的分布为正态分布时,使用样本均值的标准差作为总体标准差的估计。
b.对于非正态分布的总体,使用样本的中位数可以作为总体位置参数的估计。
c.样本观测值的众数可以作为总体分布的估计。
习题4a.在单样本问题中,使用z统计量时可以构造置信区间。
b.置信水平是指在多次抽样中,置信区间覆盖总体参数的概率。
c.置信区间的宽度与样本容量无关。
a.当总体的分布未知且样本容量较小时,假设检验通常使用t检验。
统计学 第四章 推断统计概述
第四章 推断统计概述第一部分 概率论基本知识← 一、概率的定义;二、概率的性质;三、概率的加法定理和乘法定理← 四、概率分布类型四、概率分布类型← 概率分布(probability distribution )是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。
← 依不同的标准,对概率分布可作不同的分类。
1、离散型分布与连续型分布← 依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。
← 教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。
2、经验分布与理论分布← 依分布函数的来源,可将概率分布分为经验分布与理论分布。
← 经验分布(empirical distribution )是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。
← 理论分布(theoretical distribution )是按某种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布← 依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布(sampling distribution )。
← 基本随机变量分布是随机变量各种不同取值情况的概率分布,← 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。
第二部分 几种常见的概率分布← 一、二项分布← 二项分布(binomial distribution )是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。
← 2.二项分布函数← 二项分布是一种离散型随机变量的概率分布。
← 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X =0,1…,n )的概率分布,叫做二项分布函数。
← 二项展开式的通式(即二项分布函数):← ←← ← ←← 成功概率 p ;样本容量 n← 在成功概率为p 的总体中随机抽样,抽取样本容量为n 的样本中,有X 次为成()011111100q p C q p C q p C q p C q p n n n n n n n n n n n ++++=+---Λ()Xn X X n X q p C P -⋅⋅=()X n X q p X n X n -⋅-=!!!功的概率: ←(X =0,1…,n ) ←称X 服从参数为n ,p 的二项分布,记为: ←X ~B(n ,p ) 其中,0<p<1 ←二项分布的性质 ←二项分布有如下性质: ←①当p=q 时,图形是对称的。
第四章 第一次课(2+1) 假设检验的原理
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者 来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数和治疗 前的平均数来自不同总体,即克矽平有疗效。
2 、 确定显著水平 能否定H0的人为规定的概率标准称为显著水平,记作。 统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以 在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平 。 3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选择使用不同的检验方法。 例
确定
水准
计算统计量
确定P值并与给定的
比较
做出推断结论。 假设检验的基本逻辑是“小概率事件在一次抽样 中不太可能出现”。 假设检验有两类错误。 假设检验与相应的置信区间估计既能提供等价的 结果,又有各自不同的功能。 假设检验方法很多,每种方法有相应的适用条件。 综合考虑研究目的、设计类型、变量类型、样本 含量等要素之后才能选择合适的假设检验方法。 三、课后练习 1假设检验的理论依据是什么? 2假设检验的两类错误的区别与联系是什么? 3t检验的应用条件是什么? 4假设检验中P值的意义是什么? 5如何确定检验水准? 6如何恰当地应用单侧与双侧检验?
=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数
=9.2头,标准差S2=1.549头。能否仅凭这两个平均数的差值
-
=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论 呢?统计学认为,这样得出的结论是不可靠的。这是因为如果我们再分 别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个 样本资料。由于抽样误差的随机性,两样本平均数就不一定是11头和 9.2头,其差值也不一定是1.8头。造成这种差异可能有两种原因,一是 品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验 误差(或抽样误差)。对两个样本进行比较时,必须判断样本间差异是 抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎
第四章统计推断
第四章统计推断第四章统计推断⼀、单项选择题1.⽆偏估计是指()。
A、本统计量的值恰好等于待估的总体参数B、所有可能样本估计值的数学期望等于待估总体参数C、样本估计值围绕待估参数使其误差最⼩D、样本量扩⼤到和总体单元相等时与总体参数⼀致2.当样本容量⼀定时,置信区间的宽度()。
A、随着置信⽔平的增⼤⽽减⼩B、随着置信⽔平的增⼤⽽增⼤C、与置信⽔平的⼤⼩⽆关D、与置信⽔平的平⽅成反⽐3.95%的置信⽔平是指()。
A、总体参数落在置信区间内的概率为95%B、总体参数落在置信区间内的概率为5%C、总体参数落在⼀个特定的样本所构造的区间内的概率为5%D、在⽤同样⽅法构造的总体参数的多个区间中,包含总体参数的⽐率为5%4.从⼀个正态总体中随机抽取⼀个容量为n的样本,其均值和标准差分别为50和8。
当n=25 时,构造总体均值µ的95%置信区间为()。
A、50±3.14B、50±3.3C、50±0.63D、50±3.295、将由显著性⽔平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性⽔平的⼆分之⼀,这是()。
A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验6.在假设检验问题中,原假设为H0,给定显著性⽔平为α,则正确的是()。
A、P(接受H0|H0正确)=αB、P(拒绝H0|H0正确)=αC、P(接受H0|H0不正确)=1-αD、P(拒绝H0|H0不正确)=1-α7.下列说法正确的是()。
A、原假设正确的概率为αB、如果原假设被拒绝,就可以证明备择假设是正确的C、如果原假设未被拒绝,就可以证明原假设是正确的D、如果原假设未被拒绝,也不能证明原假设是正确的8.若检验的假设为H0:µ=µ0,H1:µ≠µ0,则拒绝域为()。
A、z>zαB、zC、z>zα/2或z<-zα/2D、z>zα或z<-zα9.若假设形式为H0:µ≥µ0,H1:µ<µ0,当随机抽取⼀个样本,其均值⼤于µ0,则__________()。
第四章统计推断
概率。从样本平均数的 抽样分布入手。
第三章里讲到:
x
~
N (x
,
2 x
),
其中 x
, x
n
所以,u x x x ~ N (0,1) x / n
在本题中, x 308, 300, 9.5, n 9,带入上式得到
从本题中样本观察到的 u 308 300 2.526 9.5 / 9
5 总结:假设检验的基本程序
(a)根据题意,书写零假设H0和备择假设HA (b)确定检验所需的统计量,如u统计量,t统计量等,并计 算其数值 (c)根据备择假设确定拒绝域 (d)如果统计量的值落在拒绝域内,则否定H0接受HA,如果 统计量的值落在拒绝域外,则不否定H0
第二节 样本平均数的假设检验
用来否定或接受零假设的小概率标准称为显著性水平,记 为α。在生物学研究中,常取α=0.05,称为显著;或α= 0.01,称为极显著。
在例一中, 0.05,因为尾区概率 P(| u | 2.562) 0.014 ,所以否定H0。
u (双侧) u /2 1.96
这一推断过程等同于将u 2.562同 0.05的
(三)假设检验的两类错误
(1)第一类错误:若客观上H0为真,我们 的结论却是“拒绝H0”,就会犯第一类错误。
犯第一类错误的概率恰好等于显著水平α。
(2)第二类错误:若客观上H0为假,而我 们的结论却是“不拒绝H0”,就会犯第二类
错误。第二类错误的概率用β表示。凡是有
利于做出“拒绝H0”的结论的措施,都能降
但是,在我们的实验中确实得到了现有的样本,这只能说明H0成立 的前提是错误的。因此,我们在显著性水平为0.05的情况下,否定 H0,而接受HA。所以这种药剂对玉米单穗重有显著的影响。
第四章 统计推断
第四章统计推断(statistical inference)第四章统计推断统计推断由一个样本或一糸列样本所得的结果来推断总体的特征假设检验参数估计任务分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断第四章第一节第二节第三节第四节第五节假设检验的原理与方法样本平均数的假设检验样本频率的假设检验参数的区间估计与点估计方差的同质性检验第一节假设检验一概念:假设检验(hypothesis test)又称显著性检验(significance test),就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。
小概率原理概率很小的事件在一次抽样试验中实际是几乎不可能发生的。
如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α 为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。
=0.05/0.01假设检验参数检验非参数检验平均数的检验频率的检验方差的检验秩和检验符号检验游程检验秩相关检验二、假设检验的步骤治疗前μ0=126σ2 =240N ( 126,240 )治疗后n =6 x =136 μ未知那么μ=μ0? 即克矽平对治疗矽肺是否有效?例:设矽肺病患者的血红蛋白含量具平均数μ0=126(mg/L),σ 2 =240(mg/L)2的正态分布。
现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
1 、提出假设对立无效假设/零假设/检验假设备择假设/对应假设μ0=μμ0≠μ误差效应处理效应H0H A例:克矽平治疗矽肺病是否能提高血红蛋白含量?平均数的假设检验检验治疗后的总体平均数μ是否还是治疗前的126(mg/L)?x-μ0=136-126=10(mg/L)这一差数是由于治疗造成的,还是抽样误差所致。
第四章-多元正态分布的统计推断
y)2
( y k ni
i1 j1
ij
yi )2
( y k ni
i1 j1
ij
y)2
k 1 nk n 1
SS A k 1 SSe nk
—
SSA SSe k 1 n k
—
—
NEXT
查F分布表得临界值
F0.05(2,18) 3.554 F0.01(2,18) 6.013
a1 i1
a1 i1
由于交叉乘积项为零,故
组间叉积矩阵+组内叉积矩阵=总叉积矩阵
组内叉积矩阵:主要由随机因素构成
k na
SSE
(xi(a) x (a) )(xi(a) x (a) )
a1 i1
组间叉积矩阵:主要由系统因素构成
k
SS (TR) na (x (a) x )(x (a) x ) a1
故可以将霍特林分布的统计量换算成F统计量。
对给定的显著性水平α,检验的规则
nk k(n 1)
T
2
F
(k , n
k ), 拒绝原假设
nk k(n 1)
T
2
F
(k , n
k ), 接受原假设。
某地区农村男婴的体格测量数据如下
编号 1
身高(cm) 78
胸围(cm) 60.6
上半臂长(cm) 16.5
i j (i j,i, j 1,2, , k)
因而还应该进一步讨论到底是哪些总体之间存在差异。
Scheffe检验
H0 : i j (i j,i, j 1,2, , k) H1 : i j (某些i j)
第四章 统计推断
第四章统计推断第四章统计推断第五章统计推断一、填空题5.1.1设置样本x1、X2、,?,Xn来自n(M采用的检验数量为1.69),那么对于检验H0:M=35,z=x-35。
1.3n5。
1.2组x1,X2,?,Xn是来自总体x的样本,设e(x)=m,D(x)=S2,然后2总体均值m的无偏估计为x(样本均值);总体方差s的无偏估计为s(样本方差)5.1.3如果测试统计量的观察值落在拒绝域内,则应拒绝H0。
21n25.1.4设x=?xi为来自正态总体n(m,s)的样本均值,m未知,欲检验Ni=1h0:S=s220,测试统计为(n-1)s2s20。
2已知S12=S25 1.5两个正常群体(H0:m)平均值的假设检验,检验量为1=M2(t=X-Y),排斥域为t>ta(N1+n2-2)。
11sp+n1n25.1.6若其他条件不变,置信度越高,则置信区间的长度越长。
二、单选题(从每个子题的三个备选答案中选择一个正确答案,并在题干后的括号中填写其字母)5.2.1对总体参数进行抽样估计的首要前提是必须(b)a、提前对人口进行初步分析。
B.根据随机原则取样c.保证调查数据的准确性、及时性5.2.2如果其他条件相同,在以下测试的P值中,拒绝原始假设的最充分理由是(a)a.2%b.10%c.25%5.2.3一所学校有8000名学生,然后随机抽取100名学生。
其中20人对学生管理有意见校学生中对学校后勤管理有意见的人数的点估计值为(c)a、 20%b.20c.16005.2.4如果总体服从正态分布,但总体均值和方差未知,样本量为n,则用于构造总体方差置信区间的随机变量的分布是(c)a、 n(0,1)b.n(m,s2)c.c2(n-1)5.2.5其他条件相同时,要使抽样误差减少1/4,样本量必须增加(c)a、 1/4B。
4x c.7/95.2.6影响区间估计质量的因素不包括(b)a、置信度B.总体参数C.样本量5.2.7某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品在确定必要的抽样数时,P应选择(a)a.85%b.87%c.90%5.2.8设置X~n(m,s)力矩(a)A.估22则未知参数s的(x1,x2,?,xn)是x的一个简单随机样本,),米22量为1.n(xi-x)b。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 统计推断的意义与原理
一、统计推断的意义和内容 统计推断,就是根据统计量的分布和概率理论,由样本
统计量来推断总体的参数。 统计推断包括统计假设检验和参数估计两部分内容。
第四章统计推断
统计假设检验又称显著性检验,它是根据某种实际需 要,对未知的或不完全知道的总体参数提出一些假设,然 后根据样本的实际结果和统计量的分布规律,通过一定的 计算,作出在一定概率意义下应当接受哪种假设的方法。 显著性检验的方法很多 ,常用的有t检验、F检验和2检验 等。尽管这些检验方法的用途及使用条件不同,但其检验 的基本原理是相同的。
第四章统计推断
这是否意味着注射与不注射催产素两种不同的处理, 老鼠体内血糖含量一定存在有显著差异,即两相应总体血
糖含量不等( 1 ≠ 2)呢?
由于抽样的原因,两样本平均数之差( x1 x2 ), 即表面效应,或实得差异中一定包含有抽样误差造成的部 分,同时也可能包含有由于处理不同造成的总体平均数不 等的部分,到底后者存在与否,需要进行统计分析。
第四章统计推断
在H0成立的前提下,根据统计量的分布,计算实得 差异(表面效应)由抽样误差造成的概率大于0.05,则实 得差异(表面效应)由抽样误差造成的可能性较大,没有 理由认为实得差异(表面效应)由两总体平均值不同而造 成,检验的结果应当接受H0,两个总体平均值“差异不显 著”;如果实得差异(表面效应)由抽样误差造成的概率 在0.01~0.05之间,表示两个总体平均值“差异显著”, 应否定H0,接受HA;如果其概率值小于0.01,同样否定 H0,接受HA,表示两总体间存在“极显著差异”。
计算表面效应由误差造成的概率首先必须假设表面效 应是由误差造成,也就是假设两样本所属总体无差异。
抽样误差出现的概率可利用前面所介绍的抽样分布来 计算,这里只要设定一概率标准,例如,表面效应由误差 造成的概率不大于5%便可推断表面效应不大可能由误差 所引起
第四章统计推断
统计假设检验的基本原理:
是根据试验目的对要比较的总体提出假设, 先承认待检验的假设成立,然后观察在此假设前 提下样本的出现是否属于小概率事件,如果是小 概率事件,则有充分的理由怀疑或否定原假设, 反之则不能否定原假设。
参数估计包括两个方面,一是参数的点估计,二是参 数的区间估计。
二、统计量的抽样分布与统计推断的关系
第四章统计推断
总体 (N)
总体特征(参数)一般未知
随机抽样 样本容量n
样本1 样本2 样本3
样本N n
统计推断
假设检验 (定性)
参数估计(定量)
样本特征(统计量)可知
图1 随机抽样和统计推断示意图
第四章统计推断
和原假设提供的信息,可以构造统计量:U X ;由于原总体服从正 n
态分布,这个统计量服从标准正态分布N 0,1
第四章统计推断
在总体平均数为2250g(在H0成立下),方差为62500g2 的正态总体中以样本容量为25进行抽样,抽得的一个样本 平均数与总体平均数相差125g以上,由抽样误差造成的概 率为0.0124。
第四章统计推断
统计上,把否定H0的概率标准叫显著水平。用 表示,
是个小概率,在生物学研究中,一般取0.05和0.01两个等级。
假设检验的步骤可概括为: (1)对样本所属总体提出无效假设H0,并设立备择假设HA;
本例,无效假设H0为:0 2250 ,即用中药饲养的25
羽雏鸡组成的样本所属的总体平均值与指定的正常饲养情况 下的总体平均值之间无实质差异。
备择假设HA为: 0 2250,即用中药作添加剂和不
用中药作添加剂,该肉鸡种50d体重的确存在着显著差异。
第四章统计推断
(2)在假定H0成立的前提下,根据统计量的抽样分布,计 算实得差异由抽样误差造成的概率。(构造合适的统计量)
对于本例来说,在H0成立的条件下,X与相差越远,X 就越大,
X 发生的可能性就越小,说明抽样误差造成的概率就越小,计算 X 偏离
程度大小用P X 0 Xi 0 表示。因此计算实得差异由抽样误差
造成的概率其实质就是计算抽样误差大于125的概率。因为X 0 125
与X 0 125均表示抽样误差大于125,所以P X 0 125 就是本步 骤所要计算的概率值。怎么求P X 0 125 ?利用已知的总体方差 2
第四章统计推断
(3)根据小概率事件实际不可能性原理判断是否接 受H0
本例,在假定H0成立的前提下,经计算一个样本平 均数与总体平均数相差125以上,这一事件由抽样误差造 成的概率为0.0124,小于0.05,所以是一个小概率事件, 根据小概率事件实际不可能性原理,可以获得如下结论:
在H0成立的前提下饲喂含中药添加剂的一个样本, 其平均值与没有饲喂中药添加剂的总体平均值相差125g以 上不是由抽样误差所造成,的确是由饲喂中药添加剂所造 成的。因此可以否定H0,接受HA。
假设检验的基本步骤为:
第四章统计推断
(1)根据实际需要对未知或不完全知道的总体提出假设 无效假设H0:对需推知的总体参数提出的假设。(被直
接检验的假设称为原假设) 备择假设HA:在拒绝无效假设后可供选择的假设。
H0和HA是一对立事件,且构成完全事件系,即否定H0 就 意味着接受HA,接受H0 就意味着否定HA。
三、假设检验 1.假设检验的基本原理
我们结合一个实例说明统计假设检验的基本原理。 例如:将20只老鼠随机分为数目相等的两组,一组作对照 不注射催产素,另一组注射,然后在规定的时间内测定每 组各个体的血糖值。 假定测定的结果对照组平均值为:=109.17,
注射催产素组为:=106.88, 两样本平均数并不相等,其差值(表面效应)为: =109.17-106.88=2.29,
第四章统计推断
2.统计假设检验基本步骤
例: 设某一肉用仔鸡常规饲养条件下50d体重的总
体平均值为: 0 =2250g,方差为: 2 =62500
g 2。从该群体中随机选择25羽初生雏鸡,在常规饲 养基础上添加某种中药添加剂饲养50d,测得该样本 平均值为: x =2375g,问添加中药添加剂是否对仔 鸡50d体重有影响?