生物统计学第四章 抽样分布

合集下载

生物统计学第四章抽样分布

生物统计学第四章抽样分布

t (n1 n2 2)
( y1 y2) (1 2 )
(n1 1)s12 (n2 1)s22 ( 1 1 ) (n1 1) (n2 1) n1 n2
• 每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个 新总体。由于每次随机抽样所得的平均数可能会 存在差异,所以由平均数构成的新总体也应该有 其分布,这种分布称为平均数的抽样分布。
9
• 下面用一个抽样实验进一步说明样本平均数的抽 样分布及其分布的参数。
• 假定用一个很小的总体N=3,其观察值为2、4、6 以样本容量n=2从中进行抽样。
生物统计学
1
第四章抽样分布
2
抽样分布
• 研究总体与从中抽取的样本之间的关系是 统计学的中心内容。
• 生物统计学的最基本问题是研究总体和样本 间的关系。
• 总体类型: (1)实际研究对象所构成的总体 (2)数字的总体
3
抽样分布
• 对这种关系(总体与样本)的研究可从两方面着 手: 一是从总体到样本,这就是研究抽样分布的问题; 二是从样本到总体,这就是统计推断问题。
15
标准差未知
时的平均数
分布
未知时,可以用样本标准差代替总体标准差, 标准差变量为
u
y
s
n 这个变量不服从正态分布,而服从n -1的t分布
t
y
s
,具有n -1的自由度
n 其中,s 称为样本标准差。t分布只有一个参数。
n
16
标准差未知 时的平均数 分布 自由度(df):
自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均 值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。

生物统计学2

生物统计学2

第四章 统计推断(Statistical inference )生物统计学研究的基本问题是总体与样本间的关系,即生物特性与实验数据间的关系,二者的关系包括两个方面:(1)抽样分布:已知总体,研究从中抽取样本的的分布规律(第三章),即抽样分布问题。

(2)统计推断:由样本推断总体(包括不同样本间)。

第二章介绍了样本资料的整理和描述,本章将讨论用样本推断总体,就是根据这些理论分布由一个样本或一系列样本所得的结果来推断总体的特征,以及推断正确的概率。

第一节 假设检验的原理与方法一、假设检验的概念在生物学试验和研究中,当进行检验一种试验方法的效果、一个品种的优劣、一种药品的疗效等试验时,所得试验数据往往存在着一定差异,这种差异是由于随机误差引起的,还是由于试验处理的效应所造成的呢?例如,在同一饲养条件下喂养甲、乙两品系的肉鸡各20只,在二月龄时测得甲系的平均体重为1.5kg ,乙系的平均体重为1.4kg ,甲、乙相差0.1kg 。

这个0.1kg 的差值,究竟是由于甲、乙两系来自两个不同的总体,还是由于抽样时的随机误差所致?因为试验结果中往往是处理效应和随机误差混淆在一起,从表面上是不容易分开的,因此必须通过概率计算,采用假设检验的方法,才能作出正确的推断。

假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。

如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。

生物统计学中,一般认为小于0.05或0.01的概率为小概率。

通过假设检验,可以正确分析处理效应和随机误差,作出可靠的结论。

二、假设检验的步骤 (一)提出假设无效假设,或零假设(Null Hypothesis )记作Ho 。

无效假设指处理效应与总体参数(或样本与总体、两样本)之间没有真实的差异,试验结果中的差异乃误差所致。

生物统计习题及答案

生物统计习题及答案

第一章填空1.变量按其性质可以分为(连续型)变量和(非连续/离散型)变量。

2.样本统计数是总体(总体参数)的估计值。

3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。

4.生物统计学的基本内容包括(实验设计)和(统计推断)两大部分。

5.生物统计学的发展过程经历了(古典统计学)、(近代统计学)和(现代统计学)3个阶段。

6 .生物学研究中,—般将样本容量(大于30 )称为大样本。

7 .试验误差可以分为(随机误差)和(系统误差)两类。

判断1.对于有限总体不必用统计推断方法。

(错)2.资料的精确性高,其准确性也一定高。

(错)3•在试验设计中,随机误差只能减小,而不能完全消除。

(对)4.统计学上的试验误差,通常指随机误差。

(对)第二章填空1.资料按生物的性状特征可分为(数量性状)变量和(质量性状)变量。

2.直方图适合于表示(非连续型/离散型)资料的次数分布。

3•变量的分布具有两个明显基本特征,即(集中性)和(离散性)。

4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(标准差)。

5 .样本标准差的计算公式s=()。

判断题1•计数资料也称连续性变量资料,计量资料也称非连续性变量资料。

(错)2.条形图和多边形图均适合于表示计数资料的次数分布。

(错)3.离均差平方和为最小。

(对)4.资料中出现最多的那个观测值或最多一组的中点值,称为众数。

(对)5.变异系数是样本变量的绝对变异量。

(对)单项选择1.下列变量中属于非连续性变量的是(C).A.身高B・体重C・血型D・血压2•对某鱼塘不同年龄鱼的尾数进行统计分析,可做成(A)图来表示.A.条形B・直方C.多边形D・折线3.关于平均数,下列说法正确的是(B).A.正态分布的算术平均数和几何平均数相等.B.正态分布的算术平均数和中位数相等.C.正态分布的中位数和几何平均数相等.D.正态分布的算术平均数、中位数、几何平均数均相等。

4.如果对各观测值加上一个常数「其标准差(D )。

生物统计学 第4章 抽样分布

生物统计学 第4章  抽样分布
F 2
df1 df2
df1 df2 2
F
,F
0
0, F 0
F分布的平均数和方差分别为:
F
df2 , df df2 2
2
2 F
2df22 (df1 df2 2) df1(df2 2)2 (df2 4)
,
df
2
4
线性内插法求F值
求F12,17,0.05 1. 先查F12,15,0.05 =2.475, F12,20,0.05 =2.278 2. 公式: F12,17,0.05 = F12,15,0.05 +(F12,20,0.05 F12,15,0.05 )/(20-15)×(17-15) 3. 结果:=2.3962
( df 1) 2
(1
t2
df 1
) 2 ,
t
df ( )( df ) df
2
式中df=n-1
t分布的特征数:
t 0 (df 1)
t
df df 2
(df 2)
1:t 0 (df 3)
2:t
6 df 4
(df 4)
P(t≥tα)= P(t≤-tα)=α
P(| t | t )
当用σi2去出si2之后, si2 就被标准化了,标准化
的样本方差之比称为F:
s12
2
1
F df1,df2
2
s2
2 2
F分布是由一对自由度df1和df2确定的,F分布的 密度函数为:
f df1 ,df2
df1 df2
df1
2
df1 df2
2
df1 df2 2 2
1
df1 1
,2
0

生物统计学智慧树知到课后章节答案2023年下海南大学

生物统计学智慧树知到课后章节答案2023年下海南大学

生物统计学智慧树知到课后章节答案2023年下海南大学海南大学绪论单元测试1.生物统计学是数理统计的原理和方法在生物科学研究中的应用,属于理论数学。

()答案:错2.生物统计学的创始人是()。

答案:高尔登(F.Galton)3.生物学领域研究多属于实验科学,实验科学的研究方法主要有哪两类()。

答案:科学试验研究法;抽样调查法4.科学研究的基本过程包括三个环节:()答案:假说;试验或抽样调查;结论5.生物统计学十九世纪末发展起来的一门学科。

()答案:对6.试验设计概念正确的有()。

答案:按照预定目标制订适当的实验方案,以利于对实验结果进行有效的统计分析的数学原理和实施方法。

;指合理安排和实施试验取得正确、可靠、充分的数据资料的理论与方法。

7.试验设计有广义、狭义之分,生物统计学指的是广义的试验设计。

()答案:错8.试验设计的目的()。

答案:对总体作出可靠、正确的推断;避免系统误差;无偏估计处理效应;降低试验误差9.描述生物统计学的作用,正确的是()。

答案:提供试验设计的原则及方法;提供由样本推断总体的方法;;提供整理和描述数据资料的科学方法;;有助于阅读及撰写科技文献。

10.能否合理地进行试验设计,关系到科研工作的成败。

()答案:对第一章测试1.因素的水平是指()答案:因素质的不同状态;因素量的级别2.试验处理是指 ( )答案:因子间水平的组合;因子的水平;实施在试验单元上的具体措施3.一个试验中可以选用()作为试验指标。

答案:多个性状;经济性状;单个性状4.试验设计三原则包括:答案:重复原则;随机性原则;局部控制原则5.如果涉及试验因素多,难以确定因素或各因素的最佳起水平范围时,一般可采用先做单因素试验,后做精细选取因素和水平的试验。

答案:对6.在试验设计和统计分析方法中,控制误差指的是()。

答案:减小误差 ;无偏估计误差7.如果田间试验无法在一天内完成,以下那种做法是正确的()答案:同一区组必须在一天完成8.随机区组设计需要将全部处理抽签几次?()答案:有多少区组就抽签多少次9.局部控制原则指:同一重复区内的不同小区间环境条件最大程度地保持一致。

《生物统计学》习题集总参考答案

《生物统计学》习题集总参考答案

《生物统计学》习题集总参考答案第一章绪论一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。

2、个体:总体中的一个研究单位称为个体。

3、样本:总体的一部分称为样本。

4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。

5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。

6、参数:由总体计算的特征数叫参数。

7、统计量:由样本计算的特征数叫统计量。

8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。

9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。

10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。

11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。

二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。

(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。

2、统计分析的两个特点是什么?答:统计分析的两个特点是:①通过样本来推断总体。

②有很大的可靠性但也有一定的错误率。

3、如何提高试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。

4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。

生物统计课件:随机抽样和抽样分布

生物统计课件:随机抽样和抽样分布
例. 求7, 9, 4, 4, 6, 6, 6, 8, 8, 11的众数. 例. 众数是否唯一?
6. 极差 数据中最大值与最小值之差
例. 甲大学学生年龄的极差是6岁。 乙大学学生年龄的极差是10岁。
平均数、中位数 和众数关系
抽样分布
样本均数的分布 三大分布
抽样分布
精确抽样分布 渐近分布
• 统计量是随机变量; • 统计量的“抽样分布”
(Xi

X
)2
∑ ∑ =
1
n
[
n − 1 i=1
X
2 i

1( n n i=1
X i)2]
3. 标准误 SX 即样本均数的标准差
DX = 1 σ 2 = 1 DX
n
n
DX = 1 DX = DX
n
n
SX =
S n
S 2 = DX
4. 中位数
成绩 2 10 78 80 90 人数 1 1 1 22 5
nπ Γ( n)
(1
+
t2 n
)

n+1 2
2
E(t) = 0, D(t) = n ( when n > 2 ) n−2
n → ∞, t(n) ~ N (0,1)
iid
Theorem : if X1,L, X n ~ N (µ,σ 2 ), then X − µ ~ t(n −1) S/ n
X −µ X −µ = σ / n = S/ n S/ n
8 8
2.5 ≤ x < 2.7 2.7 ≤ x < 3
7 / 8 3 ≤ x < 3.5
1
x ≥ 3.5
正态概率纸原理

生物统计学课件2、抽样分布及应用一

生物统计学课件2、抽样分布及应用一
体均值的置信区间。
样本量确定
在确定样本量时,我们需要考虑 抽样误差和总体变异程度。通过 抽样分布,我们可以确定一个具
有足够精确度的样本量。
在假设检验中的应用
假设检验
在假设检验中,我们通常会根据已知的抽样分布来构建拒 绝域或临界值,以判断样本数据是否符合预期的假设。
检验效能
在假设检验中,我们还需要考虑检验效能,即当原假设为 假时,我们能够正确拒绝原假设的概率。通过抽样分布, 我们可以计算检验效能。
抽样分布的期望值和方差
总结词
抽样分布的期望值等于总体均值,而方差则与样本大小和总体方差有关。
详细描述
在统计学中,抽样分布的期望值(或平均值)等于总体均值,这是大数定律的一个结果。此外,抽样 分布的方差与样本大小和总体方差有关。随着样本量的增加,样本方差趋于总体方差,这是样本方差 估计总体方差的基础。
02
抽样的方法
随机抽样
简单随机抽样
每个样本被选中的概率相等,不受其 他因素的影响。
分层随机抽样
将总体分成不同的层,然后在每一层 内进行随机抽样。
系统抽样
等距抽样
将总体分成若干个部分,然后每隔一定距离抽取一个样本。
时间序列抽样
按照时间顺序抽取样本,例如每天、每周或每月抽取一个样 本。
分层抽样
分类抽样
单一样本方差的区间估计
使用卡方分布或F分布的临界值,结合样本方差和样本大小,计算 总体方差的置信区间。
两独立样本均值的比较
1 2
两独立样本均值的比较方法
使用t检验或Z检验等方法比较两组独立样本的均 值。
t检验的前提条件
两组样本应来自正态分布的总体,且方差应相等 。
3
Z检验的前提条件

医用数理统计方法课件第四章随机抽样与抽样分布

医用数理统计方法课件第四章随机抽样与抽样分布
(1)若总体X的分布函数为 F ( x),则样本( X 1 , X 2 ,, X n ) 的分布函数为 F ( xi ).
i 1 n
(2)若总体X的分布密度为 p( x),则样本( X 1 , X 2 ,, X n ) 的分布密度为 p( xi ).
i 1 n
(3)若总体X的分布率为P{ X x } p( x )(i 1,2,),
n i 1 1 n i 1
n
n
n
2

1 n
2
2 2 2 1 (3) E ( S n ) E[ n X X ] i
n 2
2 2 E ( X ) E ( X ) i
2
1 n
( D( X ) ( E( X )) ) ( D( X ) ( E ( X )) )
1 n k Ak X i , k 1, 2, ; n i 1
1 n Bk ( X i X )k , k 2, 3, ; n i 1 1 n k b ( x x ) , k 2, 3, . 其观察值 k i n i 1
样本矩具有下列性质:
n n 1 1 *2 2 2 2 其观察值 sn ( xi x ) xi nx . n 1 i 1 n 1 i 1
(5) 样本 k 阶(原点)矩
(6)样本 k 阶中心矩
1 n k 其观察值 ak xi , k 1, 2, . n i 1
例2 设总体 X 服从两点分布B(1, p), 其中0 p 1,
( X 1 , X 2 ,, X n )是来自总体的样本 , 求样本 ( X 1 , X 2 , , X n ) 的分布律.
解 总体 X 的分布律为

生物统计学4概率与概率分布

生物统计学4概率与概率分布
(二)分类
Today: 2020/4/16
1、离散型随机变量 (discrete random variable) 如果表示试验结果的随机变量X,其可能取值
为有限个或至多可列个, 并可以按一定顺序一一 列举, 则称X为离散型随机变量 。 2、连续型随机变量 (continuous random variable)
必然事件。因此
p(- X ) - f (x)dx 1
四、总体特征数
Today: 2020/4/16
x f1x1 f2 x2 fk xk
f1 f2 fk
k
fi xi
fx
i1 k
fi
f
i 1
σ2 [ fixi2
fi xi
2
]/
fi
fi
xi —各组组中值; fi —各组次数; k —分组数。
Today: 2020/4/16
第二节 概率分布 probablity distribution
一、随机变量(random variable) (一)定义
在随机试验中测定或观察的量就称为随机变量。 比如测量全国儿童身高、体重,则身高、体重为随 机变量,所测得每个儿童的具体身高、体重就是随 机变量的观测值。随机变量可用X、Y…等字母表示, 每一具体观测值用x 、y…等表示。
取每种可能值的概率Pi。
离散型
Today: 2020/4/16
(二)离散型随机变量的概率分布
1. 概率分布与概率函数
将离散型随机变量x的一切可能取值xi及其对应的 概率Pi,记作P(X=xi)=Pi (i=1,2,3…)
令 p(x) = P(X = xi ),则p(x即) 称为离散型随机 变量x的概率函数probability function。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 2
( X X )
1 2
12
n1

2 2
n2
小结:若两个总体是正态分布总体,
X 1 ~ 1, ),X 2 ~ 2, ) ( (
2 1 2 2

X 1 X 2 也服从正态分布:
N[ 1 2)( ( ,
12
n1

2 2
n2
)]
2、总体σi未知但相等时,样本平均数的和或
74 ˆ p 37.04 200
p(1 p) 0.352 0.348 0.4776或47.76%
现从这一总体抽样,以株为单位,用简
单随机抽样,调查200株棉株,获得74株受害, 则观察受害率为
74 ,试问获得这种 ˆ p 37.04 200
抽样平均数与总体真值的差数的概率为多少?
2 F 2 2
第四节
二项总体抽样
例如在棉田棉铃为害,根据总体内个体的某
种性状出现与否分为两组,受害株,未受害
株,赋第一组个体变量值x=1 ,第二组个体
变量取值x=0.
假定总体包括N株,受害株频率以p代表,则
总体内受害株理论次数为Np。
二项总体的平均数和方差计算
fx Np p
x
2
n
pq / n , x
pq / n
ˆ ˆ p (1 p ) 如果总体方差未知,则由 s n 来估计总体方差。
2 ˆ p
练习题
棉田盲蝽为害, 棉株分为受害株与未受害株。现
假定调查2000株作为一个总体,受害株为704株,这是
一个二项总体。计算出受害率 p=35.2% 或 0.352
μn / n 趋于服从参数为 的正态分布。即:
该定理是辛钦中心极限定理的特例。在抽样调
查中,不论总体服从什么分布,只要n充分大,那 么频率就近似服从正态分布。
辛钦中心极限定理
设随机变量x1x2·· n 相互独立,服从同一分布 x ·
且有有限的数学期望a和方差σ2,则随机变 量 ,在n无限增大时,服从参数为a和
1)样本统计量的概率分布,是一种理论分布在重复
选取容量为n的样本时,由样本统计量(样本均值,
样本方差等)的所有可能取值形成的相对频数分 布 ; 2)样本统计量是样本的函数,依据不同的样本计算 出来的值是不同的,所以样本统计量是随机变量;
3)是进行统计推断的理论基础和依据.
【例】设一个总体,含有4个元素(个体) ,即 总 体 单 位 数 N=4。 4 个 个 体 分 别 为 x1=1, x2=2,x3=3,x4=4 。总体分布、总体的均值 、方差及分布如下
1 1,1 2,1 3,1 2 1,2 2,2 3,2 3 1,3 2,3 3,3 4 1,4 2,4 3,4
4
4,1
4,2
4,3
4,4
计算出各样本的均值,如下表。并给出样 本均值的抽样分布
16个样本的均值( x
第一个 观察值
x
n

P(x )
第二个观察值 1 2 3 4
0. 3
1 2
3 4
1.0 1.5
2.0 2.5
1.5 2.0
2.5 3.0
2.0 2.5
3.0 3.5
2.5 3.0
3.5 4.0
0.2
0. 1 0 1. 1. 2. 2. 3. 3. 4. 0 5 0 5 0 5 0 x
样本均值的抽样分 布
样本均值的分布与总体分布的比较

x 的分布形式与原有总体和样本容量n的大小
有关
总体分布
.3 .2 .1 0
2.总体标准差未知
σ未知,则用样本所得的标准差s代替
σ(或称估计σ),则有
t
x

n
服从自由度为n-1的t 分布。
t
分布也是对称分布,只有自由度这一参数, 随自由度的增加而接近标准正态分布。
t分布的特征数:平均数μt =0
v 标准差 σ t v2

(v即df)
v>30 时接近标准正态分布。(随着v的增加, σt减少,趋近1)
总影响中所起的作用不很大,则这个变量
服从或近似服从正态分布。
二、 从两个正态总体中抽取样本
1、总体标准差已知,样本平均数的和与差的分 布
( X1 X 2 ) 1 2
(X X )
1 2
12
n1

2 2
n2
这是因为将
X1
X2
看成是独立的随机变量。
同理,
( X X ) 1 2
为 s 2 、s 2 的加权平均值 1 2
特别当n1=n2 =n 时,
2 2 (n1 1)s12 (n2 1)s2 s12 s2 (n1 1) (n2 1) 2
第三节
样本方差的分布
一、卡平方分布 从方差为σ2 的正态总体中,随机抽取含量 为n的样本,得样本的s2. 抽取多个样本,则得 到一系列的s2. s2是带有单位的。 标准化s2 , 得到一个随机变量χ2
2
dfs2

2

(n 1) s 2

2
Χ2 的概率密度函数:
其中,k是常数。
f ( 2 ) 分布在第一象限。分布的概率密度
曲线随自由度而变化。随着 df 增加, 近
似于正态分布。
三、两个样本方差比的分布——F分布
2 ( 从平均数和方差分别为 1, 12)和 2, 2) 的两 (
2
N f (x )2 N N Np(1 p) p(1 p) pq N
若从二项总体抽样,样本容量为n,n1表示样
本中具某种性状(如受害株)的个体数;
样本平均数:
(x ) ( n ) x
i 1
n
n
2
X ˆ (或 p x ) n
x p ,
率论中最著名的结果之一。它提出,大量的独立
随机变量之和具有近似于正态的分布 。常见中心 极限定理的表现形式有以下几种。
棣莫佛-拉普拉斯定理 参数为n, p的二项分布以np为均值、
np(1-p)为方差的正态分布为极限。
设μn是n次独立试验中事件A发生的次数,事件A在
每次试验中发生的概率为p,则当n无限大时,频率
差的分布
服从t分布
t n1 n2 2
( X 1 X 2 ) ( 1 2 )
2 (n1 1) s12 (n2 1) s 2 1 1 ( ) (n1 1) (n2 1) n1 n2

自由度为df1+df2=n1+n2-2 其中
2 (n1 1)s12 (n2 1)s2 (n1 1) (n2 1)
生物统计学
第四章 抽样分布
第一节 抽样分布概述
三种不同性质的分布
1、总体分布:总体频率或概率分布;已知或未知 2、样本分布:一个样本中各观察值的形成的相 对频数(频率)分布,也称经验分布;当样本容 量n逐渐增大时,样本分布逐渐接近总体的分布。
3、抽样分布
抽样分布:从已知的总体中,独立随机地
抽取含量为n的样本,研究所得样本及其统计 量的概率分布。
1.总体标准差已知
从平均数为μ、标准差为σ的正态总体中,随机、
独立抽取含量为n的样本,有
样本平均数服从正态分布,即:
n 称为“平均数的标准误差”,又称标准误
(standard error of mean)。 注意与“标准差”(standard deviation)区别开来。

当总体服从正态分布N (μ, 2 n)时,样本均值的

总体分布
N
x
i 1
N
i
N
i
2.5
2
.3 .2

2
(x )
i 1
.1 0
1 2 3 4
N
1.25
现从总体中抽取n=2的简单随机样本,在重复抽样条 件下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个) 第一个 观察值 1 2 3
第二个观察值
的正态分布即n→∞时,
将该定理应用到抽样调查:如果抽样总
体的数学期望a和方差σ2是有限的,无论总体 服从什么分布,从中抽取容量为n的样本时,
只要n足够大,其样本平均数的分布就趋于数
学期望为a,方差为σ2 / n的正态分布。
李亚普洛夫中心极限定理
如果一个变量是由大量相互独立的随 机因素影响所造成的,而每一个别因素在
抽样分布仍然是服从正态分布的,其样本均值的 数学期望仍为 μ ,方差为 2 n ,即样本均值的 方差比原总体的方差要小,而且样本容量n越大, 方差越小。
2 =1.25
= 2.5
X
总体分布
将随机变量
x
标准化:
u
x

n
其中,U~N(0,1),即:U服从于μ=0,σ=1 的正态分布(标准正态分布)。
查t分布表,有两尾表和单侧分位数表等。
上述结论是对正态总体而言的,不过实际 上,即使对于非正态总体而言,随着样本容量 的增加(事实上,只要样本足够大,通常要求样 本容量不小于45),即使是从非正态分布的总 体中抽样,样本均值的抽样分布与从正态分布
总体中抽样所得到的结果也近似相同。
中心极限定理(central limit theorem)是概
.3 .2 .1 0 P(x)
抽样分布
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
相关文档
最新文档