常用的统计量抽样分布总结
抽样与抽样分布
抽样与抽样分布在统计学中,抽样是一种常用的数据收集方法,通过从总体中选择一部分样本来进行研究和分析。
抽样的目的是通过样本来推断总体的特征和性质。
在进行抽样时,我们需要了解抽样的方法和抽样分布的概念。
一、抽样方法1. 无偏抽样无偏抽样是指所有样本有相同被选中的机会。
这样可以确保样本的代表性,从而减小样本估计值和总体真值之间的误差。
常见的无偏抽样方法包括简单随机抽样、系统抽样和分层抽样等。
2. 有偏抽样有偏抽样是指样本的选择并不具有相等的机会。
这样可能导致样本的代表性不足,从而产生较大的估计误差。
有时,有偏抽样也可以用于特定的研究目的,但需要明确地说明和分析偏差带来的影响。
二、抽样分布1. 抽样分布的概念抽样分布是指统计量在各个可能样本上的取值分布。
统计量可以是样本均值、样本方差等。
抽样分布的性质对于进行统计推断和假设检验非常重要。
2. 样本均值的抽样分布样本均值的抽样分布在中心极限定理的条件下近似服从正态分布。
中心极限定理指出,当样本容量足够大时,无论总体分布如何,样本均值的抽样分布都会接近正态分布。
3. 样本比例的抽样分布样本比例的抽样分布在满足一些条件的情况下也近似服从正态分布。
这些条件包括样本容量足够大、总体比例接近0.5以及样本与总体之间的独立性等。
4. 样本方差的抽样分布样本方差的抽样分布不服从正态分布。
通常情况下,样本方差的抽样分布呈右偏态,即偏度大于0。
为了得到样本方差的抽样分布,可以使用抽样分布的近似分布,如卡方分布。
三、应用案例抽样与抽样分布的方法和理论在实际统计学中有广泛的应用。
以下是一些常见的应用案例:1. 调查研究在进行调查研究时,我们经常需要从总体中选择一部分样本进行问卷调查或面访。
通过利用抽样与抽样分布的方法,我们可以将样本的调查结果推广到总体中,从而得到总体的特征和性质。
2. 假设检验假设检验是统计学中常用的推断方法之一。
通过比较样本统计量与假设的总体参数值,我们可以判断假设的合理性。
概率论与数理统计第六章统计量,样本及抽样分布
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
抽样分布与中心极限定理例题和知识点总结
抽样分布与中心极限定理例题和知识点总结在统计学中,抽样分布和中心极限定理是非常重要的概念,它们为我们进行数据分析和推断提供了坚实的理论基础。
接下来,让我们通过一些具体的例题来深入理解这两个重要的知识点。
首先,我们来了解一下什么是抽样分布。
抽样分布是指从一个总体中抽取一定数量的样本,由这些样本计算出的统计量(如均值、方差等)所形成的概率分布。
比如说,我们从一个正态分布的总体中抽取样本容量为 n 的样本,计算每个样本的均值。
当我们重复抽取大量的样本,并将这些样本均值进行整理,就会得到样本均值的抽样分布。
中心极限定理则指出,无论总体的分布如何,只要样本容量足够大,样本均值的抽样分布就近似服从正态分布。
这是一个极其强大的定理,它使得我们在很多情况下可以利用正态分布的性质来进行统计推断。
下面通过几个例题来加深对这些概念的理解。
例题 1:假设一个总体的均值为μ = 50,标准差为σ = 10。
从这个总体中抽取样本容量为 n = 36 的样本。
求样本均值的抽样分布的均值和标准差。
根据抽样分布的性质,样本均值的抽样分布的均值等于总体均值,即μₓ̅=μ = 50。
样本均值的抽样分布的标准差(也称为标准误差)为σₓ̅=σ /√n = 10 /√36 = 10 / 6 = 5 / 3 。
例题 2:一个总体服从均匀分布,其范围在 0 到 10 之间。
抽取样本容量为 n = 100 的样本。
请问样本均值的抽样分布近似服从什么分布?由于样本容量 n = 100 较大,根据中心极限定理,样本均值的抽样分布近似服从正态分布。
接下来,我们总结一下抽样分布和中心极限定理的重要知识点。
抽样分布的关键知识点包括:1、样本均值的抽样分布的均值等于总体均值。
2、样本均值的抽样分布的标准差(标准误差)等于总体标准差除以样本容量的平方根。
中心极限定理的要点为:1、不管总体的分布形状如何,只要样本容量足够大(通常n ≥ 30),样本均值的抽样分布就近似服从正态分布。
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
统计学 第三章抽样与抽样分布
=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
统计学抽样与抽样分布
3. 需要包含所有低阶段抽样单位的抽样框;同时由于
实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
概率抽样(小结)
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。
n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。
样本分量:其中每一个Xi是一个随机变量,称为样本 分量。
样本观察值:一次抽样中所观察到的样本数据x1、x2、 x3称为样本观察值。 对于某一既定的总体,由于抽样的方式方法不同,样 本容量也可大可小,因而,样本是不确定的、而是可5
一、 几个概念
(二)样本总体与样本指标
样本指标(统计量)。在抽样估计中,用来反 映样本总体数量特征的指标称为样本指标,也 称为样本统计量或估计量,是根据样本资料计 算的、用以估计或推断相应总体指标的综合指 标。
3
总体和参数(续)
通常所要估计的总体指标有
X
NX
一、 几个概念
(二)样本总体与样本指标
样本总体。简称样本(Sample),它是按照随机原则, 从总体中抽取的部分总体单位的集合体 。
样本容量:样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
(二)抽样平均误差(抽样标准误)
抽样平均误差是反映抽样误差一般水平的指标(因为 抽样误差是一个随机变量,它的数值随着可能抽取的 样本不同而或大或小,为了总的衡量样本代表性的高 低,就需要计算抽样误差的一般水平)。通常用样本 估计量的标准差来反映所有可能样本估计值与其中心 值的平均离散程度。
第十六讲(数理统计中常用的分布、抽样分布定理)
3 n足够大 时, (n)近似服从• (n,2n) N
2
证
1设
2 (n) X i2
i 1
n
X i ~ N (0,1) i 1,2, , n
X 1 , X 2 , , X n
相互独立,
2 i
则 E ( X i ) 0, D( X i ) 1, E ( X ) 1
•2
P{ X z } 1
-z= z1-
例1 求
z0.05 , z0.025 , z0.005 , z0.95 .
解: P{ X 1.645} 0.05, P{ X 1.96} 0.05, P{ X 2.575} 0.005.
z0.05 1.645 , z0.025 1.96 , z0.005 2.575
0.4 0.3 0.2 0.1
n= 1 n=20
-3
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t分布的性质: 1. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形, 1 t 2 2 再 由函数的性质有 lim f (t ) 2 e . n
~ ( n2 ), U
2
与V 相互
U n1 F V n2
服从自由度为n1及 n2 的F分布,n1称为 第 一自由度,n2称为第二自由度,记作
F~F(n1,n2) . 由定义可见,
1 V n2 ~F(n2,n1) F U n1
若F~F(n1,n2), F的概率密度为
( n1 n2 ) n n1 n21 1 n n 2 n ( n1 ) 2 ( y ) 1 n1 y 2 ( y ) ( 1 ) ( 2 ) 2 2 2 0
三大抽样分布及常用统计量的分布
随(1机) 样XX本132,试XX2问42 下; 列(2统) 计n量n各1XX服i21从; 什(么3)分(n3布?n1)Xi31i2
X
2 i
.
i2
i4
n
续解 (2) 因为X1~N(0,1),
X
2 i
~
2(n
1)
故
i2
n 1X1
n
n
X1
~t(n-1).
X
2 i
X
2 i
(n 1)
i2
i2
例1 设总体X~N(0,1), X1,X2,…,Xn为简单
项是独立的.所以(4.1)式的自由度是n-1.
定理3: 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X与样n本方差S 2相互独立;
(2)
(n 1)S 2
2
(Xi
i 1
2
X)2
~
2(n 1)
(4.1)
与以下补充性质的结论比较:
性质 设(X1,X2,…,Xn)为取自正态总体
f(x)
其中f(x)是 2-分布的概率密度. O
图5-5 2(n) x
显然,在自由度n取定以后,2(n)的值只与有关.
例如,当n=21,=0.05时,由附表3(P254)可查得,
02.05(21) 32.67 即 P 2(21) 32.67 0.05.
二、t分布
定义3 设随机变量X~N(0,1),Y~ 2(n) ,
(4.1)
(4.1)式的自n 由度为什么是n-1?
从表面上看, (Xi X)2是n个正态随机变量 Xi X 的平方和,
但实际上它们不i是1 独立的,它们之间有一种线性约束关系:
《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布
《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆短期的机遇变异
重复投掷一枚均匀硬币六次,观察每次出现的面: (1)正反正反反正 (2)反反反正正正 (3)正反反反反反
直觉认为结果(1)是随机的,结果(2)和结果 (3)很不随机。 从概率的观点认为结果(1)、(2)、(3)的发 生有相同的概率,因而没有哪一个结果比其他结果更多 一点或少一点随机性。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
◆变异性(Variablity)
统计数据和统计资料具有变异性, 即个体之间有 差异,而对同一个体的多次观察,其结果也会不一样, 并且几乎每一次观察都随着时间的不同而改变,因而变 异性是一个重要的统计观念。 抽样结果的差异是变异性的主要表现 不能仅仅根据一次抽样的结果就断下结论!
《概率统计简明教程》第二版
第八章 统计量与抽样分布
二、总体和样本
1.总体
我们关心的是总体中的个体的某项指标(如人的身高、 灯泡的寿命, 汽车的耗油量…) .
由于每个个体的出现是随机的,所以相应的数量指标 的出现也带有随机性 . 从而可以把这种数量指标看作一 个随机变量X ,因此随机变量X的分布就是该数量指标在 总体中的分布.
《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆长期的规律性
在某地的彩票活动中,七年中有人累计中两次大 奖的机会是: 一半对一半
人们的潜意识常常与理性思考的结果有很大差别, 如不善于统计思考,即使面对十分平常的现象,也会闹 出笑话。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
第八章 统计量与抽样分布
二、总体和样本
自考04183概率论与数理统计(经管类)总结2-数理统计部分
高等教育自学考试辅导《概率论与数理统计(经管类)》第二部分数理统计部分专题一统计量及抽样的分布I.考点分析近几年试题的考点分布和分数分布II.内容总结一、总体与样本1.总体:所考察对象的全体称为总体;组成总体的每个基本元素称为个体。
2.样本:从总体中随机抽取n个个体x1,x2…,x n称为总体的一个样本,个数n称为样本容量。
3.简单随机样本如果总体X的样本x1,x2…,x n满足:(1)x1与X有相同分布,i=1,2,…,n;(2)x1,x2…,x n相互独立,则称该样本为简单随机样本,简称样本。
得到简单随机样本的方法称为简单随机抽样方法。
4.样本的分布(1)联合分布函数:设总体X的分布函数为F(x),x1,x2…,x n为该总体的一个样本,则联合分布函数为二、统计量及其分布1.统计量、抽样分布:设x1,x2…,x n为取自某总体的样本,若样本函数T=T(x1,x2…,x n)不含任何未知参数,则称T为统计量;统计量的分布称为抽样分布。
2.样本的数字特征及其抽样分布:设x1,x2…,x n为取自某总体X的样本,(2)样本均值的性质:①若称样本的数据与样本均值的差为偏差,则样本偏差之和为零,即②偏差平方和最小,即对任意常数C,函数时取得最小值. (5)样本矩(7)正态分布的抽样分布A.应用于小样本的三种统计量的分布的为自由度为n的X2分布的α分位点.求法:反查X 2分布表.III.典型例题[答疑编号918020101]答案:D[答疑编号918020102]答案:[答疑编号918020103]答案:B[答疑编号918020104]答案:1[答疑编号918020105]答案:B[答疑编号918020106]故填20.[答疑编号918020107]解析:[答疑编号918020108]答案:解析:本题考核正态分布的叠加原理和x2-分布的概念。
根据课本P82,例题3-28的结果,若X~N(0,1),Y~N(0,1),且X与Y相互独立,则X+Y~N(0+0,1+1)=N(0,2)。
概率论第六章样本及抽样分布
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
抽样知识点总结
抽样知识点总结一、抽样的基本概念1.1 总体和样本总体是指研究对象的全体,样本是从总体中抽取的一部分个体。
总体是研究的对象,样本是研究的实际观察单位。
1.2 抽样误差抽样误差是指由于抽样方法所导致的样本与总体之间的偏差。
抽样误差分为随机误差和系统误差两种,随机误差是由抽样本身的不确定性所引起,系统误差是由于抽样方法的偏差或者样本数据的不准确性所引起。
1.3 抽样分布抽样分布是一组样本统计量的概率分布,它反映了在不同样本情况下的统计量的变动情况。
1.4 抽样方法常见的抽样方法包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。
不同的抽样方法适用于不同的研究问题和数据特点。
二、抽样的基本原则2.1 代表性原则样本应当具有代表性,即能够准确地反映总体的特征和变动情况。
2.2 随机性原则抽样过程应当具有一定的随机性,以消除个体之间的偏好或者主观意愿。
2.3 独立性原则各个样本之间应当是相互独立的,互不影响,以确保样本数据的独立性和可靠性。
2.4 信息量原则样本应当具有足够的信息量,即能够为研究问题提供充足的数据支持。
三、抽样的实施步骤3.1 确定研究目标首先需要确定研究问题,明确所需的样本特征和数据信息。
3.2 制定抽样方案根据研究目标和总体特征,选择合适的抽样方法,并确定抽样的规模和抽样的程序。
3.3 抽取样本按照抽样方案进行抽样,获取符合要求的样本数据。
3.4 数据分析与推断对抽样数据进行分析和推断,从而得出关于总体特征和规律的结论。
3.5 结果解释与应用根据抽样研究的结论和推断结果,进行结果的解释和应用,为决策和实践提供支持和参考。
四、抽样的应用4.1 统计调查抽样是统计调查中常用的一种数据收集方法,可以节省人力物力,减小成本,提高工作效率。
4.2 市场调查在市场营销中,抽样可以帮助企业更加准确地了解消费者的需求和偏好,指导产品开发和促销策略。
4.3 健康调查抽样在健康调查中发挥着重要作用,可以了解社会群体的健康状况和问题,为政府和企业提供决策支持。
4.3抽样分布
(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
16几个常用的抽样分布与抽样分布定理
(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2
即
( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,
统计量的分布——抽样分布及其性质
$
$0
首先根据数学期望和方差的性质有4
(
+
=A
7
AB$
中国人民大学出版社!)%$6!1& '(( 蔡则元&三大抽样分布的理解与具体性质' :( &数
0
(
0
接下来对 学学习与研究 + + + 4
=A 7%E
=A 7E
=A 7()
AB3
AB$
AB3
曲天尧关于对统计推断中抽样分布的总结及判 (
,l%很显然该概率密度服从指数分布 因此) 分布为参 数7$ 的指数分布从而指数分布是作为一种特殊的)
)
根据函数的性质可得 槡 即自由
G/HF
-'
-
' 7
$
>8') )
)
度- 充分大时'-分布近似于正态分布
分布
对于'分布 给定常数 % jj$ 满足条件
科教论坛
!"#!$%&$'(') *+&,-./&$01$21(3$&)%)(%)%$3
科技风 年 月
统计量的分布
抽样分布及其性质
赵红妮
西安思源学院基础部!陕西西安!+#""""
摘4要数理统计是以概率论为基础的一个数学分支它从实际观测的数据出发研究随机现象的规律性 本文基于 正态分布的基础上研究三大抽样分布) 分布'分布和<分布的概念及性质图像结合例题对抽样分布做出更深一层的 理解与应用
关键词随机变量抽样分布正态分布
44概率论中假定随机变量的分布是在已知的基础上研 究随机变量的性质以及数字特征&而在现实生活中要研究
概率论与数理统计总结之第六章
第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。
正态样本统计量的抽样分布概述
1
2
20
Xi
i1
X
2
35.2
P
1
2
20
Xi
i1
X
2
7.4
P
1
2
20
X
i1
i
X
2
35.2
查表
0.99 0.01 0.98
(P.386)
(2) 20 Xi 2 ~ 2 (20)
i1
故
P 0.37
2
1 20
20
Xi
i1
2
1.76
2
P 7.4
20
i1
Xi
2
35.2
(1)
求
P 0.37
2
1 20
20 i1
Xi
X
2
1.76
2
(2)
求
P 0.37
2
1 20
20 i1
Xi
2
1.76
2
解 (1)
(n
1)S 2
2
~
2(n
1)
即
19S 2
2
1
2
20 i 1
Xi X
2 ~ 2 (19)
故
P
0.37
2
1 20
20
Xi
i1
X
2
1.76
2
P 7.4
但
F0.95 (5, 4) ?
事实上,
F1
(n,
m)
F
1 (m,
n)
故
F0.95 (5,4)
1 F0.05 (4,5)
1 5.19
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常用的统计量抽样分布一.正态分布1. ∑==ni i X n X 11EX →2. 212)(11∑=--=n i i X X n S ][11212∑=--=n i i X n X n DX →3. 定理:X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~),(2nN σμ,(2).22)1(σS n -~)1(2-n χ,(3). X 与2S 相互独立。
二.2χ分布 1. 定义设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122n X ni i χχ∑==2. 性质:(1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。
(2). 若X ~)(2n χ,则n EX =,2DX n =。
三.t 分布 1. 定义设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则nY X T =~)(n t 。
2. 定理:设n X X X ,,,21 独立同分布,且~),(2σμN ,则nS X μ-σσμSn X )(-=1)1()(22---=n Sn n X σσμ~)1(-n t(因为nX σμ-~)1,0(N ,22)1(σS n -~)1(2-n χ)。
3. 定理:设1,,,21n X X X 为总体X ~),(21σμN 的样本,1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则212111)()(n n S Y X w+---μμ~)2(21-+n n t ,其中2)1()1(212222112-+-+-=n n S n S n S w。
证:因为2211)1(σS n -~)1(12-n χ,2222)1(σS n -~)1(22-n χ,所以2222211)1()1(σS n S n -+-~)2(212-+n n χ;又X ~),(121n N σμ,Y ~),(222n N σμ,所以X Y -~),(221221n n N σσμμ++,所以212111)()(n n Y X +---σμμ~)1,0(N ,所以 212111)()(n n S Y X w+---μμ212111)()(n n Y X +---=σμμ/)2/()1()1(212222211-+-+-n n S n S n σ~)2(21-+n n t 。
四.F 分布 1. 定义设U ~)(12n χ,V ~)(22n χ,且V U ,独立,则21n Vn UF =~),(21n n F 。
2. 定理:设F ~),(21n n F ,则F1~),(12n n F 3. 定理:设1,,,21n X X X 为总体X ~),(211σμN 的样本,1,,,21n Y Y Y 为总体Y ~),(222σμN 的样本,且Y X ,独立,则)1,1(~//2122222121--=n n F S S F σσ。
常用的统计量抽样分布示例例 1 设2521X X X ,,是来自总体()1~2χX 的一个样本,则∑=251i iX服从()252χ分布;例2设随机变量21,X X ,3X 相互独立,1X ~)1,0(N ,2X ~)21,0(N ,3X ~)31,0(N ,则23222132X X X ++服从)3(2χ分布。
例3 设总体X 服从)2,0(2N ,而1521,,,X X X 为来自总体X 的简单随机样本,则随机变量)(22152112102221x X X X X Y ++++= 服从)5,10(F 分布。
例 4 设随机变量Y X ,相互独立且都服从)3,0(2N ,而921,,,X X X 和921,,,Y Y Y 为分别来自总体X 和Y 的简单随机样本,则统计量2921921YY X X X U ++++=服从)9(t 分布。
例5 设n X X X ,,,21 )2(≥n 为来自总体)1,0(N 的简单随机样本,X 是样本均值,2S 是样本方差,则 D .(A). X n ~)1,0(N (B) 2nS ~)(2n χ(C). S Xn )1(-~)1(-n t (D) ∑=-ni iX X n 2221)1(~)1,1(-n F 解:∑=-ni iXX n 2221)1(∑=-=ni in XX 22211/1/~)1,1(-n F例6 设总体X 服从),(21σμN ,总体Y 服从),(22σμN ,1,,,21n X X X 为来自总体X 的简单随机样本,2,,,21n Y Y Y 为来自总体Y 的简单随机样本,则=-+-+-∑∑==]2)()([21112212n n Y Y X XE n i n i i i2σ解:原式2121)([211∑=--+=n i i X X E n n ])(212∑=-+ni i Y Y1221212()1{[]2n ii XX E n n σσ=-=++-∑2212()[]}n ii Y Y E σ=-∑又221)(1σ∑=-n i iX X221)1(σSn -=~)1(12-n χ,故22122()[]1n ii XX E n σ=-=-∑,从而12111()11n ii XX En n =-=--∑,同理22122()11n ii Y Y En n =-=--∑,所以原式=2σ。
例7. 设n X X X ,,,21 )2(>n 为来自总体),0(2σN 的简单随机样本,X是样本均值,记X X Y i i -=,n i ,,2,1 = 。
求: (1). i Y 的方差i DY ,n i ,,2,1 = ; (2). ),(1n Y Y Cov ; (3) }0{1≤+n Y Y P 。
(4)若21)(n Y Y c +是2σ的无偏估计,求c 的值。
解:(1)i DY )(X X D i -=(i X n )11(- 与∑≠=n ik k k X n ,11独立) ]1)11[(,1∑≠=--=n i k k k i X n X n D 222221)1(1)11(σσσn n n nn -=-+-=,n i ,,2,1 = 。
(2) 0)(11=-==X X E EY EY n ,),(1n Y Y Cov ))((11n n EY Y EY Y E --=))((1X X X X E n --= )(1n X X E =)(2X E +)()(1X X E X X E n --1X ,n X 独立,)(1n X X E ∴01=⋅=n EX EX )(X D )(2X E =2)(X E -)(2X E =而)(X D ][21n X X X D n ++=21n=)(1n DX DX ++ 21σn ==++=)}()()({1)(121211n X X E X X E X E n X X E 2211)(1σnX E n =,=++=})()()({1)(221n n n n X E X X E X X E n X X E 221)(1σnX E n n =所以),(1n Y Y Cov )(X D =21σn -21σn -=21σn-(3)=+n Y Y 1)()(1X X X X n -+-∑-=--+-=121222n i i n X n X n n X n n 上式是相互独立的正态随机变量的线性组合,所以n Y Y +1服从正态分布,由于,0)(1=+n Y Y E 所以5.0}0{1=≤+n Y Y P 。
(4)])([21n Y Y c E +)(1n Y Y cD +=)],(2[11n n Y Y Cov DY DY c ++=2]211[σn n n n n c --+-=2)2(2σc nn -=2σ=,故)2(2-=n n c 。