(06)第6章统计量及其抽样分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(06)第6章统计量及其抽样分布
第6章统计量及其抽样分布第6章统计量及其抽样分布§6.1统计量§6.2关于分布的几个概念§6.3
由正态分布导出的几个重要分布§6.4样本均值的分布与中心极限定理§6.5样本比例的抽样分布§6.6两个
样本平均值之差的分布§6.7关于样本方差的分布学习目标理解统计量与分布的几个概念掌握Z、t、卡方、F四大分布
掌握单总体参数(均值/比例/方差)推断时样本统计量的分布掌握双总体参数(均值差)推断时样本统计量的分布样本统计量的概念1.
设X1,X2,…,Xn是从总体中抽取的容量为n的一个样本。
如果由此样本构造出一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T是一个统计量。
2.样本统计量示例:如样本均值、样本比例、样本方差样本统计量的概念(例题分析) 常用统计量样本均值:样本方差s2(或标准差S):样本变异(离散)系数V:样本K阶矩mk:均值为样本1阶矩样本K阶中心矩vk:样本偏度α3、样本峰度α4次序统计量定义:对x1~xn排序,x(1)≤…≤x(n),称x(i)为次序统计量X
(i)的观测值。
这里:X(1)、X(n)——最小、最大次序统计量2.样本极差R是次序统计量:R=X(n)-X(1)3
.其他次序统计量:如中位数Me、(四)分位数充分统计量在实际统计推断中,是用统计量的值进行推断,而不是由样本观测值进行推断。
即经过加工之后,有了统计量的值即可。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
充分统计量例:某电子元件厂欲
了解其产品的不合格率p,质检员抽检了100个电子元件,检查结果是,除前3个是不合格品(记为x1=1,x2=1,x3=1),其它都是合格品(记为xi=0,i=4,5,…100)。
当企业领导问及抽样结果时,质检员给出如下两种回答;充分统计量(1)抽检
的100个元件中有3个不合格(记为)(2)抽检的100个元件中前3个不合格(x1=1,x2=1,x3=1)这两
种回答反映了质检员对样本的两种不同处理思想。
这两种回答所用的统计量分别为:关于分布的几个概念1、抽样分布:指样本统计量的概
率分布精确的抽样分布:在正态总体条件下,主要有t、χ2、F分布2、渐近分布:在样本量n无限增大时,统计量T的极限分布样本均值(服从t分布)的渐近分布为正态分布3、近似分布:根据N次抽样(可用计算机模拟)得到的N个观测值,可做其经验分布函数。
由此得到
的统计量的分布就是随机模拟法所获得的近似分布抽样分布(samplingdistribution)由正态分布导出的
几个重要分布 ?2分布(?2distribution)由阿贝(Abbe)于1863年首先给出,后来由海尔墨
特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来设
,则令,则Y服从自由度为1的?2分布,即当总体
,从中抽取容量为n的样本,则?2分布(性质和特点)分布的变量值始终为正分布的形状取决于其自由
度n的大小,通常为不对称的正(右)偏分布,但随着自由度的增大逐渐趋于对称。
(非对称分布)期望为:E(?2)=n,方差为:D(?
2)=2n(n为自由度)可加性:若U和V为两个独立的?2分布随机变量,U~?2(n1),V~?2(n2),则U+V这一随机变
量服从自由度为n1+n2的?2分布?2分布(α分位数/临界值)?2(n)的α分位数(n):可查卡方分布表查得。
即P
(?2≥)=αExcel:ChiDist(,n)=αChi
Inv(α,n)=(n)比较:Ф(Zα)——标准正态分布Z函数,即Ф(Zα
)=P(Z≤Zα)=1-αExcel:NormsDist(Zα)=Ф(Zα)=1-α其反函数为:N
ormsInv(1-α)=Zαt(学生氏)分布(定义和性质)1.当X~
N(0,1),Y~χ2(n),且X、Y相互独
立则称为服从的分布为自由度是n的t分布,即T~t(n)2.E(t)=0,n≥2;
D(t)=n/(n-2),n≥33.t(n)的α分位数tα(n),可通过查t分布表求得。
即P(|t|≥tα/2)=α
4.Excel:TInv(α,n)=tα/2(n)TDist(tα/2,
n,2)=αt分布与Z分布的比较F分布(Fdistribution)由统计学家费希尔(R.A.Fisher)提
出的,以其姓氏的第一个字母来命名则设若Y为服从自由度为m 的?2分布,即Y~?2(m),Z为服从自由度为n的?2分布,即Z~?2( n),且Y和Z相互独立,则称X为服从自由度m和n的F分布,记为F分布(性质和特点)分布的变量值始终为正
分布的形状取决于其自由度的大小,通常为不对称的正(右)偏分布,但随着自由度的增大逐渐趋于对称。
(非对称分布)F1-α(m,n) =1/Fα(n,m)若X~t(n),则X2~F(1,n)F分布的α分位数Fα(m,n):可查F分布表查得
即P(F≥Fα)=αExcel:FInv(α,m,n)=Fα(m,n)
FDist(Fα,m,n)=αF分布(图示)样本均值的抽样分布容量相同的所有可
能样本的样本均值的概率分布一种理论概率分布进行推断总体均值?的理论基础样本均值的抽样分布(正态总体)中心极限定理(c entrallimittheorem)中心极限定理(centrallimittheorem)抽样分布与总体分布的关
系样本均值的抽样分布(数学期望与方差)样本均值的数学期望样本均值的方差注:正态总体或大样本与t分布有关的两个抽样分布1.设X~N(μ,σ2),样本为X1~Xn则2.设X~N(μ1,σ2),Y~N(μ2,σ2),X和Y相互独立。
样本为X1~Xn、Y1~Ym则样本均值的抽样分布(例题分析)样本均值的抽样分布(例题分析)比例(
proportion)总体(或样本)中具有某种属性的单位与全部单位总数
之比不同性别的人与全部人数之比合格品(或不合格品)与
全部产品总数之比总体比例可表示为样本比例可表示为样本比例的抽样分布容量相同的所有可能样本的样本比例的概率分布当样本容量很大(np≥5或n(1-p)≥5)时,样本比例的抽样分布可用正态分布近似是一种理论概率分布是推断总体比例?的理论基础样本比例的抽样分布(数学期望与方差)样本比例的数学期望样本比例的方差CX(C为常数)的抽样分布样本比例的抽样分布(例题分析)两个样本均值之差的抽样分布两个总体都为正态分布,即,
两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差
方差为各自的方差之和两个样本均值之差的抽样分布两个样本均值之差的抽样分布(例题分析)两个样本比例之差的抽
样分布两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布
可用正态分布来近似分布的数学期望为方差为各自的方差之和两个样本比例之差的抽样分布(例题分析)样本方差的分布c2 分布(图示)两个样本方差比的抽样分布本章小结统计量抽样分布单总体参数推断时样本统计量的分布双总体参数推断时样本统计量的分布38Inthisdiagram,dothepopulationshaveequalorunequal variances?Unequal.Asaresultofthisclass,youwillbeable
to...65Thesamplingdistributionisafunctionofthesamples
izesuponwhichthesamplevariancesarebased.Hint:Recallthe formulaforvariance!s2=S(x-`x)2/(n-1)Asaresultofthi
sclass,youwillbeableto...Asaresultofthisclass,youw
illbeableto...Asaresultofthisclass,youwillbeableto
...?不同自由度的F分布F(1,10)(5,10)(10,10)§6.4样本均值的分布及中心极限定理样本均
值的抽样分布中心极限定理?=50?=10X总体分布n=4抽样分布Xn=16当总体服从正态分布N~(
μ,σ2)时,来自该总体的所有容量为n的样本的均值?X也服从正态分布,?X的数学期望为μ,方差为σ2/n。
即?X~N(μ,σ2/ n)当样本容量足够大时(n?30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为?,方差为?2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X 的
分布趋于正态分布的过程总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布【例6.4】设X~N(10
,0.62),n=36,求以下概率解:X-bar~N(10,0.12)【例6.5】设X~N(60,62),n=50,求均值
的抽样分布及平均寿命不超过57个月的概率。
解:(1)X-bar~N(60,0.8
52)§6.5样本比例的抽样分布比例样本比例的抽样分布【原理】设X为一随机变量,C为常数,E(X)=μ,D(X)=
σ2。
则CX与X有相同的分布形状,且E(CX
)=Cμ,D(CX)=C2σ2【例6.6】设X~N(9,22),n=50,求10X的抽样分布解:因为E(1
0X)=10E(X)=90,D(10X)=100D(X)=400则10X~N(90,20
2)【例6.7】已知π=2%,n=600,求错误报表所占的比例p在0.025~0.07之间的概率有多大?解:(1)n
=500,取p≈π=2%,有np=10>5,n(1-p)=490>5故n为大样本:p~N(π,π(1-π)/n)=N(0.02,0.00572)§6.6两个样本平均值之差的分布两个样本均值之差的抽
样分布两个样本比例之差的抽样分布m1s1总体1s2m2总体2抽取简单随机样样本容量n1计算
X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分
布【例 6.8】已知X1~N(655,202),X2~N(625,252),n1=n2=8,求出现甲校低比乙校平均分低的可能性
有多大?解:【例6.9】已知π1=15%,π2=8%,n1=120,n2=140。
求样本比例差p1-p2不低于0.0
8的概率有多大?解:因为n1,n2为大样本,有§6.7关于样本方差的分布样本方差的分布两个样本方差比的分布?对于
来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的?2分布即选择容量为n的
简单随机样本计算样本方差S2计算卡方值?2=(n-1)S2/σ2计算出所有的?2值不同容量样本的抽样分布c2
n=1n=4n=10n=20ms总体两个总体都为正态分布,即X~N(μ1,σ12),Y~N(μ2,σ22
)从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-
1)F分布,即结束6-统计学(第三版)统计学(第三版)统计学(第三版)统计
学(第三版)统计学(第三版)统计学§6.1统计量样本统计量常用统计量次序统计量充分统计量【例6.1
】设X1~Xn为样本。
解:(1)都是统计量(2)都不是统计量§6.2关于分布的几个概念抽样分布渐近分布随机模拟获得的近似分布总体计算样本统计量例如:样本均值、比例、方差样本§6.3由正态分布导出的几个重要分布?2分布t分布F分布?分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。
一个特定的分布依赖于称之为自由度的参数。
随着自由度的增大,分布也逐渐趋于正态分布Xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)Z Chapter7 InstructorNotes 7- Statistics,7/e ?1997Prentice-Hall,Inc. Chapter7 StudentLectureNotes 7-。