统计学第5-6章 正态分布、 统计量及其抽样分布
概率论与数理统计第六章统计量,样本及抽样分布
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
第6章-统计量及其抽样分布
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
贾俊平《统计学》第6章_统计量及其抽样分布
第 6 章 统计量与抽样分布
6.1 6.2 6.3 6.4 6.5 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
6.1 统计量
6.1.1 6.1.2 6.1.3 6.1.4 统计量的概念 常用统计量 次序统计量 充分统计量
统计量的概念
统计应用
“抓阄”征兵计划
然而结果是,有73个较小的号码被分配给了前半 年的日子,同时有110个较小的号码被分配给了后 半年的日子。换句话说,如果你生于后半年的某 一天,那么,你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人 在这种情况下,两个数字之间只应该有随机误差 ,而73和110之间的差别超出了随机性所能解释的 范围。这种非随机性是由于乒乓球在被抽取之前 没有被充分搅拌造成的。在第二年,主管这件事 的部门在抓阄之前去咨询了统计学家(这可能使生 于后半年的人感觉稍微舒服些)
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
x
抽样分布与总体分布的关系
总体分布
正态分布
非正态分布
大样本 小样本
样本均值 正态分布
样本均值 正态分布
样本均值 非正态分布
样本比例的抽样分布
比例
(proportion)
总体(或样本)中具有某种属性的单位与全部单位总 数之比
布可用正态分布近似。 推断总体比例的理论基础。
样本比例的抽样分布
(数学期望与方差)
样本比例的数学期望
E ( p)
样本比例的方差
重复抽样
2 p
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
统计学第5-6章 正态分布、 统计量及其抽样分布
第5-6章 统计量及其抽样分布5.1正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量如果随机变量X 的概率密度为22()21(),2x f x ex μσπσ--=-∞<<∞则称X 服从正态分布。
记做2(,)X N μσ,读作:随机变量X 服从均值为μ,方差为2σ的正态分布 其中,μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X的标准差5.1.2正态密度函数f(x)的一些特点:()0f x ≥,即整个概率密度曲线都在x 轴的上方。
曲线()f x 相对于x μ=对称,并在x μ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,221()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()x ϕ标准正态分布的分布函数:()x Φ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ,则(0,1)XZ Nμσ-=变量211(,)X Nμσ与变量222(,)Y Nμσ相互独立,则有221212+(+,+) X Y Nμμσσ5.1.3正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N,求以下概率(1)( 1.5) P X<(2)(2) P X>(3)(13) P X-<≤(4)(2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)XN ,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例设2(5,3)XN ,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤(5)(59)P X -≤解:由2(5,3)XN ,5(0,1)3X N -(1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2)255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)XN μσ,则有()()()b a P a X b μμσσ--<≤=Φ-Φ5.1.4 3σ准则若(0,1)X N ,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%至一般正态总体,即2(,)XN μσ,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质 设变量211(,)XN μσ,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ221212-(-,+)X YN μμσσ5.1.6求分位数Z α设()0,1XN()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==5.2 由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,nX X X 相互独立,且(0,1)iX N (1,2,,)i n =,则它们的平方和服从自由度为n 的2x分布。
第6章_统计量及其抽样分布
解:(1) P(X <1.5) = (1.5)=0.9332
(2) P(X >2)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1<X 3)= P(X 3)- P(X <-1)
标准正态分布函数
1. 任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布
Z X ~ N (0,1)
2. 标准正态分布的概率密度函数
(x)
1
x2
e2
,
x
2
3. 标准正态分布的分布函数
x
x
(x) (x)dt
1
t2 -
e 2 dt
均值和方差
总体分布
N
Xi
i1 2.5
N
N
(Xi )2
2 i1
6.1.2 常用统计量
• 样本矩 : • 设x1,x2,…,xn是一个大小为n的样本,对自
然数 k,分别称
为k阶
样本原点矩和k阶样本中心矩, 统称为样本 矩。许最常用的统计量,都可由样本矩构 造。例如,样本均值 (即α1)和样本方差
6.1.3 次序统计量
• 把样本X1,x2,…,xn由小到大排列,得
4. 结果来自容量相同的所有可能样本
6.2.2 渐进分布
• 由于寻找精确的抽样分布有困难,统计学 者转而研究当样本大小 n→∞时统计量的渐 近分布(即极限分布),这种研究是数理统计 大样本理论的基础性工作。
6.2.3 随机模拟获得的近似分布
2021统计学原理-《统计学》第五章统计量及其抽样分布试题(精选试题)
统计学原理-《统计学》第五章统计量及其抽样分布试题1、智商的得分服从均值为100,标准差为16的正态分布。
从总体中抽取一个容量为n的样本,样本均值的标准差为2,样本容量为____________。
2、样本均值与总体均值之间的差被称作____________。
3、从均值为50,标准差为5的无限总体中抽取容量为30的样本,则抽样分布的超过51的概率为____________。
4、某校大学生中,外国留学生占10%。
随机从该校学生中抽取100名学生,则样本中外国留学生比例的标准差为____________。
5、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( )。
A.服从非正态分布B.近似正态分布C.服从均匀分布D.服从x²分布6、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( )。
A.保持不变B.增加C.减小D.无法确定7、总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为( )。
A.50,8B.50,1C.50,4D.8,88、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。
如果从中随机抽取30只灯泡进行检测,则样本均值( )。
A.抽样分布的标准差为4小时B.抽样分布近似等同于总体分布C.抽样分布的中位数为60小时D.抽样分布近似等同于正态分布,均值为60小时9、假设某学校学生的年龄分布是右偏的,均值为23岁,标准差为3岁。
如果随机抽取100名学生,下列关于样本均值抽样分布描述不正确的是( )。
A.抽样分布的标准差等于3B.抽样分布近似服从正态分布C.抽样分布的均值近似为23D.抽样分布为非正态分布10、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的数学期望是( )。
A.150B.200C.100D.25011、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的标准差是( )。
第6章_统计量及其抽样分布
统计量 抽样分布 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布 两个样本平均值之差和两个样本比例之 差的分布 6.7 样本方差的分布 6.1 6.2 6.3 6.4 6.5 6.6
6.1 统计量
6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量
x
用Excel计算F分布的概率和临界值
1. 利用Excel提供的【FDIST】统计函数,计算F分布右尾 的概率值
语法:FDIST(x,degrees_freedom1,degrees_freedom2)
2. 利用【FINV】函数则可以计算给定右尾概率和自由度 时的相应临界值
语法: FINV(probability,degrees_freedom1,degrees_freedom2)
用Excel计算2分布的概率(续)
计算自由度为8,随机变量2值大于10的概率?
用Excel计算2分布的概率(续)
计算自由度为10,随机变量2分布右尾概率为0.1 的临界值?
t分布 (t distribution)
历史:William Gosset于1908年提出的,由于其经常用 “student”为笔名发表文章,其所提的此分布也称为学生 分布(student’s t)。
样本确定后,统计量的值总是可以计算出来。
常用统计量
设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,
1.样本平均数X 源自Xi 1n
i
n
n
X1 X 2 X n n
2.样本方差 3.样本比例
s2
2 ( X X ) i i 1
n 1
生物统计学正态分布和抽样分布PPT课件
u而符是合服从N(具0有,(1)n-分1)布自,由t度则的不服t 分从布标,准其正中态分s 布, (P样n理四4=、(一本论、2保-03) 方 平 正险、s均态1u公2样数分和司3本(布s)赔2平总表2=偿,均体(0损.则数平累失标的均积的准分数函数化布)数学后表期的)望样的本查方法差之比称为 F。
1、单侧分位数 上侧分位数: 当 P(Uu)时的 u 下侧分位数: 当 P(Uu)时的 u
0.05
u0.05 2、双侧分位数
当 P(U u)
2
时的 u 2
3、正态分布上侧分位数(u)表的查法:
1
u2
e 2 du
2 u
0 .0 0 5
u 2 .5 7 6
0 .0 1 0
2 .3 2 6
四、正态分布表(累积函数表)的查法
1、标准正态分布 随机变量落在某区间(a,b)内的概率,可以从标准正态 分布表中查出。
附表 2 列出了对于 -2.99 U 2.99时的(u)的值。
附表2 正态分布表
u
0 .0 0
0 .0 1 0 .0 2 0 .0 3 0 .0 4 0 .0 5
-1 .2 0 .11 5 0 7 0 .11 3 1 4 0 .111 2 3 0 .1 0 9 3 5 0 .1 0 7 4 9 0 .1 0 5 6 5
生物界乃至整个自然界中,符合正态分布的现 象非常之多,所以正态分布是生物统计学的基 础。
复习思考题 ①什么是随机变量?举例说明随机变量的种类? ②举例说明如何利用随机变量表示一个事件?如何利用随机变 量定义总体和样本? ③为什么连续型随机变量取得某一具体观测值的概率是0? ④离散型随机变量和连续型随机变量的累积函数有何区别? ⑤累计函数和分布曲线的主要用途。 ⑥二项分布的应用前提和条件?泊松分布和二项分布概率函数 的关系? ⑦正态分布的意义和特点。 ⑧正态分布的密度函数和分布曲线的特点。 ⑨什么是正态分布的分位数?都有哪些种?
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
【优秀文档】统计量及其抽样分布 PPT
2分布
(图示)
n=1 n=4
n=10
n=20
2
当n→∞,2分布的极限分布是正态分布
t分布 (Students 分布)
设随机变量X服从标准正态分布,随机 变量Y服从自由度为n的 χ 2分布,且X与Y 相互独立,则称随机变量:
T X Y /n
服从自由度为n的t分布,
记为T~t(n)
(学生) t 分布 Student’s t Distribution
例:某厂商声称其生产的电瓶具有均值为 质的检抽部 样门分为布检服验从该自厂由的度说为法(n是-1否) 正2确分,布随,机即抽取50个该厂生产的电瓶进行寿命实验。
中心极限定理:设从均值为 ,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值 为(cμe、nt方ral差lim为it theorem的)正态分布。
(称2F为)服:从假自定由该度厂n商和声m称的是F分正布确,的记,为50个样本的平均寿命不超过57个月的概率是多少? 当2样分本布容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布
(在性简质单和随特机点抽) 样中,样本具有随机性,样本的参数 , s2等也会随着样本不同而不同,故它们是样本的函数,记为T(x1, x2,……, xn)
60个月、标准差为6个月的寿命分布。质检 两t (个df样=本13均) 值之差
的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差
设当随x服机从变t(量nX)服分从布标,准x正2服态从分F布(,1,随n机)变分量布Y服从自由度为n的 分布,且X与Y相互独立,则称随机变量:
称设F随为机服变从量自X由服度从n标和准m正的态F分分布布,,记随为机变量Y服从自由度为n的 分布,且X与Y相互独立,则称随机变量:
第六章统计量及其抽样分布(统计学贾俊平)
2 分布, X ~ N ( 0 , 1 ) , Y ~ ( n ) 2. 定义6.4 设随机变量 X 其分布称为t分布, 且 X与Y 独立,则 t Y /n
记为t(n),其中n为自由度。
6.3.2
3. t分布的概率密度函数曲线
2. 定义6.5
设随机变量 Y与Z 相互独立,且 Y与Z 2 分别服从自由度为m和n的 分布,随机变量X
Y/ m nY 有如下表达式: X Z/ n mZ
则称X服从第一自由度为m,第二自由度为n的
~ F ( m , n ) F分布,记为F(m,n),简记为 X
6.3.3
3. F分布的概率密度函数曲线
平方和
n
i 1
X i2 服从自由度为n的 2 分布。
3. 自由度是统计学中常用的一个概念,可以解释 为独立变量的个数。
6.3.1
2
2
分布
X 4. 设 X~ N ( , ) ,则 Z ~N ( 0 , 1 )
1 ) 令 Y Z2,则 Y ~ 2( 2 ( n ) 分布的概率密度函数曲线为 5.
n X 10 9 . 9 10 P ( Z 1 ) P ( ) P ( Z 1 ) P (X 9 .9 ) 0 . 1 0 . 1 1 ( 1 ) 1 0 . 8413 0 . 1587 1 P ( Z 1 )
统计量概念的例题
, X , , X 【例6.1】设 X 是从某总体X中抽取的 1 2 n
一个样本,判断下列各量是否为统计量。
1 n (1 ) X Xi n i1
2 ( 3 ) [X E ( X )] i i 1 n
第六章 统计量及其
D( X (1) X ( 2) ) D( X (1) ) D( X ( 2) ) n1 n2 2 2 X1 X 2 ~ N ( 1 2 , 1 2 ) n1 n2
解:设600份报表中至少有一处错误的报表所 ˆ ,由题意知: p 占的比例为 p ˆ 0.02
p ˆ (1 )
n 0.02 (1 0.02) 0.0057 600
由中心极限定理, 有 (1 ) 2 ˆ N ( , ) p ˆ 即 ~ N (0.02,0.0057 ) p~ n 从而所求概率为:
即该统计人员所填写的报表中至少有一处错误的报 表所占的比例在0.025~0.070之间的概率为 19.02%。
第六节两个样本均值之差的分布
• 两个正态总体 2 (1) (1) (1) N ( ,1 )的一个 设 X 是独立地抽自总体 X ~ ) X ( 2是是独立地 容量为n1 的样本的样本均值, 抽自总体 X ( 2) ~N ( (1) , 2 2 ) 的一个容量为 n2 的样本的样本均值, 则有
(1)
( 2)
D( X
(1)
( 2)
) D( X ) D( X
(1)
( 2)
)
2 1
n1
2 2
n2
例6.8 甲、乙两所高校在某年录取新生时,甲 校的平均分为655分,且服从正态分布,标 准差为20分;乙校的平均分为625分,也服 从正态分布,标准差为25分.现从甲乙两校 各随机抽取8名新生计算其平均分数,出现 甲校比乙校的平均分低的可能性有多大? 解:因为两个总体均为正态分布,所以8名新 生的平均成绩X (1) , X (2) 也分别为正态分布, X (1) X ( 2 ) 也为正态分布,且 2 2 X (1) X ( 2 ) ~ N ( (1) ( 2) , 1 2 )
正态样本统计量的抽样分布概述
1
2
20
Xi
i1
X
2
35.2
P
1
2
20
Xi
i1
X
2
7.4
P
1
2
20
X
i1
i
X
2
35.2
查表
0.99 0.01 0.98
(P.386)
(2) 20 Xi 2 ~ 2 (20)
i1
故
P 0.37
2
1 20
20
Xi
i1
2
1.76
2
P 7.4
20
i1
Xi
2
35.2
(1)
求
P 0.37
2
1 20
20 i1
Xi
X
2
1.76
2
(2)
求
P 0.37
2
1 20
20 i1
Xi
2
1.76
2
解 (1)
(n
1)S 2
2
~
2(n
1)
即
19S 2
2
1
2
20 i 1
Xi X
2 ~ 2 (19)
故
P
0.37
2
1 20
20
Xi
i1
X
2
1.76
2
P 7.4
但
F0.95 (5, 4) ?
事实上,
F1
(n,
m)
F
1 (m,
n)
故
F0.95 (5,4)
1 F0.05 (4,5)
1 5.19
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5-6章 统计量及其抽样分布正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量如果随机变量X 的概率密度为22()21(),2x f x ex μσπσ--=-∞<<∞则称X 服从正态分布。
记做2(,)XN μσ,读作:随机变量X 服从均值为μ,方差为2σ的正态分布 其中,μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的标准差5.1.2正态密度函数f(x)的一些特点:()0f x≥,即整个概率密度曲线都在x轴的上方。
曲线()f x相对于xμ=对称,并在xμ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,2 21 ()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()x ϕ标准正态分布的分布函数:()x Φ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ,则(0,1)XZ Nμσ-=变量211(,)X Nμσ与变量222(,)Y Nμσ相互独立,则有221212+(+,+) X Y Nμμσσ5.1.3 正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N,求以下概率(1)( 1.5)P X <(2) (2)P X >(3)(13)P X -<≤(4) (2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)XN ,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例 设2(5,3)XN ,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤ (5)(59)P X -≤解:由2(5,3)XN ,5(0,1)3X N -(1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2) 255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)XN μσ,则有()()()b a P a X b μμσσ--<≤=Φ-Φ3σ准则若(0,1)X N ,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到%至一般正态总体,即2(,)XN μσ,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质 设变量211(,)XN μσ,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ221212-(-,+)X YN μμσσ5.1.6 求分位数Z α设()0,1XN()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,nX X X 相互独立,且(0,1)iX N (1,2,,)i n =,则它们的平方和服从自由度为n 的2x分布。
记做,22()i Xn χ∑2 2x 分布的密度函数图形图形特点:(1)2x分布的变量值始终为正。
(2)2x分布的形状取决于其自由度n 的大小,通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称。
(3)2x分布的期望为2()E n χ=,方差为2()2D n χ=(n 为自由度)。
(4)2x分布具有可加性。
若X Y与是相互独立的随机变量,21~(),X x n 22~()Y x n ,则它们的和服从于自由度为12n n +的2x分布,即212~()X Y x n n ++。
3 2x 分布临界值表的使用,求得2x 分布的分位数2x 分布临界值表中给出的是概率为α时,2x α的取值,k 是自由度。
222()()x P x x f x dx ααα+∞≥==⎰x α例如,若随机变量2(10)Xχ,则查表可得20.05(10)3.94χ=,20.95(10)18.307χ=,5.2.2 t 分布(student 分布)设随机变量,X Y互相独立,2~(0,1),~()X N Y x n ,则随机变量~()X t t n =——自由度为n 的t 分布t 分布概率密度函数图特点:① 关于y 轴对称,与标准正态分布的密度函数的图像非常相似。
② 厚尾:当x →∞时,t 分布的密度函数趋于0的速度要比标准正态分布密度函数慢,所以t 分布的密度函数的尾部要比(0,1)N 密度的尾部厚些。
③ 当自由度n 无限增大时,t 分布将趋近于标准正态分布。
所以,当n 很大时,t 分布可以用标准正态分布近似。
记()t n α为分布()t n 的α分位数。
在实际使用中,当30n ≥,就近似有 ()t n Z αα≈α由于t 分布密度曲线的对称性,可得1()()t n t n αα-=-例如,若随机变量(15)T t ,查表可得,0.05(15) 1.7531t =,而0.950.05(15)(15) 1.76531tt =-=-0.05(40) 1.6839t =,0.05(45) 1.6794t = 0.95 1.645Z =可见随着自由度n 的增大,t 分位数与z 分位数越来越接近。
5.2.3 F 分布设随机变量X 与Y 相互独立且分别服从自由度为m 和n 的2χ分布。
则随机变量//X mF Y n=服从第一自由度为m第二自由度为n的F 分布。
记为()FF m n ,xF 分布的概率密度函数的图设随机变量(,)FF m n ,(,)F m n α表示分布(,)F m n 的α分位数,α可以证明11(,)(,)F m n F n m αα-=例如查表得0.95F (8,9)=3.23,则0.050.950.31F F 11(9,8)==(8,9) 3.23小概率原理指发生概率很小的随机事件在一次实验中几乎不可能出现。
统计量定义:设12,,,n X X X 是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个不依赖于任何未知参数的函数12(,,,)n T X X X ,则称函数12(,,,)n T X X X 是一个统计量。
特点:由样本构造而得,是样本的函数 不含任何未知的参数当获得样本的一组具体观测值12(,,,)n x x x ,带入T,计算出12(,,,)n T x x x 的数值,称为统计量的值常用的统计量2,X S抽样分布抽样分布:统计量的分布随机变量X精确分布:可以得到分布的数学表达式渐近分布:难以得到精确分布时,借助于极限工具,求得抽样分布的近似分布,称为渐近分布。
定理1:设()12,,,nX X X是取自总体X的一个样本,记()iE Xμ=,2()iD Xσ=,那么①()E Xμ=,2()D Xnσ=②22()E sσ=,221()nnE snσ-=③当n→∞时,PXμ−−→lim ()1n P X με→∞-<=④ 当n →∞时,22P s σ−−→,22P ns σ−−→定理2:设()12,,,n X X X 是取自正态总体2(,)N μσ的一个样本①2(,)XN n σμ,或等价地(0,1)X N μ-②2222222()(1)(1)in X X nsn sn χσσσ--==-∑③ X 与2s 相互独立推论1:设()12,,,n X X X 是取自正态总体2(,)N μσ的一个样本,那么(1)/X t n s μ--简要证明:2(,)X N μσ(0,1)X N μ-⇒222(1)(1)n s n χσ--(1)X t n μ-⇒- 独立(t 分布的定义)即(1)X t n μ--推论2设()12,,,m X X X 是取自正态总体211(,)N μσ的一个样本,()12,,,n Y Y Y 是取自正态总体222(,)N μσ的一个样本,X与Y 相互独立,那么()()(0,1)X Y N μμ---简要证明:211(,)XN μσ211(,)XN mσμ⇒222(,)YN μσ222(,)YN nσμ⇒独立,221212(,)X YN mnσσμμ--+12()()(0,1)X Y N μμ---推论3:设()12,,,m X X X 是取自正态总体21(,)N μσ的一个样本,()12,,,n Y Y Y 是取自正态总体22(,)N μσ的一个样本,X 与Y 相互独立,那么()()(2)X Y t m n μμ---+-其中,22212(1)(1)(2)pm s n s s m n -+-=+-简要证明:21(,)XN μσ21(,)XN mσμ⇒22(,)YN μσ22(,)YN nσμ⇒独立,2212(,)X YN mnσσμμ--+2212(1)(1)m sm χσ--2222(1)(1)n sn χσ--可加性2221222(1)(1)(2)m sn sm n χσσ--++-()()(2)X Y t m n μμ---⇒+-整理得()()(2)X Y t m n μμ---⇒+-设22212(1)(1)(2)pm s n s s m n -+-=+-即()()(2)X Y t m n μμ---+-推论4: 设()12,,,m X X X 是取自正态总体211(,)N μσ的一个样本,()12,,,n Y Y Y 是取自正态总体222(,)N μσ的一个样本, X与Y 相互独立,那么22112222/(1,1)/s F m n s σσ-- 简要证明: 正态211(,)XN μσ22121(1)(1)m s m χσ-⇒-222(,)YN μσ22222(1)(1)n s n χσ-⇒-21212222(1)/(1)(1,1)(1)/(1)m s m F m n n sn σσ--⇒----即22112222/(1,1)/s F m n s σσ--非正态总体的情形定理:设()12,,,n X X X 是取自总体X 的一个样本,当n 较大时,近似地有①(0,1)X N μ-②(0,1)X N μ-。