统计学第5-6章 正态分布、 统计量及其抽样分布讲解学习
统计量与抽样分布-PPT课件
抽取一小部分
x
样本
第6章 统计量与抽样分布
主要内容
• 总体和样本的统计分布 • 统计量 • 抽样分布
第一节 总体和样本的统计分布
• 一、统计推断中的总体及总体分布 • 总体的概念 总体是根据一定的目的确定的所要研究的事物 的全体,它是由客观存在的、具有某种共同性质 的众多个体构成。总体中的各个单位称为个体。 由引例:每批麦子 每批麦子的每单位出酒量的 数值 编制变量的分布数列 实物总体 数值总体 分布总体
引例
• 1899年,戈塞特进入都柏林A.吉尼斯父子酿酒公司担任酿 酒化学技师,从事统计和试验工作。他发现,供酿酒的每 批麦子质量相差很大,而同一批麦子仲能抽样供试验的麦 子又很少,每批样本在不同的温度下做式样其结果相差很 大,这决定了不同批次和温度的麦子样本是不同的,不能 进行样本合并,这样一来实际上取得的麦子样本不可能是 大样本,只能是小样本。小样本得出的结果和正态分布有 较大差异,特别是尾部比正态分布高…… • 大样本和小样本有什么差异?如何用样本推断总体?
• 统计方法
描述统计
推断统计
参数估计
假设检验
所谓统计推断,就是根据概率论所揭示的随机 变量的一般规律性,利用抽样调查所获得的样本信 息,对总体的某些性质或数量特征进行推断。
参数估计 统计推断
假设检验
这两类问题的基本原理是一致的,只是侧重点不同 而已。 参数估计问题侧重于用样本统计量估计总体的某一 未知参数; 假设检验问题侧重于用样本资料验证总体是否具有 某种性质或数量特征。
1 f( x , ,x ) n 1 i 1 2
n
2 x ( ) i 2 e 2
( 2 2 i1
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
统计学第5-6章 正态分布、 统计量及其抽样分布
第5-6章 统计量及其抽样分布5.1正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量如果随机变量X 的概率密度为22()21(),2x f x ex μσπσ--=-∞<<∞则称X 服从正态分布。
记做2(,)X N μσ,读作:随机变量X 服从均值为μ,方差为2σ的正态分布 其中,μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X的标准差5.1.2正态密度函数f(x)的一些特点:()0f x ≥,即整个概率密度曲线都在x 轴的上方。
曲线()f x 相对于x μ=对称,并在x μ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,221()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()x ϕ标准正态分布的分布函数:()x Φ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ,则(0,1)XZ Nμσ-=变量211(,)X Nμσ与变量222(,)Y Nμσ相互独立,则有221212+(+,+) X Y Nμμσσ5.1.3正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N,求以下概率(1)( 1.5) P X<(2)(2) P X>(3)(13) P X-<≤(4)(2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)XN ,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例设2(5,3)XN ,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤(5)(59)P X -≤解:由2(5,3)XN ,5(0,1)3X N -(1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2)255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)XN μσ,则有()()()b a P a X b μμσσ--<≤=Φ-Φ5.1.4 3σ准则若(0,1)X N ,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%至一般正态总体,即2(,)XN μσ,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质 设变量211(,)XN μσ,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ221212-(-,+)X YN μμσσ5.1.6求分位数Z α设()0,1XN()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==5.2 由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,nX X X 相互独立,且(0,1)iX N (1,2,,)i n =,则它们的平方和服从自由度为n 的2x分布。
《统计量及其分布》课件
假设检验用于验证关于总体特征的假设, 通过比较样本统计量和期望值来进行判 断。
总结
统计量及其分布的重要性
统计量及其分布是统计学中的核 心概念,对于数据分析和推断具 有重要意义。
相关理论的进一步学习
通过学习统计量及其分布,可以 为进一步学习相关统计理论打下 坚实的基础。
统计学在实际生活中的应用
统计量的应用
1
样本方差与总体方差的关系
2
样本方差可以估计总体方差,并用于比
较不同组或处理之间的方差差异。
3பைடு நூலகம்
置信区间的计算
4
置信区间提供了对总体参数的估计范围, 通常用于估计均值或比例。
5
样本均值与总体均值的关系
通过样本均值可以估计总体均值,并通 过假设检验来判断两者之间是否显著不 同。
方差分析
方差分析用于比较三个或更多组之间的 均值是否显著不同,并确定哪个组之间 存在差异。
统计学在各个领域都有广泛的应 用,可以帮助我们理解和解决现 实生活中的问题。
常见的分布
正态分布
正态分布是一种常见的概率分布,具有对称性和 钟形曲线。它在自然和社会科学中经常出现。
F 分布
F 分布是用于方差分析和回归分析的概率分布。 它衡量了不同组之间的方差差异。
t 分布
t 分布是用于小样本假设检验和置信区间估计的 概率分布。它与正态分布密切相关。
卡方分布
卡方分布是用于计数数据分析和拟合度检验的概 率分布。它与正态分布有一定的关系。
《统计量及其分布》PPT 课件
统计量及其分布的PPT课件,涵盖了统计学的基本概念、统计量的分类、常见 的分布以及统计量的应用。
引言
统计学的基本概念是研究和应用数据收集、分析、解释和呈现的科学。而统计量是对样本数据进行总结和描述 的指标,用来估计总体参数和推断总体特征。 在这一部分,我们将介绍统计量的定义和作用,以及不同类型的统计量。
第6章_统计量及其抽样分布
解:(1) P(X <1.5) = (1.5)=0.9332
(2) P(X >2)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1<X 3)= P(X 3)- P(X <-1)
标准正态分布函数
1. 任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布
Z X ~ N (0,1)
2. 标准正态分布的概率密度函数
(x)
1
x2
e2
,
x
2
3. 标准正态分布的分布函数
x
x
(x) (x)dt
1
t2 -
e 2 dt
均值和方差
总体分布
N
Xi
i1 2.5
N
N
(Xi )2
2 i1
6.1.2 常用统计量
• 样本矩 : • 设x1,x2,…,xn是一个大小为n的样本,对自
然数 k,分别称
为k阶
样本原点矩和k阶样本中心矩, 统称为样本 矩。许最常用的统计量,都可由样本矩构 造。例如,样本均值 (即α1)和样本方差
6.1.3 次序统计量
• 把样本X1,x2,…,xn由小到大排列,得
4. 结果来自容量相同的所有可能样本
6.2.2 渐进分布
• 由于寻找精确的抽样分布有困难,统计学 者转而研究当样本大小 n→∞时统计量的渐 近分布(即极限分布),这种研究是数理统计 大样本理论的基础性工作。
6.2.3 随机模拟获得的近似分布
第6章_统计量及其抽样分布
统计量 抽样分布 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布 两个样本平均值之差和两个样本比例之 差的分布 6.7 样本方差的分布 6.1 6.2 6.3 6.4 6.5 6.6
6.1 统计量
6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量
x
用Excel计算F分布的概率和临界值
1. 利用Excel提供的【FDIST】统计函数,计算F分布右尾 的概率值
语法:FDIST(x,degrees_freedom1,degrees_freedom2)
2. 利用【FINV】函数则可以计算给定右尾概率和自由度 时的相应临界值
语法: FINV(probability,degrees_freedom1,degrees_freedom2)
用Excel计算2分布的概率(续)
计算自由度为8,随机变量2值大于10的概率?
用Excel计算2分布的概率(续)
计算自由度为10,随机变量2分布右尾概率为0.1 的临界值?
t分布 (t distribution)
历史:William Gosset于1908年提出的,由于其经常用 “student”为笔名发表文章,其所提的此分布也称为学生 分布(student’s t)。
样本确定后,统计量的值总是可以计算出来。
常用统计量
设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,
1.样本平均数X 源自Xi 1n
i
n
n
X1 X 2 X n n
2.样本方差 3.样本比例
s2
2 ( X X ) i i 1
n 1
正态样本统计量的抽样分布概述PPT课件【精编】
6.2.1 正态分布
6.2.2 2 (n) (卡方)分布
6.2.3 t分布(学生分布)
6.2.4 F分布 6.2.5 正态总体抽样分布的某些结论 6.2.6 Excel实现
确定统计量的分布—— 抽样分布, 是数理统计的 基本问题之一. 采用求随机向量的函数的分布的方法 可得到抽样分布.由于样本容量一般不止 2 或 3 (甚 至还可能是随机的), 故计算往往很复杂, 有时还 需要特殊技巧或特殊工具.
-z/2 = z1-/2
/2
1 z•2/2
6.2.2 2 (n) 分布(Chi squared r.v.)
定义 设 X 1, X 2 , , X n 相互独立,
且都服从标准正态分布N (0,1),则
n
X
2 i
~
2(n)
i 1
n = 1 时,其密
1 x e ,
1 2
x 2
2
0.8
x 0 0.6
0.4
0.2
0,
x0
2
4
6
8 10
n = 2 时,其密度函数为
f
(x)
1
e
x 2
,
2
0,
x0 x0
为参数为1/2的指数分布.
0.4 0.3 0.2 0.1
2
4
6
8
10
正态样本统计量的抽样分布概述PPT课 件【精 编】
一般地, 自由度为 n 的 2(n) 的密度函数为
则
X
1 n
n i 1
Xi
~
N
,
2
n
上(双)侧 分位数的概念
设X 为连续型随机变量,其概率密度函数为f ( x ) , 为给定常数, 0 < <1 若
统计量与抽样分布培训课件
6.1 随机样本与统计量
总体:研究对象的全体; 个体:总体中的成员; 总体的容量:总体中包含的个体数; 有限总体:容量有限的总体; 无限总体:容量无限的总体,通常将容量非
常大的总体也按无限总体处理。
3
例:1)了解某校“大学生的月消费水 平” 。总体是该校大学生全体。这是 一个有限总体,每个大学生有许多指标, 我们关注的是学生“过去6个月平均每 月的花费”这一指标。
n
n1 2
n 2
1
率密度为:f t
n1 2
n
n 2
1
t2 n
n1 2
,
t
25
t n 分布概率密度函数
26
对给定的 ,
0
1, 称满足条件
t n
f
t, n dt
的点t
n
为t n分布的上分位数。t分布的上分位数可查t分布表
t1 (n) t (n)
27
(三) F分布
设X 2 n1 ,Y 2 n2 , 且X ,Y独立,则
(88,88)(88,75)(88,70)(88,63) (75,88)(75,75)(75,70)(75,63) (70,88)(70,75)(70,70)(70,63) (63,88)(63,75)(63,70)(63,63)
12
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X 的简单随机样本。常用的统计量如下:
总体方差的估计可以用 S 2 也可以 B2 , 主要的区别涉及 到“无偏性” (这个概念将在第七章讨论).
15
例1.2 接例1.1,总体为88,75,70,63,显然, 总体均值为74. 计算全部16个样本的样本均值.
生物统计学正态分布和抽样分布PPT课件
u而符是合服从N(具0有,(1)n-分1)布自,由t度则的不服t 分从布标,准其正中态分s 布, (P样n理四4=、(一本论、2保-03) 方 平 正险、s均态1u公2样数分和司3本(布s)赔2平总表2=偿,均体(0损.则数平累失标的均积的准分数函数化布)数学后表期的)望样的本查方法差之比称为 F。
1、单侧分位数 上侧分位数: 当 P(Uu)时的 u 下侧分位数: 当 P(Uu)时的 u
0.05
u0.05 2、双侧分位数
当 P(U u)
2
时的 u 2
3、正态分布上侧分位数(u)表的查法:
1
u2
e 2 du
2 u
0 .0 0 5
u 2 .5 7 6
0 .0 1 0
2 .3 2 6
四、正态分布表(累积函数表)的查法
1、标准正态分布 随机变量落在某区间(a,b)内的概率,可以从标准正态 分布表中查出。
附表 2 列出了对于 -2.99 U 2.99时的(u)的值。
附表2 正态分布表
u
0 .0 0
0 .0 1 0 .0 2 0 .0 3 0 .0 4 0 .0 5
-1 .2 0 .11 5 0 7 0 .11 3 1 4 0 .111 2 3 0 .1 0 9 3 5 0 .1 0 7 4 9 0 .1 0 5 6 5
生物界乃至整个自然界中,符合正态分布的现 象非常之多,所以正态分布是生物统计学的基 础。
复习思考题 ①什么是随机变量?举例说明随机变量的种类? ②举例说明如何利用随机变量表示一个事件?如何利用随机变 量定义总体和样本? ③为什么连续型随机变量取得某一具体观测值的概率是0? ④离散型随机变量和连续型随机变量的累积函数有何区别? ⑤累计函数和分布曲线的主要用途。 ⑥二项分布的应用前提和条件?泊松分布和二项分布概率函数 的关系? ⑦正态分布的意义和特点。 ⑧正态分布的密度函数和分布曲线的特点。 ⑨什么是正态分布的分位数?都有哪些种?
第五章数理统计的基本概念和抽样分布精品PPT课件
n
pn(x1,x2, ,xn)
p(xi)
n
xi
en
i1
,
xi 0
i1
0,
其它
Байду номын сангаас
例2 设总 X服 体从两B(点 1,p)分 其 , 0 布 中 p1, (X1,X2, ,Xn)是来自总 ,求 体样 的 (X1本 ,X 样 2, 本 ,Xn)的分.布律
解 总体X的分布律为 P {X i} p i(1 p )1 i (i0,1)
设 x1,x2, ,xn是 相 应X于 1,X2,样 ,Xn 本 的 样,则 本称 f值 (x1,x2, ,xn)是f(X1,X2, ,Xn) 的 观.察 值
例1 设X1,X2,X3是来自N 总 (体 ,2)的一个 样本 ,其中 为已,知 2为未,判 知断下列各式
些是统,计 哪量 些不 ? 是
T1X1,
函数F(x)称为一个总体.
定义5.2
设X是 具 有 分F布 (x)函 的数 随 机,若 变X量 , X,, Xn是 具 有 同 一 F 分(x)布 、函 相数 互 独 立 的 随 机 变 ,则量称 X, X,, Xn为 从 总 X(或 体总 体
F(x))中 抽 取 的n容 的量 简为 单 随,机 简样 称 样本本 .
其 x 1 ,x 中 2 , ,x n 在{ 0 集 ,1 }中 合 .取值
三、统计量
由样本推断总体特征,需要对样本进行 “加工”,“提炼”.这就需要构造一些样本的 函 数1,它. 统把计样量本的中定所义含5的.3 信息集中起来.
设X1,X2,,Xn是来自X 总的体一个,样本 f(X1,X2,,Xn)是X1,X2,,Xn的函,若 数f中 不含未知, 则 参称 数 f(X1,X2,,Xn)是一个统 计量 .
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
第六章 统计量及其
D( X (1) X ( 2) ) D( X (1) ) D( X ( 2) ) n1 n2 2 2 X1 X 2 ~ N ( 1 2 , 1 2 ) n1 n2
解:设600份报表中至少有一处错误的报表所 ˆ ,由题意知: p 占的比例为 p ˆ 0.02
p ˆ (1 )
n 0.02 (1 0.02) 0.0057 600
由中心极限定理, 有 (1 ) 2 ˆ N ( , ) p ˆ 即 ~ N (0.02,0.0057 ) p~ n 从而所求概率为:
即该统计人员所填写的报表中至少有一处错误的报 表所占的比例在0.025~0.070之间的概率为 19.02%。
第六节两个样本均值之差的分布
• 两个正态总体 2 (1) (1) (1) N ( ,1 )的一个 设 X 是独立地抽自总体 X ~ ) X ( 2是是独立地 容量为n1 的样本的样本均值, 抽自总体 X ( 2) ~N ( (1) , 2 2 ) 的一个容量为 n2 的样本的样本均值, 则有
(1)
( 2)
D( X
(1)
( 2)
) D( X ) D( X
(1)
( 2)
)
2 1
n1
2 2
n2
例6.8 甲、乙两所高校在某年录取新生时,甲 校的平均分为655分,且服从正态分布,标 准差为20分;乙校的平均分为625分,也服 从正态分布,标准差为25分.现从甲乙两校 各随机抽取8名新生计算其平均分数,出现 甲校比乙校的平均分低的可能性有多大? 解:因为两个总体均为正态分布,所以8名新 生的平均成绩X (1) , X (2) 也分别为正态分布, X (1) X ( 2 ) 也为正态分布,且 2 2 X (1) X ( 2 ) ~ N ( (1) ( 2) , 1 2 )
第6章-统计量及其抽样分布课件
设X1服从标准正态分布N(0,1),X2服从自由度
为n的 分2 布,且X1、X2相互独立,则称变
量tX Y n
所服从的分布为自由
度为n的tt分t布 n, 记为
n 2时,Et 0
n 3时,Dt n
n2
第十六页,共32页。
如 X N,2 果
X
1 n
n i 1
Xi
, n X
则
S
tn1
把样本中“成功”的次数所占比例定
义作样本比例
p
X n
。
第二十四页,共32页。
假定某统计人员在其填写的报表中有2%至少 会有一处错误,如果我们检查一个由600份报表
组成的随机样本,其中至少有一处错误的报表所
占的比例在0.025-0.070之间的概率有多大?
第二十五页,共32页。
设600份报表中国至少有一处错误的报表 所占比 Nhomakorabea为p ,则有
第二十七页,共32页。
甲乙两所高校录取新生时,甲校平均分为 655,且服从正态分布,标准差为20,乙的平均 分为625,标准差为25,也是正态分布。现从两 校各随机抽取8名新生,计算平均分数,出现甲 比已的平均分低的概率有多大?
第二十八页,共32页。
8个新生平均分应服从正态分布,
X1-X2
N1-2, n112
P9.9X10.1P9.90 .110X0 .11010.0 1. 110
211
第二十二页,共32页。
例6.5
• 某电瓶商声称其生产的电瓶具有均值为60个 月,标准差为6个月的寿命分布。现假设质 监部门决定检验该厂的说法是否正确,为此 随机抽取了50个该厂生产的电瓶进行寿命检 验。
• 1)假设厂商声称是正确的,试描述50个电瓶
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5-6章 统计量及其抽样分布5.1正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量如果随机变量X 的概率密度为22()21(),2x f x ex μσπσ--=-∞<<∞则称X 服从正态分布。
记做2(,)X N μσ:,读作:随机变量X 服从均值为μ,方差为2σ的正态分布 其中,μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X的标准差5.1.2正态密度函数f(x)的一些特点:()0f x ≥,即整个概率密度曲线都在x 轴的上方。
曲线()f x 相对于x μ=对称,并在x μ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,221()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()x ϕ标准正态分布的分布函数:()x Φ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ:,则(0,1)XZ Nμσ-=:变量211(,)X Nμσ:与变量222(,)Y Nμσ:相互独立,则有221212+(+,+) X Y Nμμσσ:5.1.3 正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N:,求以下概率(1)( 1.5) P X<(2)(2) P X>(3)(13) P X-<≤(4)(2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)X N :,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例 设2(5,3)X N :,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤(5)(59)P X -≤解:由2(5,3)X N :,5(0,1)3X N -: (1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2)255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)X N μσ:,则有 ()()()b a P a X b μμσσ--<≤=Φ-Φ5.1.4 3σ准则若(0,1)X N :,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%至一般正态总体,即2(,)X N μσ:,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质设变量211(,)X N μσ:,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ:221212-(-,+)X Y N μμσσ:5.1.6 求分位数Z α设()0,1X N :()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==5.2 由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,nX X X L 相互独立,且(0,1)i X N :(1,2,,)i n =L ,则它们的平方和服从自由度为n 的2x分布。
记做,22()i Xn χ∑:22x 分布的密度函数图形图形特点:(1)2x分布的变量值始终为正。
(2)2x分布的形状取决于其自由度n 的大小,通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称。
(3)2x分布的期望为2()E n χ=,方差为2()2D n χ=(n 为自由度)。
(4)2x分布具有可加性。
若X Y与是相互独立的随机变量,21~(),X x n 22~()Y x n ,则它们的和服从于自由度为12n n +的2x分布,即212~()X Y x n n ++。
32x分布临界值表的使用,求得2x 分布的分位数2x分布临界值表中给出的是概率为α时,2x α的取值,k 是自由度。
222()()x P x x f x dx ααα+∞≥==⎰x α例如,若随机变量2(10)X χ:, 则查表可得20.05(10) 3.94χ=,20.95(10)18.307χ=,5.2.2 t 分布(student 分布)设随机变量,X Y互相独立,2~(0,1),~()X N Y x n ,则随机变量~()Xt t n=——自由度为n的t分布t分布概率密度函数图特点:①关于y轴对称,与标准正态分布的密度函数的图像非常相似。
②厚尾:当x→∞时,t分布的密度函数趋于0的速度要比标准正态分布密度函数慢,所以t分布的密度函数的尾部要比(0,1)N密度的尾部厚些。
③当自由度n无限增大时,t分布将趋近于标准正态分布。
所以,当n很大时,t分布可以用标准正态分布近似。
记()t nα为分布()t n的α分位数。
在实际使用中,当30n≥,就近似有()t n Zαα≈α由于t分布密度曲线的对称性,可得1()()t n t n αα-=-例如,若随机变量(15)T t :,查表可得,0.05(15) 1.7531t =,而0.950.05(15)(15) 1.76531tt =-=-0.05(40) 1.6839t =,0.05(45) 1.6794t = 0.95 1.645Z =可见随着自由度n 的增大,t 分位数与z 分位数越来越接近。
5.2.3 F 分布设随机变量X 与Y 相互独立且分别服从自由度为m 和n 的2χ分布。
则随机变量//X mF Y n=服从第一自由度为m第二自由度为n的F 分布。
记为()F F m n :,xF 分布的概率密度函数的图设随机变量(,)F F m n :,(,)F m n α表示分布(,)F m n 的α分位数,α可以证明11(,)(,)F m n F n m αα-=例如查表得0.95F (8,9)=3.23,则0.050.950.31F F =11(9,8)==(8,9) 3.235.6 小概率原理指发生概率很小的随机事件在一次实验中几乎不可能出现。
6.1 统计量定义:设12,,,n X X X L 是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个不依赖于任何未知参数的函数12(,,,)n T X X X L ,则称函数12(,,,)n T X X X L 是一个统计量。
特点:由样本构造而得,是样本的函数 不含任何未知的参数当获得样本的一组具体观测值12(,,,)n x x x L ,带入T,计算出12(,,,)n T x x x L 的数值,称为统计量的值常用的统计量2,X S6.2 抽样分布抽样分布:统计量的分布 随机变量X渐近分布:难以得到精确分布时,借助于极限工具,求得抽样分布的近似分布,称为渐近分布。
定理1:设()12,,,n X X X L 是取自总体X的一个样本,记()i E X μ=,2()i D X σ=,那么①()E X μ=,2()D X nσ=②22()E sσ=,221()nn E s nσ-= ③ 当n →∞时,PX μ−−→ lim ()1n P X με→∞-<=④ 当n →∞时,22P s σ−−→, 22P n s σ−−→定理2:设()12,,,n X X X L 是取自正态总体2(,)N μσ的一个样本 ①2(,)X N n σμ:,或等价地(0,1)X N μ-:② 2222222()(1)(1)in X X nsn sn χσσσ--==-∑:③ X与2s相互独立推论1:设()12,,,nX X XL是取自正态总体2(,)Nμσ的一个样本,那么(1)Xt nμ--:简要证明:2(,)X Nμσ:(0,1)XN-⇒:222(1)(1)n snχσ--:(1)Xt nμ-⇒-:独立(t分布的定义)即(1)Xt nμ--:推论2设()12,,,mX X XL是取自正态总体211(,)Nμσ的一个样本,()12,,,nY Y YL是取自正态总体222(,)Nμσ的一个样本,X与Y相互独立,那么()()(0,1)X Y N μμ---:简要证明:211(,)X N μσ:211(,)X N mσμ⇒:222(,)Y N μσ:222(,)Y N nσμ⇒:独立,221212(,)X Y N mnσσμμ--+:()()(0,1)X Y N μμ---:推论3:设()12,,,m X X X L 是取自正态总体21(,)N μσ的一个样本,()12,,,n Y Y Y L 是取自正态总体22(,)N μσ的一个样本,X 与Y 相互独立,那么()()(2)X Y t m n μμ---+-:其中,22212(1)(1)(2)pm s n s s m n -+-=+-简要证明:21(,)X N μσ:21(,)X N mσμ⇒:22(,)Y N μσ:22(,)Y N nσμ⇒:独立,2212(,)X Y N mnσσμμ--+:2212(1)(1)m sm χσ--:2222(1)(1)n sn χσ--:可加性2221222(1)(1)(2)m sn sm n χσσ--++-:()()(2)X Y t m n μμ---⇒+-:整理得()()(2)X Y t m n μμ---⇒+-:设22212(1)(1)(2)pm s n s s m n -+-=+-即()()(2)X Y t m n μμ---+-:推论4:设()12,,,m X X X L 是取自正态总体211(,)N μσ的一个样本, ()12,,,n Y Y Y L 是取自正态总体222(,)N μσ的一个样本,X与Y 相互独立,那么22112222/(1,1)/s F m n s σσ--: 简要证明:正态211(,)X N μσ:22121(1)(1)m sm χσ-⇒-:222(,)Y N μσ:22222(1)(1)n s n χσ-⇒-:21212222(1)/(1)(1,1)(1)/(1)m s m F m n n sn σσ--⇒----:即22112222/(1,1)/s F m n s σσ--:非正态总体的情形定理:设()12,,,n X X X L 是取自总体X的一个样本,当n 较大时,近似地有①(0,1)X N μ-:②(0,1)X N μ-:。