统计学第5-6章 正态分布、 统计量及其抽样分布知识分享
正态分布ppt课件统计学
人类的身高和体重分布情况符合正态分布的特征。这是因为个体的生长发育受到多种因 素的影响,导致身高和体重的差异。根据正态分布规律,大部分人的身高和体重值会集 中在平均值附近,而偏离平均值越远的人数逐渐减少。这种分布形态有助于评估个体的
生长发育状况,并识别出异常身高和体重的个体。
股票价格波动
总结词
卡方检验
总结词
卡方检验是一种非参数检验方法,用于比较实际观测频数与 期望频数是否有显著性差异。
详细描述
卡方检验通过计算卡方值和对应的P值来判断实际观测频数与 期望频数是否有显著性差异。卡方值越大,P值越小,说明差 异越显著。
05
正态分布的实例分析
考试分数分布
总结词
考试分数分布通常呈现正态分布的特点,即大部分考生成绩集中在平均分附近,高分和低分均呈下降趋势。
03
正态分布的性质
钟形曲线
钟形曲线
正态分布的图形呈现钟形 ,中间高,两侧逐渐降低 ,对称轴为均值所在直线 。
概率密度函数
描述正态分布中取任意值 的概率大小,函数曲线下 的面积代表概率。
曲线下面积
正态分布曲线下的面积为1 ,表示随机变量取值在一 定范围内的概率。
平均数与标准差
平均数
正态分布的均值,表示数据的中 心位置,所有数据值加起来除以 数据个数得到。
概率密度函数
正态分布的概率密度函数公式为: $f(x) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}$
其中,$mu$表示平均值,$sigma$ 表示标准差,该公式描述了正态分布 曲线的形状和高度。
02
正态分布的应用
自然现象
正态分布知识点
正态分布知识点正态分布是统计学中最为重要的概率分布之一,也被称为高斯分布。
它在自然界、人类社会和经济现象中都有着广泛的应用。
正态分布是一种连续型概率分布,其概率密度函数呈钟形曲线,呈现出对称性和集中性。
正态分布的形状可以通过其期望值(均值)和标准差来描述。
期望值表示数据的中心位置,标准差表示数据的离散程度。
通常情况下,正态分布的均值、中值和众数(最常出现的值)是相等的,呈现出对称性。
正态分布的曲线在均值附近最高,在离均值越远的位置,曲线越低。
正态分布的曲线在均值两侧对称,这意味着大约68%的数据位于均值的一个标准差范围内,大约95%的数据位于均值的两个标准差范围内,大约99.7%的数据位于均值的三个标准差范围内。
这种统计规律被称为“68-95-99.7法则”。
正态分布可以用来描述许多自然现象,例如身高、体重、智力水平等。
在这些现象中,大多数个体集中在均值附近,而离均值越远的个体越少。
这也解释了为什么大多数人的身高在平均身高附近,而极矮或极高的个体数量较少。
正态分布在统计学中有许多应用。
首先,它可以用来进行数据分析和假设检验。
通过分析数据的分布情况,可以判断某个变量是否服从正态分布。
在假设检验中,可以利用正态分布假设来进行参数估计和推断。
其次,正态分布可以用来进行抽样推断。
根据中心极限定理,当样本容量足够大时,样本均值的分布接近于正态分布。
这意味着我们可以通过对样本数据进行统计分析,来推断总体的性质和特征。
正态分布还可以用于建立概率模型和预测。
在金融领域,股票价格的波动、汇率变动等都可以用正态分布进行建模。
在质量控制中,正态分布被用来评估生产过程的稳定性和规范性。
此外,正态分布的特点也对科学研究和实践有着重要意义。
在实验设计中,可以通过对因素的测量,了解数据是否服从正态分布,从而选择适当的统计方法和模型。
总之,正态分布作为统计学中的重要概率分布,具有许多重要的应用。
其形状对称、集中性强的特点,使得它成为了许多自然现象和实际问题的理想模型。
正态分布知识点总结ppt
正态分布知识点总结ppt一、概念1. 正态分布,又称高斯分布,是一种连续概率分布2. 具有单峰对称的特点3. 由于其形状近似于钟形,因此也被称为钟形曲线二、特征1. 均值μ:描述分布的中心位置2. 标准差σ:描述数据点相对于均值的离散程度3. 标准差越大,曲线扁平度越高4. 标准差越小,曲线陡峭度越高5. 正态分布的均值、众数和中位数都相等三、标准正态分布1. 当均值μ=0,标准差σ=1时的正态分布2. 应用范围更广,便于做概率计算3. 可通过Z变换,将任意正态分布转化为标准正态分布四、性质1. 概率密度函数:f(x) = (1/σ√(2π)) * e^(-(x-μ)²/(2σ²))2. 总体均值、中位数、众数相等3. 68-95-99.7法则:在正态分布下,大约68%的数据落在均值±1个标准差内,大约95%的数据落在均值±2个标准差内,大约99.7%的数据落在均值±3个标准差内五、应用1. 统计学:用于研究样本数据的分布规律2. 自然科学:许多自然现象的分布都符合正态分布,如身高、体重等3. 工程学:用于分析质量控制、可靠性分析等六、假设检验1. 基于正态分布的概率性质,可对样本数据进行假设检验2. 通过计算样本均值和标准差,判断总体参数是否满足要求七、实际案例1. 身高分布:研究人群的身高分布规律,制定人体工程学标准2. 质量控制:监控产品的质量符合正态分布,及时发现异常情况3. 信用评分:应用正态分布评估个人信用等级八、常见问题1. 如何判断一组数据是否符合正态分布?- 绘制直方图或概率图查看数据分布形状- 进行正态性检验,如Shapiro-Wilk检验、K-S检验等2. 如果数据不符合正态分布,影响有哪些?- 在统计分析中应当选择非参数检验方法- 在数据建模和预测中需要考虑非线性因素的影响九、总结正态分布是统计学中的基础概率分布,具有广泛的应用价值。
第六章 统计量及其抽样分布
样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
统计学第5-6章 正态分布、 统计量及其抽样分布
第5-6章 统计量及其抽样分布5.1正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量如果随机变量X 的概率密度为22()21(),2x f x ex μσπσ--=-∞<<∞则称X 服从正态分布。
记做2(,)X N μσ,读作:随机变量X 服从均值为μ,方差为2σ的正态分布 其中,μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X的标准差5.1.2正态密度函数f(x)的一些特点:()0f x ≥,即整个概率密度曲线都在x 轴的上方。
曲线()f x 相对于x μ=对称,并在x μ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,221()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()x ϕ标准正态分布的分布函数:()x Φ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ,则(0,1)XZ Nμσ-=变量211(,)X Nμσ与变量222(,)Y Nμσ相互独立,则有221212+(+,+) X Y Nμμσσ5.1.3正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N,求以下概率(1)( 1.5) P X<(2)(2) P X>(3)(13) P X-<≤(4)(2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)XN ,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例设2(5,3)XN ,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤(5)(59)P X -≤解:由2(5,3)XN ,5(0,1)3X N -(1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2)255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)XN μσ,则有()()()b a P a X b μμσσ--<≤=Φ-Φ5.1.4 3σ准则若(0,1)X N ,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%至一般正态总体,即2(,)XN μσ,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质 设变量211(,)XN μσ,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ221212-(-,+)X YN μμσσ5.1.6求分位数Z α设()0,1XN()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==5.2 由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,nX X X 相互独立,且(0,1)iX N (1,2,,)i n =,则它们的平方和服从自由度为n 的2x分布。
正态分布知识点归纳总结
正态分布知识点归纳总结一、正态分布的概念正态分布是概率论和统计学中最重要的连续概率分布之一,具有许多重要的性质和应用。
它的密度函数表达式为:\[f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]其中,μ是分布的均值(也称为期望值),σ是分布的标准差,π是圆周率。
该密度函数描述了正态分布的概率密度曲线,呈钟形曲线,中心对称。
正态分布具有以下几个重要的性质:1. 对称性:正态分布是关于均值对称的,即以均值为中心呈对称分布。
2. 峰度:正态分布的峰度为3,表示分布的尾部平缓,数据集中在均值附近。
3. 位置参数和尺度参数:正态分布具有两个参数,均值μ用于描述分布的位置,标准差σ用于描述分布的离散程度。
4. 68-95-99.7法则:正态分布在均值附近有着特别的区间划分规律,约68%的数据落在均值附近一个标准差的范围内,约95%的数据落在两个标准差的范围内,约99.7%的数据落在三个标准差的范围内。
二、正态分布的特性正态分布具有一些独特的特性,使得它在统计学和概率论中广泛应用。
以下是一些正态分布的特性:1. 中心极限定理:若从任意总体中抽取样本,在样本容量足够大时,样本均值的分布将近似服从正态分布,这就是中心极限定理。
2. 独特的形状:正态分布的概率密度函数呈钟形曲线,两侧逐渐平缓衰减,分布的形状独特,使得其具有许多重要的性质。
3. 偏度和峰度:正态分布的偏度(skewness)为0,表示分布的对称性;峰度(kurtosis)为3,表示分布比较平缓。
4. 边缘分布:正态分布具有边缘分布的性质,在多维情况下,边缘分布为正态分布。
正态分布的这些特性使得它成为了统计学和概率论中极为重要的概率分布,被广泛应用于假设检验、置信区间估计、回归分析、贝叶斯分析等统计方法。
三、正态分布的应用正态分布在实际应用中具有广泛的意义,涉及到许多不同领域。
第五章数理统计的基本概念和抽样分布精品PPT课件
n
pn(x1,x2, ,xn)
p(xi)
n
xi
en
i1
,
xi 0
i1
0,
其它
Байду номын сангаас
例2 设总 X服 体从两B(点 1,p)分 其 , 0 布 中 p1, (X1,X2, ,Xn)是来自总 ,求 体样 的 (X1本 ,X 样 2, 本 ,Xn)的分.布律
解 总体X的分布律为 P {X i} p i(1 p )1 i (i0,1)
设 x1,x2, ,xn是 相 应X于 1,X2,样 ,Xn 本 的 样,则 本称 f值 (x1,x2, ,xn)是f(X1,X2, ,Xn) 的 观.察 值
例1 设X1,X2,X3是来自N 总 (体 ,2)的一个 样本 ,其中 为已,知 2为未,判 知断下列各式
些是统,计 哪量 些不 ? 是
T1X1,
函数F(x)称为一个总体.
定义5.2
设X是 具 有 分F布 (x)函 的数 随 机,若 变X量 , X,, Xn是 具 有 同 一 F 分(x)布 、函 相数 互 独 立 的 随 机 变 ,则量称 X, X,, Xn为 从 总 X(或 体总 体
F(x))中 抽 取 的n容 的量 简为 单 随,机 简样 称 样本本 .
其 x 1 ,x 中 2 , ,x n 在{ 0 集 ,1 }中 合 .取值
三、统计量
由样本推断总体特征,需要对样本进行 “加工”,“提炼”.这就需要构造一些样本的 函 数1,它. 统把计样量本的中定所义含5的.3 信息集中起来.
设X1,X2,,Xn是来自X 总的体一个,样本 f(X1,X2,,Xn)是X1,X2,,Xn的函,若 数f中 不含未知, 则 参称 数 f(X1,X2,,Xn)是一个统 计量 .
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
概率论与数理统计教案统计量和抽样分布
一、统计量和抽样分布的概念介绍1.1 统计量的定义讲解统计量的概念,即根据样本数据所定义的量,用来描述样本的某些特征。
例如,样本均值、样本方差等。
1.2 抽样分布的定义解释抽样分布是指在一定的抽样方法下,统计量的概率分布。
例如,正态分布、t分布等。
二、统计量的估计方法2.1 点估计介绍点估计的概念,即用一个具体的数值来估计总体参数。
例如,用样本均值来估计总体均值。
2.2 区间估计讲解区间估计的方法,即根据样本数据,给出总体参数估计的一个区间,该区间以一定的概率包含总体参数。
例如,置信区间。
三、抽样分布的性质及应用3.1 抽样分布的性质讲解抽样分布的一些基本性质,如独立性、对称性、无偏性等。
3.2 抽样分布的应用介绍抽样分布在实际问题中的应用,如利用抽样分布来判断总体均值的假设检验问题。
四、假设检验的基本概念和方法4.1 假设检验的定义解释假设检验是一种统计推断方法,通过观察样本数据,对总体参数的某个假设进行判断。
4.2 假设检验的方法讲解常见的假设检验方法,如单样本t检验、双样本t检验、卡方检验等。
4.3 假设检验的判断准则介绍假设检验的判断准则,如P值、显著性水平等,并解释其含义和作用。
六、正态分布及其应用6.1 正态分布的定义与性质详细介绍正态分布的概念、概率密度函数、累积分布函数以及其性质,如对称性、钟形曲线等。
6.2 标准正态分布解释标准正态分布的概念,即均值为0,标准差为1的正态分布。
讲解标准正态分布表的使用方法。
6.3 正态分布的应用介绍正态分布在实际问题中的应用,如利用正态分布来分析和估计总体均值、方差等参数。
七、t 分布及其应用7.1 t 分布的定义与性质讲解t 分布的概念、概率密度函数、累积分布函数以及其性质。
解释t 分布与正态分布的关系。
7.2 t 分布的自由度介绍t 分布的自由度概念,即样本量。
讲解自由度对t 分布形状的影响。
7.3 t 分布的应用介绍t 分布在实际问题中的应用,如利用t 分布进行小样本推断、假设检验等。
正态样本统计量的抽样分布概述
1
2
20
Xi
i1
X
2
35.2
P
1
2
20
Xi
i1
X
2
7.4
P
1
2
20
X
i1
i
X
2
35.2
查表
0.99 0.01 0.98
(P.386)
(2) 20 Xi 2 ~ 2 (20)
i1
故
P 0.37
2
1 20
20
Xi
i1
2
1.76
2
P 7.4
20
i1
Xi
2
35.2
(1)
求
P 0.37
2
1 20
20 i1
Xi
X
2
1.76
2
(2)
求
P 0.37
2
1 20
20 i1
Xi
2
1.76
2
解 (1)
(n
1)S 2
2
~
2(n
1)
即
19S 2
2
1
2
20 i 1
Xi X
2 ~ 2 (19)
故
P
0.37
2
1 20
20
Xi
i1
X
2
1.76
2
P 7.4
但
F0.95 (5, 4) ?
事实上,
F1
(n,
m)
F
1 (m,
n)
故
F0.95 (5,4)
1 F0.05 (4,5)
1 5.19
正态分布统计量
正态分布统计量
正态分布是统计学中最常见的分布之一,它的特点是呈钟形曲线,均值和标准差是其最重要的统计量。
正态分布的均值和标准差可以用来描述数据的中心位置和离散程度,因此在统计分析中非常重要。
均值是正态分布的中心位置,它表示数据的平均值。
均值越大,数据越偏向于右侧;均值越小,数据越偏向于左侧。
标准差是正态分布的离散程度,它表示数据的分散程度。
标准差越大,数据越分散;标准差越小,数据越集中。
在实际应用中,我们经常需要计算正态分布的均值和标准差。
例如,在财务分析中,我们需要计算公司的平均收入和标准差,以了解公司的经营状况;在医学研究中,我们需要计算药物的平均疗效和标准差,以评估药物的治疗效果。
除了均值和标准差,正态分布还有其他的统计量,例如中位数、众数、偏度和峰度等。
中位数是数据的中间值,它可以用来描述数据的集中趋势;众数是数据出现最频繁的值,它可以用来描述数据的典型值。
偏度是数据分布的偏斜程度,它可以用来描述数据的对称性;峰度是数据分布的峰态程度,它可以用来描述数据的尖锐程度。
正态分布的统计量是统计分析中非常重要的内容,它们可以用来描述数据的中心位置、离散程度、集中趋势、典型值、对称性和尖锐程度等方面。
在实际应用中,我们需要根据具体情况选择合适的统
计量,并进行相应的计算和分析,以便更好地理解数据的特征和规律。
正态分布知识点
正态分布知识点在统计学中,正态分布是一种极其重要的概率分布,它在许多领域都有着广泛的应用。
让我们一起来深入了解一下正态分布的相关知识。
正态分布也被称为高斯分布,其概率密度函数呈现出一种独特的钟形曲线。
这条曲线左右对称,中间高,两边逐渐降低并且无限趋近于横轴。
为什么正态分布如此重要呢?首先,它在自然界和社会现象中大量存在。
比如,人的身高、体重,学生的考试成绩,产品的质量指标等,很多都近似服从正态分布。
这是因为在许多情况下,众多微小的、相互独立的随机因素共同作用,最终导致了总体呈现出正态分布的特征。
正态分布具有两个关键参数:均值(μ)和标准差(σ)。
均值决定了曲线的中心位置,也就是分布的中心;标准差则决定了曲线的“胖瘦”程度。
标准差越大,曲线越“胖”,数据的离散程度越大;标准差越小,曲线越“瘦”,数据越集中在均值附近。
我们来具体说一说正态分布的性质。
正态分布的概率密度函数在均值处达到最大值。
而且,大约 68%的数据落在均值加减一个标准差的范围内,大约 95%的数据落在均值加减两个标准差的范围内,约 997%的数据落在均值加减三个标准差的范围内。
这就是所谓的“68-95-997规则”,它为我们快速估计数据的分布范围提供了很大的便利。
正态分布的数学表达式看起来可能有些复杂,但理解其背后的意义是关键。
从实际应用的角度来看,正态分布为我们提供了一种方便的方式来描述和分析大量的数据。
比如在教育领域,学生的考试成绩通常近似服从正态分布。
教师可以通过分析成绩的分布情况,了解学生的整体学习水平和差异程度。
如果成绩分布过于集中,可能意味着教学难度不够,无法区分学生的能力;如果分布过于分散,则可能需要反思教学方法是否存在问题。
在工业生产中,产品的质量指标如尺寸、重量等也常常符合正态分布。
通过控制生产过程中的各种因素,使质量指标的分布尽可能接近正态分布,并将均值调整到目标值,同时减小标准差,可以提高产品的一致性和质量稳定性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学第5-6章正态分布、统计量及其抽样分布第5-6章统计量及其抽样分布5.1正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量如果随机变量X的概率密度为22()21(),2xf x e xμσπσ--=-∞<<∞则称X服从正态分布。
记做2(,)X Nμσ:,读作:随机变量X服从均值为μ,方差为2σ的正态分布其中,μ-∞<<∞,是随机变量X的均值,0σ>是是随机变量X 的标准差5.1.2正态密度函数f(x)的一些特点:()0f x≥,即整个概率密度曲线都在x轴的上方。
曲线()f x相对于xμ=对称,并在xμ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,221()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()xϕ标准正态分布的分布函数:()xΦ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ:,则(0,1)XZ Nμσ-=:变量211(,)X Nμσ:与变量222(,)Y Nμσ:相互独立,则有221212+(+,+)X Y Nμμσσ:5.1.3 正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N :,求以下概率(1)( 1.5)P X <(2) (2)P X >(3)(13)P X -<≤(4)(2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)X N :,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例 设2(5,3)X N :,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤ (5)(59)P X -≤解:由2(5,3)X N :,5(0,1)3X N -: (1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2) 255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)X N μσ:,则有 ()()()b a P a X b μμσσ--<≤=Φ-Φ5.1.4 3σ准则若(0,1)X N :,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%至一般正态总体,即2(,)X N μσ:,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质设变量211(,)X N μσ:,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ:221212-(-,+)X Y N μμσσ:5.1.6 求分位数Z α设()0,1X N :()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==5.2 由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,n X X X L 相互独立,且(0,1)i X N :(1,2,,)i n =L ,则它们的平方和服从自由度为n 的2x分布。
记做,22()i Xn χ∑:2 2x 分布的密度函数图形图形特点:(1)2x分布的变量值始终为正。
(2)2x分布的形状取决于其自由度n 的大小,通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称。
(3)2x分布的期望为2()E n χ=,方差为2()2D n χ=(n 为自由度)。
(4)2x分布具有可加性。
若X Y与是相互独立的随机变量, 21~(),X x n 22~()Y x n ,则它们的和服从于自由度为12n n +的2x分布,即212~()X Y x n n ++。
32x分布临界值表的使用,求得2x分布的分位数2x分布临界值表中给出的是概率为α时,2x α的取值,k 是自由度。
222()()x P x x f x dx ααα+∞≥==⎰x α例如,若随机变量2(10)X χ:,则查表可得20.05(10) 3.94χ=,20.95(10)18.307χ=,5.2.2 t 分布(student 分布)设随机变量,X Y互相独立,2~(0,1),~()X N Y x n ,则随机变量~()X t t n =——自由度为n 的t 分布t 分布概率密度函数图特点:① 关于y 轴对称,与标准正态分布的密度函数的图像非常相似。
② 厚尾:当x →∞时,t 分布的密度函数趋于0的速度要比标准正态分布密度函数慢,所以t 分布的密度函数的尾部要比(0,1)N 密度的尾部厚些。
③ 当自由度n 无限增大时,t 分布将趋近于标准正态分布。
所以,当n 很大时,t 分布可以用标准正态分布近似。
记()t n α为分布()t n 的α分位数。
在实际使用中,当30n ≥,就近似有 ()t n Z αα≈α由于t 分布密度曲线的对称性,可得1()()t n t n αα-=-例如,若随机变量(15)T t :,查表可得,0.05(15) 1.7531t =,而0.950.05(15)(15) 1.76531tt =-=-0.05(40) 1.6839t =,0.05(45) 1.6794t = 0.95 1.645Z =可见随着自由度n 的增大,t 分位数与z 分位数越来越接近。
5.2.3 F分布设随机变量X与Y相互独立且分别服从自由度为m和n的2χ分布。
则随机变量//X mFY n=服从第一自由度为m第二自由度为n的F分布。
记为()F F m n:,xF分布的概率密度函数的图设随机变量(,) F F m n :,(,)F m nα表示分布(,)F m n的α分位数,α可以证明11(,)(,)F m n F n m αα-=例如查表得0.95F (8,9)=3.23,则0.050.950.31F F =11(9,8)==(8,9) 3.235.6 小概率原理指发生概率很小的随机事件在一次实验中几乎不可能出现。
6.1 统计量定义:设12,,,n X X X L 是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个不依赖于任何未知参数的函数12(,,,)n T X X X L ,则称函数12(,,,)n T X X X L 是一个统计量。
特点:由样本构造而得,是样本的函数 不含任何未知的参数当获得样本的一组具体观测值12(,,,)n x x x L ,带入T,计算出12(,,,)n T x x x L 的数值,称为统计量的值常用的统计量2,X S6.2 抽样分布抽样分布:统计量的分布 随机变量X精确分布:可以得到分布的数学表达式渐近分布:难以得到精确分布时,借助于极限工具,求得抽样分布的近似分布,称为渐近分布。
定理1:设()12,,,n X X X L 是取自总体X的一个样本,记()i E X μ=,2()i D X σ=,那么①()E X μ=,2()D X nσ=②22()E sσ=,221()nn E s nσ-= ③ 当n →∞时,PX μ−−→ lim ()1n P X με→∞-<=④ 当n →∞时,22P s σ−−→,22P n s σ−−→定理2:设()12,,,n X X X L 是取自正态总体2(,)N μσ的一个样本 ①2(,)X N n σμ:,或等价地(0,1)X N μ-:② 2222222()(1)(1)in X X nsn sn χσσσ--==-∑:③ X与2s相互独立推论1:设()12,,,nX X XL是取自正态总体2(,)Nμσ的一个样本,那么(1)Xt nμ--:简要证明:2(,)X Nμσ:(0,1)XN⇒:222(1)(1)n snχσ--:(1)Xt n-⇒-:独立(t分布的定义)即(1)Xt nμ--:推论2设()12,,,mX X XL是取自正态总体211(,)Nμσ的一个样本,()12,,,nY Y YL是取自正态总体222(,)Nμσ的一个样本,X与Y 相互独立,那么()()(0,1)X Y N μμ---:简要证明:211(,)X N μσ:211(,)X N m σμ⇒:222(,)Y N μσ:222(,)Y N nσμ⇒:独立,221212(,)X Y N mnσσμμ--+:12()()(0,1)X Y N μμ---:推论3:设()12,,,m X X X L 是取自正态总体21(,)N μσ的一个样本,()12,,,n Y Y Y L 是取自正态总体22(,)N μσ的一个样本,X 与Y 相互独立,那么()()(2)X Y t m n μμ---+-:其中,22212(1)(1)(2)pm s n s s m n -+-=+-简要证明:21(,)X N μσ:21(,)X N mσμ⇒:22(,)Y N μσ:22(,)Y N nσμ⇒:独立,2212(,)X Y N mnσσμμ--+:2212(1)(1)m sm χσ--:2222(1)(1)n sn χσ--:可加性2221222(1)(1)(2)m sn sm n χσσ--++-:()()(2)X Y t m n μμ---⇒+-:整理得()()(2)X Y t m n μμ---⇒+-:设22212(1)(1)(2)pm s n s s m n -+-=+-即()()(2)X Y t m n μμ---+-:推论4:设()12,,,m X X X L 是取自正态总体211(,)N μσ的一个样本, ()12,,,n Y Y Y L 是取自正态总体222(,)N μσ的一个样本,X与Y 相互独立,那么22112222/(1,1)/s F m n s σσ--: 简要证明:正态 211(,)X N μσ:22121(1)(1)m s m χσ-⇒-: 222(,)Y N μσ:22222(1)(1)n s n χσ-⇒-: 21212222(1)/(1)(1,1)(1)/(1)m s m F m n n s n σσ--⇒----: 即 22112222/(1,1)/s F m n s σσ--:非正态总体的情形定理:设()12,,,n X X X L 是取自总体X 的一个样本,当n 较大时,近似地有①(0,1) XNμ-:②(0,1) XNμ-:。