概率论与数据分析第六章详解演示文稿
合集下载
概率论与数理统计教程第二版茆诗松课件PPT第六章
( 其中 是 可能的取值范围)
ˆ 与样本值 x1 , x2 ,, xn 有关, 记为 这样得到的 ˆ ( x1 , x2 ,, xn ), 参数 的最大似然估计值 ,
ˆ ( X 1 , X 2 , , X n ) 参数 的最大似然估计量 .
12 April 2016
L( ) 1
n
I
i 1
n
{0 xi }
1
n
I{ x
( n ) }
要使L( )达到最大,首先一点是示性函数取值 n n 应该为1,其次是1/ 尽可能大。由于1/ 是 的单调减函数,所以 的取值应尽可能小,但 示性函数为1决定了 不能小于x(n),由此给出 的极大似然估计 ˆ x( n ) 。
经计算有
x 28.695,
2 sn 0.9185,源自m0.5 28.6由此给出总体均值、方差和中位数的估计分别 为: 28.695, 0.9185 和 28.6。 矩法估计的实质是用经验分布函数去替换总体 分布,其理论基础是格里纹科定理。
12 April 2016
第六章 参数估计
第6页
二、概率函数P(x,θ)已知时未知参数的矩法估计 设总体具有已知的概率函数 P(x, 1, …, k), x1, x2 , …, xn 是样本,假定总体的k阶原点矩k 存在,若1, …, k 能够表示成 1, …, k 的函数 j = j(1, …,k),则可给出诸j 的矩法估计为
数作出估计。
参数估计的形式有两种:点估计与区间估计。
12 April 2016
第六章 参数估计
第3页
设 x1, x2,…, xn 是来自总体 X 的一个样本,
ˆ ˆ( x ,, x ) 我们用一个统计量 的 1 n ˆ 取值作为 的估计值, 称为 的点估计 ˆ (量),简称估计。在这里如何构造统计量 并没有明确的规定,只要它满足一定的合理 性即可。这就涉及到两个问题:
ˆ 与样本值 x1 , x2 ,, xn 有关, 记为 这样得到的 ˆ ( x1 , x2 ,, xn ), 参数 的最大似然估计值 ,
ˆ ( X 1 , X 2 , , X n ) 参数 的最大似然估计量 .
12 April 2016
L( ) 1
n
I
i 1
n
{0 xi }
1
n
I{ x
( n ) }
要使L( )达到最大,首先一点是示性函数取值 n n 应该为1,其次是1/ 尽可能大。由于1/ 是 的单调减函数,所以 的取值应尽可能小,但 示性函数为1决定了 不能小于x(n),由此给出 的极大似然估计 ˆ x( n ) 。
经计算有
x 28.695,
2 sn 0.9185,源自m0.5 28.6由此给出总体均值、方差和中位数的估计分别 为: 28.695, 0.9185 和 28.6。 矩法估计的实质是用经验分布函数去替换总体 分布,其理论基础是格里纹科定理。
12 April 2016
第六章 参数估计
第6页
二、概率函数P(x,θ)已知时未知参数的矩法估计 设总体具有已知的概率函数 P(x, 1, …, k), x1, x2 , …, xn 是样本,假定总体的k阶原点矩k 存在,若1, …, k 能够表示成 1, …, k 的函数 j = j(1, …,k),则可给出诸j 的矩法估计为
数作出估计。
参数估计的形式有两种:点估计与区间估计。
12 April 2016
第六章 参数估计
第3页
设 x1, x2,…, xn 是来自总体 X 的一个样本,
ˆ ˆ( x ,, x ) 我们用一个统计量 的 1 n ˆ 取值作为 的估计值, 称为 的点估计 ˆ (量),简称估计。在这里如何构造统计量 并没有明确的规定,只要它满足一定的合理 性即可。这就涉及到两个问题:
华东理工大学概率论与数理统计课件第六章
得方程组
解得
ˆ X 3B ˆ X 3B2 , b a 2
2 最大似然估计法 (1) 似然函数(样本的联合密度函数) 设总体X为连续型,X~f(x;θ1,θ2,…θm), θi为待估 参数(i=1,2,…,m),X1,X2,…,Xn为来自该总体的样本,则 Xi~f(xi;θ1,θ2,…θm), (i=1,2,…,m) (X1,X2,…,Xn)的联合密度函数为 (似然函数)
例 设总体
1 1 0
的概率分布为
P{ k}
-1
(1 )
0
(1 ) 2
1
其中, ( 0 1 )是未知参数,已知有样本观测值 -1,0,0,0,0,1,1,1 。 (1)求 的矩法估计值; (2)求 的极大似然估计值。
x 1. (1) x EX 2 x , 取 2 (2) L (1 )(1 )8 3 , ln L 4 ln 9 ln(1 ),
1
)
1
例:设X服从[0,θ]区间上的均匀分布,参数
θ>0,求θ的最大似然估计.
解 由题意得:
1 X ~ f ( x; ) 0
0 x 其它
L( x1 , x2 ,..., xn ; )
1 n 0
0 x1 , x2 ,..., xn 其它
是来自总体的一个容量为设总体分布中含有未知参数根据来自该总体的srs如果能够找到两个统计量使得随机区间包含达到一定的把握那么便称该随机区间为未知参数的区间估计
第6章 参数估计
• 点估计法 • 期望与方差的点估计 • 期望、方差的区间估计
概率论与数理统计PPT课件(共8章)第六章 数理统计的基本概念
代表性
每个样本Xi(i=1,2,…,n)与 总体X具有相同的分布
独立性
各个样本X1,X2,…,Xn的取 值互不影响,即X1,X2,…,Xn是 相互独立的随机变量.
6.1.3 样本的联合分布
若 X1 ,X2 , ,Xn 为总体 X 的一个样本, X 的分布函数为 F(x) ,则 X1 ,X2 , ,Xn
n
n
xi
n xi
p i1 (1 p) i1 ,
概
率
论
与
数 理
6.2
统
计
统计量与抽样分布
6.2.1 统计量
定义 6.2 不含任何未知参数的样本 X1 ,X2 , ,Xn 的连续函数 g(X1 ,X2 , ,Xn )
称为统计量.
下面列出一些常用的统计量.
(1)样本均值
X
1 n
n i1
Xi
(2)样本方差
概
率
论
与
数
理 统 计
数理统计的基本概念
第六章
概
率
论
与
数
理 统
壹 总体与样本
计
贰 统计量与抽样分布
目录
概
率
论
与
数 理
6.1
统
计
总体与样本
总体与个体
6.1.1 总体
在数理统计中,通常把研究对象的全体称为总体,把构 成总体的每个研究对象称为个体.
总体分布
为了便于数学上的处理,我们将总体定义为随机变量, 记作.随机变量的分布称为总体分布.
N
(1
,12
)
与
N
(2
,
2 2
)
的样本,且这两个样本相互独立.设
[学习]概率论与数理统计课件第6章
为样本,构造一个统计量 (X1, X2, , Xn ) 来估计 参数,则称 (X1, X2, , Xn ) 为参数的估计量。
将样本观测值 x1, x2 , , xn 代入 (X1, X2, , Xn ) , 得到的值 (x1, x2, , xn ) 称为参数的估计值。
点估计(point estimation) :如果构造一个统计量
设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,…,Xn)确定两个统计量
1( X1,X2,…,Xn ), 2( X1,X2,…,Xn ), 使得P{1 << 2}=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。
1——置信下限 2——置信上限
几点说明
或 Uk (1,2,
,m )
1 n
n i 1
(Xi
X )k
(k 1, 2,
, m)
得m个方程构成方程组,解得的 1,2, ,m 即为参数 1,2 , ,m的矩估计量,代入样本观测值,即得参数
的矩估计值。
例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,…,Xn为样本,试求和2的矩估计量。
X
1 n
n i 1
Xi
2
1 n
n i 1
(Xi
X )2
S
2 n
估计值为
x
1 n
n i 1
xi
2
1 n
n i 1
( xi
x )2
例3 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。
(1) X ~ N , 2 (2)X ~ B N, p(N已知)(3)X ~ P()
将样本观测值 x1, x2 , , xn 代入 (X1, X2, , Xn ) , 得到的值 (x1, x2, , xn ) 称为参数的估计值。
点估计(point estimation) :如果构造一个统计量
设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,…,Xn)确定两个统计量
1( X1,X2,…,Xn ), 2( X1,X2,…,Xn ), 使得P{1 << 2}=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。
1——置信下限 2——置信上限
几点说明
或 Uk (1,2,
,m )
1 n
n i 1
(Xi
X )k
(k 1, 2,
, m)
得m个方程构成方程组,解得的 1,2, ,m 即为参数 1,2 , ,m的矩估计量,代入样本观测值,即得参数
的矩估计值。
例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,…,Xn为样本,试求和2的矩估计量。
X
1 n
n i 1
Xi
2
1 n
n i 1
(Xi
X )2
S
2 n
估计值为
x
1 n
n i 1
xi
2
1 n
n i 1
( xi
x )2
例3 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。
(1) X ~ N , 2 (2)X ~ B N, p(N已知)(3)X ~ P()
概率论与数理统计第六章第七章
二、常用的统计量
设 X1, X 2 ,, X n 是来自总体X的一个样本, X1, X 2 ,, X n 是
这一样本的观察值。定义:
样本平均值(Sample mean) 样本方差(Sample variance)
X
1 n
n i 1
Xi
S 2
1 n -1
n i 1
(Xi
X )2
Sn2
1 n
n i 1
y2 e 2,
y
0
0,
其它
二、 2 分布
2. 2 分布的性质 (1) 2 分布的可加性
设 12 ~ 2 (n1 ), 2 2~(2 n 2 )
并且 12 , 2 2 相互独立,则有
12 2 2~(2 n1 n 2 )
二、 2 分布
(2) 2 分布的数学期望和方差
若 2 ~ 2 (n)
n i1
Xi
1 n
n i1
E( X i )
D 1 n
n i1
Xi
1 n2
n i1
D(Xi )
1 n2
nC C n
1
P
1 n
n i 1
Xi
1 n
n i 1
E( Xi )
1
1
2
D 1 n
n i 1
Xi 1
C
n 2
1
四、辛钦(Khinchin)大数定律 (独立同分布随机变量序列的大数定律)
P 16 Xi 1920 1 P 16 Xi 1920
i1
i1
1 (0.8) 0.2119
因此,这16只元件的寿命的总和大于1920小时的概率近 似为0.2119。
第七章 数理统计的基本概念
大学课件概率论第6章数理统计的基本概念
=
(n
n! k )!(k
1)
[ !
FX
( x)]k 1[1
FX
( x)]nk
fX
( x)x,
故有
f X(k )
(x)
n! (n k)!(k
1)![FX
( x)]k 1[1
FX
( x)]nk
fX
(x).
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
2分布 t 分布 数理统计的三大分布(都是连续型). F分布
2
n 2
1
n 2
x
n 1 x
2 e2
,
0,
x0 x0
其中Gamma函数 Γ(x) 通过下面积分定义
(x) ett x1dt, x 0 0
(x 1) x(x),
(n 1) n!,
(1) 1,
1 2
π
一般的,若X的分布密度函数为
fX
(x)
(
)
x 1ex
0
x0 其他
则称X服从参数为 α>0和λ>0的Γ分布,记为X~ Γ(α, λ)。 Γ分布的数学期望和方差为
1)
[ !
FX
(x)]k1[1 FX
( x)]nk
fX
(x)
其中k 1, 2,..., n. 特别地,有 fX(1) (x) n[1 FX (x)]n1 fX (x), fX(n) (x) n[FX (x)]n1 fX (x).
证明: x(k)落在[x, x x]这个区间的概率近似为
f X(k) (x)x Cn1Cnk11[FX (x)]k1[1 FX (x x)]nk f X (x)x
《概率论与数理统计教学课件》6第六章.ppt
一. 总体和个体 定义 将研究对象的某项数量指标的值的全体称
为总体(母体);将总体中的每个元素称为 个体 例1.(1) 当研究某地区中职工收入平均水平时,这地区 所有职工的月收入组成了总体;而每个职工月 收入就是个体。
(2) 研究某批灯泡的质量,则该批灯泡寿命的全体 就组成了总体;而每个灯泡的寿命就是个体。
概率统计
随机抽样法
在概率论中所研究和讨论的随机变量,它的分布 都是已知的,在这前提下去进一步的研究它的性质、 特点和规律性。而在数理统计中所研究和讨论的随机 变量,它的分布是未知的或不完全知道的。于是就必 须通过对所研究和讨论的随机变量进行重复独立的观 察和试验,得到许多观察值(数据),对这些数据进行 分析后才能对其分布作出种种判断。得到这些数据最 常用的方法是----随机抽样法。
的个 数是有限) 和 无限总体(个体的个数是无 限的)。但当有限总体它所含的个体的个 数很 大时也可视其为无限总体。
概率统计
二. 抽样和样本
抽样
为推断总体分布及各种特征,按一定规则 从总体中抽取若干个体进行观察试验,以
获得有关总体的信息,这一抽取过程称为
“抽样”,所抽取的部分个体称为 样本,
样本中所包含的个体数目称为 样本容量。 例如:
同时随着计算机的诞生与发展,为数据处 理提供了强有力的技术支持,这就导致了数理 统计与计算机结合的必然的发展趋势。
目前国内外著名的统计软件包:R, SAS,SPSS, STAT 等,都提供了快速、简便地进行数据处理 和分析的方法与工具。
概率统计
数理统计研究的对象 --- 带有随机性的数据
数理统计的任务 数理统计学是一门应用性很强的学科, 它
从某批国产轿车中抽 5 辆进行耗油量试验。 这一过程即为“抽样”
为总体(母体);将总体中的每个元素称为 个体 例1.(1) 当研究某地区中职工收入平均水平时,这地区 所有职工的月收入组成了总体;而每个职工月 收入就是个体。
(2) 研究某批灯泡的质量,则该批灯泡寿命的全体 就组成了总体;而每个灯泡的寿命就是个体。
概率统计
随机抽样法
在概率论中所研究和讨论的随机变量,它的分布 都是已知的,在这前提下去进一步的研究它的性质、 特点和规律性。而在数理统计中所研究和讨论的随机 变量,它的分布是未知的或不完全知道的。于是就必 须通过对所研究和讨论的随机变量进行重复独立的观 察和试验,得到许多观察值(数据),对这些数据进行 分析后才能对其分布作出种种判断。得到这些数据最 常用的方法是----随机抽样法。
的个 数是有限) 和 无限总体(个体的个数是无 限的)。但当有限总体它所含的个体的个 数很 大时也可视其为无限总体。
概率统计
二. 抽样和样本
抽样
为推断总体分布及各种特征,按一定规则 从总体中抽取若干个体进行观察试验,以
获得有关总体的信息,这一抽取过程称为
“抽样”,所抽取的部分个体称为 样本,
样本中所包含的个体数目称为 样本容量。 例如:
同时随着计算机的诞生与发展,为数据处 理提供了强有力的技术支持,这就导致了数理 统计与计算机结合的必然的发展趋势。
目前国内外著名的统计软件包:R, SAS,SPSS, STAT 等,都提供了快速、简便地进行数据处理 和分析的方法与工具。
概率统计
数理统计研究的对象 --- 带有随机性的数据
数理统计的任务 数理统计学是一门应用性很强的学科, 它
从某批国产轿车中抽 5 辆进行耗油量试验。 这一过程即为“抽样”
概率论与数理统计第六章样本与抽样分布-PPT精品文档
总体
…
研究某批灯泡的质量
2019年3月25日星期一 3
§6.1 总体与个体 2. 有限总体和无限总体
总体容量有限的成为有限总体 总体容量无限的称为无限总体 定义2:样本中所包含的个体数目n称为样本容量。
注:当有限总体包含的个体的总数很大时, 可近似地 将它看成是无限总体.
2019年3月25日星期一
统计中,总体这个概念 的要旨是:总体就是一个 概率分布.
2019年3月25日星期一 9
§6.1 总体与个体 二. 样本 为推断总体分布及各种特征,按一定规则从 总体中抽取若干个体进行观察试验,以获得有关 总体的信息,这一抽取过程称为 “抽样”,所抽 取的部分个体称为样本. 样本中所包含的个体数 目称为样本容量.
§6.1 总体与个体 例1-1:已知总体X服从参数为 的泊松分布,求样本
的联合分布律.
解 总体 X 的分布律为
x P{X x} e x! ,
x 0, 1, 2, ,
2019年3月25日星期一
17
§6.1 总体与个体
所以样本 X1 , X 2 ,
, X n 的联合分布律为
某批 灯泡的寿命
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
8
2019年3月25日星期一
§6.1 总体与个体 类似地,在研究某地区中学生的营养状 况时,若关心的数量指标是身高和体重,我 们用X和Y分别表示身高和体重,那么此总体 就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.
,x ) Fx ( i) n
i 1
13
n
§6.1 总体与个体 若连续总体的概率密度函数为f (x) , 则其样本的联合概率密度函数为
【精品】概率论与数理统计PPT课件第六章 描述性统计
但它们是并列的两个学科,并无 从属关系 .
5
• 数理统计
收集数据、整理数据、分析数据并对数 据分析结果做出解释
• 应用领域
➢精算 ➢金融 ➢生物 ➢工程技术 ➢质量控制 ➢可靠性…
6
第六章 描述性统计
统计学的做法分为两种: 描述性统计 推断性统计
7
§6.1 总体和参数
A. 总体、个体和均值 所要调查的对象全体叫做总体(population), 总体中每个成员叫做个体。 总体一般用随机变量作为数学模型。 总体参数是描述总体特性的指标,简称参数。
和样本方差
1 n
x n i1 xi
s2 1 n n 1 i1
2
xi x
s= s2 称为样本标准差。
12
§6.2 抽样调查方法
A. 抽样调查的可行性和必要性 抽样的可行性:汤的例子 样本的随机性(代表性) 适当的样本量。 样本量不必随总体增大而增大。
13
为了从样本推断总体的情况,样本的代表性是最关键 的问题。 调查全部总体不现实或不必要,如: 寿命试验。 抽样调查因为工作量较小所以有时比普查可以更准确
2
到了十九世纪末二十世纪初,随 着近代数学和概率论的发展,才真正 诞生了数理统计学这门学科
3
数理统计研究的任务 对随机现象进行试验或观测,以
有效的方式收集、 整理和分析带有 随机性的数据,以便对所考察的问 题作出推断和预测,直至为采取一 定的决策和行动提供依据和建议.
4
概率论是数理统计的基础,而 数理统计是概率论的重要应用.
从总体 X 中等可能地随机抽取,不论是有放回还是 无放回,得到的 X1, X2, …, Xn看成随机变量,都可以
证明 EX 。
5
• 数理统计
收集数据、整理数据、分析数据并对数 据分析结果做出解释
• 应用领域
➢精算 ➢金融 ➢生物 ➢工程技术 ➢质量控制 ➢可靠性…
6
第六章 描述性统计
统计学的做法分为两种: 描述性统计 推断性统计
7
§6.1 总体和参数
A. 总体、个体和均值 所要调查的对象全体叫做总体(population), 总体中每个成员叫做个体。 总体一般用随机变量作为数学模型。 总体参数是描述总体特性的指标,简称参数。
和样本方差
1 n
x n i1 xi
s2 1 n n 1 i1
2
xi x
s= s2 称为样本标准差。
12
§6.2 抽样调查方法
A. 抽样调查的可行性和必要性 抽样的可行性:汤的例子 样本的随机性(代表性) 适当的样本量。 样本量不必随总体增大而增大。
13
为了从样本推断总体的情况,样本的代表性是最关键 的问题。 调查全部总体不现实或不必要,如: 寿命试验。 抽样调查因为工作量较小所以有时比普查可以更准确
2
到了十九世纪末二十世纪初,随 着近代数学和概率论的发展,才真正 诞生了数理统计学这门学科
3
数理统计研究的任务 对随机现象进行试验或观测,以
有效的方式收集、 整理和分析带有 随机性的数据,以便对所考察的问 题作出推断和预测,直至为采取一 定的决策和行动提供依据和建议.
4
概率论是数理统计的基础,而 数理统计是概率论的重要应用.
从总体 X 中等可能地随机抽取,不论是有放回还是 无放回,得到的 X1, X2, …, Xn看成随机变量,都可以
证明 EX 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.总 体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母 体), 总体中每个成员称为个体.
总体
…
研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅是 关心其每个个体的一项(或几项)数量指标和该 数量指标在总体中的分布情况. 这时,每个个 体具有的数量指标的全体就是总体.
某批 灯泡的寿命
样本,其中为未知参数,则X1/,
X1 X 2 不 是 统 计 量,
2
而X 1
X2,
X
2 1
X
2 2
3,
X1
2X 2都是统计量.
•*注意: 统计量是独立同分布随机变量X1,X2…Xn 的函数,因而它也是一个随机变量.
2. 几种重要的统计量
设(X1,X2,Xn)为总体X的样本,则
1 n
X n i1 X i
当n次抽取或观察一经完成,我们就得到一组实
数(x1,x2,…,xn),称其为样本观察值或样本值.
二、统计量(statistic) 1 、统计量定义:
设(X1,X2…Xn) 是X的样本,则由X1,X2…Xn构造 出来的、不包含任何未知参数的函数:g (X1,X2…Xn) 称为统计量. 例 设(X1,X2)是从总体N(,2)中抽取的一个容量为2的
α
其中 (z ) 1
zα
X
样本均值 X 的分布
设X~N(,2),(X1,X2…Xn)是它的一个样本,
1 n
X n i1 X i
那么有 X ~ N (, 2 )
n
证: 由概率论的知识知, X 服从正态分布.
E( X )
1 E(
n
n i 1
Xi )
1 n
n i 1
E(Xi )
1 n
的概率,根据性质(2)有 P X 0.3 P 0.3 X 0.3
P
0.3
/ n
X / n
0.3
/
n
0.3
/ n
0.3
/ n
2 0.3 1 2(1.5) 1 0.8664 1/ 25
对于装25瓶的一箱而言,平均每瓶灌装量与标定值之差不超过 0.3毫升的概率近似为0.8664.
• 当有限总体包含的个体的总数很大时, 可近似地将它看成是无限总体。
2.抽样:为了推断总体的性态而从总体中抽取部分个体的 过程称为抽样.
3.样本:设从总体X中随机抽取或观察n个个体X1,X2…Xn,所 得的这一组个体(X1,X2…Xn)称为总体X的一个样本.其中个
体的数目n称为样本容量.
注意:
在抽取或观察每个个体之前, X1,X2…Xn都是 未知的,因而它们都是随机变量,(X1,X2…Xn) 为n维随机变量.
2(n) 的密度曲线
f(x) n=1
n=4
n=10
X
随着n的增大,密度曲线逐渐趋于平缓
2分布的性质:
①设Y~ 2(n), 则 E(Y)=n, D(Y)=2n
Байду номын сангаас
②设Y1~2(nY1)1,+YY2~2 ~2(2n(n2)1,+且nY2)1,,(Y可2加相性互)独立,则
如:研究某批灯泡的寿命时,关心的数量 指标就是寿命,那么,此总体就可以用随机 变量X表示,或用其分布函数F(x)表示.
总体
寿命X可用一概 F(x) 率分布来刻划
• 有限总体和无限总体
• 实例 研究某灯泡厂1000只同一型号灯泡 的寿命,这1000只灯泡的寿命就是总体, 且为有限总体,而每一只灯泡的寿命就是 个体. 如果研究该工厂所有灯泡的寿命,那 么所有灯泡的寿命组成的总体为无限总体。
概率论与数据分析第六章详解 演示文稿
优选概率论与数据分析第六章
• 第一节 数理统计的基本概念 • 第二节 点估计(point estimate) • 第三节 区间估计(interval estimate)
§1 数理统计的基本概念
一、总体和样本 二、统计量及其分布 三、正态总体的抽样分布
一、总体和样本
S 2
1 n1
n i 1
(Xi
X )2
样本均值; 样本方差;
S
1 n1
n i 1
(Xi
X )2
样本标准差
M k
1 n
n i 1
Xik, k
1,2,
M k
1 n
n
(Xi
i 1
X )k , k
1,2,
样本k阶(原点)矩 样本k阶中心矩
当 (X1,X2,…,Xn)的观察值为(x1,x2,…,xn)时,上述统 计量的观察值分别为:
三、正态总体下的常用统计量及其分布
设总体X~N(μ,σ2),X1,X2,…,Xn为取自该总体X的样本. 几种常用统计量及统计四大分布
① 标准正态分布及其上侧α分位数
定义 设X~N(μ,σ2),则 若P(Z>zα)=α,
Z
X
~N(0,1),对任意0<α<1,
n
φ(x)
则称zα为标准正态分布
的上侧α分位数.
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗 油量的全体就是总体
由于每个个体的出现是随机的,即相应 的数量指标的出现带有随机性. 从而可把这 种数量指标看作一个随机变量,我们用一个 随机变量或其分布来描述总体。为此常用随 机变量的符号或分布的符号表示总体.
通常,我们用随机变量X,Y,Z等表示 总体。当我们呢说到总体,就是一个具 有确定概率分布的随机变量.
n
D( X ) D( 1
n
n
Xi)
i 1
1 n2
n
D( X i )
i 1
1 n2
n 2
2
n
统计量的分布(随机变量函数的分布)又称抽样 分布
② 2分布(第二大分布):
设 X ~ N(0,1) ,X1,X2,…,Xn是来自总体的一个样 本,则称统计量:
2
X
2 1
X
2 2
X
2 n
服从自由度为n的 2 分布,记为2~ 2(n)
1 n
x n i1 xi
•样本均值;
s 2
1 n1
n i 1
( xi
x)2
•样本方差;
s
1 n1
n i 1
( xi
x)2
•样本标准差
mk
1 n
n i 1
xik , k
1,2,
mk
1 n
n
( xi
i 1
x)k , k
1,2,
•样本k阶(原点)矩 •样本k阶中心矩
例1 某公司用机器向瓶子里灌装液体洗净剂,规定每瓶装
毫升,但实际灌装量有一定的波动,假定灌装量服从正态分布 N(, 2 ) ,方差 2 =1,如果每箱装25瓶这样的洗净剂,试问这
瓶洗净剂的平均每瓶灌装量与标定值 相差不超过0.3毫升
的概率是多少? 解 设25瓶洗净剂灌装量为 X1,X 2,,X 25 ,它们是来自均值为
方差为1的总体的样本,现在需要计算的是事件X 0.3
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母 体), 总体中每个成员称为个体.
总体
…
研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅是 关心其每个个体的一项(或几项)数量指标和该 数量指标在总体中的分布情况. 这时,每个个 体具有的数量指标的全体就是总体.
某批 灯泡的寿命
样本,其中为未知参数,则X1/,
X1 X 2 不 是 统 计 量,
2
而X 1
X2,
X
2 1
X
2 2
3,
X1
2X 2都是统计量.
•*注意: 统计量是独立同分布随机变量X1,X2…Xn 的函数,因而它也是一个随机变量.
2. 几种重要的统计量
设(X1,X2,Xn)为总体X的样本,则
1 n
X n i1 X i
当n次抽取或观察一经完成,我们就得到一组实
数(x1,x2,…,xn),称其为样本观察值或样本值.
二、统计量(statistic) 1 、统计量定义:
设(X1,X2…Xn) 是X的样本,则由X1,X2…Xn构造 出来的、不包含任何未知参数的函数:g (X1,X2…Xn) 称为统计量. 例 设(X1,X2)是从总体N(,2)中抽取的一个容量为2的
α
其中 (z ) 1
zα
X
样本均值 X 的分布
设X~N(,2),(X1,X2…Xn)是它的一个样本,
1 n
X n i1 X i
那么有 X ~ N (, 2 )
n
证: 由概率论的知识知, X 服从正态分布.
E( X )
1 E(
n
n i 1
Xi )
1 n
n i 1
E(Xi )
1 n
的概率,根据性质(2)有 P X 0.3 P 0.3 X 0.3
P
0.3
/ n
X / n
0.3
/
n
0.3
/ n
0.3
/ n
2 0.3 1 2(1.5) 1 0.8664 1/ 25
对于装25瓶的一箱而言,平均每瓶灌装量与标定值之差不超过 0.3毫升的概率近似为0.8664.
• 当有限总体包含的个体的总数很大时, 可近似地将它看成是无限总体。
2.抽样:为了推断总体的性态而从总体中抽取部分个体的 过程称为抽样.
3.样本:设从总体X中随机抽取或观察n个个体X1,X2…Xn,所 得的这一组个体(X1,X2…Xn)称为总体X的一个样本.其中个
体的数目n称为样本容量.
注意:
在抽取或观察每个个体之前, X1,X2…Xn都是 未知的,因而它们都是随机变量,(X1,X2…Xn) 为n维随机变量.
2(n) 的密度曲线
f(x) n=1
n=4
n=10
X
随着n的增大,密度曲线逐渐趋于平缓
2分布的性质:
①设Y~ 2(n), 则 E(Y)=n, D(Y)=2n
Байду номын сангаас
②设Y1~2(nY1)1,+YY2~2 ~2(2n(n2)1,+且nY2)1,,(Y可2加相性互)独立,则
如:研究某批灯泡的寿命时,关心的数量 指标就是寿命,那么,此总体就可以用随机 变量X表示,或用其分布函数F(x)表示.
总体
寿命X可用一概 F(x) 率分布来刻划
• 有限总体和无限总体
• 实例 研究某灯泡厂1000只同一型号灯泡 的寿命,这1000只灯泡的寿命就是总体, 且为有限总体,而每一只灯泡的寿命就是 个体. 如果研究该工厂所有灯泡的寿命,那 么所有灯泡的寿命组成的总体为无限总体。
概率论与数据分析第六章详解 演示文稿
优选概率论与数据分析第六章
• 第一节 数理统计的基本概念 • 第二节 点估计(point estimate) • 第三节 区间估计(interval estimate)
§1 数理统计的基本概念
一、总体和样本 二、统计量及其分布 三、正态总体的抽样分布
一、总体和样本
S 2
1 n1
n i 1
(Xi
X )2
样本均值; 样本方差;
S
1 n1
n i 1
(Xi
X )2
样本标准差
M k
1 n
n i 1
Xik, k
1,2,
M k
1 n
n
(Xi
i 1
X )k , k
1,2,
样本k阶(原点)矩 样本k阶中心矩
当 (X1,X2,…,Xn)的观察值为(x1,x2,…,xn)时,上述统 计量的观察值分别为:
三、正态总体下的常用统计量及其分布
设总体X~N(μ,σ2),X1,X2,…,Xn为取自该总体X的样本. 几种常用统计量及统计四大分布
① 标准正态分布及其上侧α分位数
定义 设X~N(μ,σ2),则 若P(Z>zα)=α,
Z
X
~N(0,1),对任意0<α<1,
n
φ(x)
则称zα为标准正态分布
的上侧α分位数.
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗 油量的全体就是总体
由于每个个体的出现是随机的,即相应 的数量指标的出现带有随机性. 从而可把这 种数量指标看作一个随机变量,我们用一个 随机变量或其分布来描述总体。为此常用随 机变量的符号或分布的符号表示总体.
通常,我们用随机变量X,Y,Z等表示 总体。当我们呢说到总体,就是一个具 有确定概率分布的随机变量.
n
D( X ) D( 1
n
n
Xi)
i 1
1 n2
n
D( X i )
i 1
1 n2
n 2
2
n
统计量的分布(随机变量函数的分布)又称抽样 分布
② 2分布(第二大分布):
设 X ~ N(0,1) ,X1,X2,…,Xn是来自总体的一个样 本,则称统计量:
2
X
2 1
X
2 2
X
2 n
服从自由度为n的 2 分布,记为2~ 2(n)
1 n
x n i1 xi
•样本均值;
s 2
1 n1
n i 1
( xi
x)2
•样本方差;
s
1 n1
n i 1
( xi
x)2
•样本标准差
mk
1 n
n i 1
xik , k
1,2,
mk
1 n
n
( xi
i 1
x)k , k
1,2,
•样本k阶(原点)矩 •样本k阶中心矩
例1 某公司用机器向瓶子里灌装液体洗净剂,规定每瓶装
毫升,但实际灌装量有一定的波动,假定灌装量服从正态分布 N(, 2 ) ,方差 2 =1,如果每箱装25瓶这样的洗净剂,试问这
瓶洗净剂的平均每瓶灌装量与标定值 相差不超过0.3毫升
的概率是多少? 解 设25瓶洗净剂灌装量为 X1,X 2,,X 25 ,它们是来自均值为
方差为1的总体的样本,现在需要计算的是事件X 0.3