概率论-样本与统计量、统计量的分布.
概率论与数理统计(06)第6章 统计量及其抽样分布
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计第六章统计量,样本及抽样分布
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
《概率论与数理统计》统计量及其分布
但数理统计以概率论为基础,更着重于根据试验得
到的数据来对研究对象的客观规律作出种种合理的估
计和判断.
4
第5章
统计量及其分布
数
描述统计学
理
对随机现象进行观测、试验, 以取得有代表
统
性的观测值.
计
的
推断统计学
分
对已取得的观测值进行整理、分析, 作出推
类
断、决策,从而找出所研究的对象的规律性.
O
5
n 10
10
15
20
x
32
01
抽样分布
2. t 分布
2
X
~
N
(0,1)
,
Y
~
x
(n),且X与Y 独立,则
设随机变量
X
T
Y /n
服从自由度为n的t分布,记为t(n).
性质 密度f(t)是偶函数,且t分布的极限分布是标准正
态分布.
33
01
抽样分布
t分布的密度函数
n 1
n 1
那么如何来利用样本呢?
列表?
画图?
统计量!
样本来自于总体,含有总体性质的信息,但较为分
散. 为了进行统计推断,需要把分散的信息进行整理,
针对不同的研究目的,构造不同的样本函数,这种函
数在统计学中称为统计量.
18
本讲内容
01
总体与个体
02
样本
03
统计量
03
统计量
3.统计量
统计量——不含有未知参数的样本函数
f ( x)
n1
n2
x
概率论 第六章 样本及抽样分布
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
自考概率论统计量及其分布
在有限总体中要得到简单样本, 必须进行重复抽样.但当总体中个体数相对于 注 样本容量充分大时,不重复抽样得到的样本也可近似看作简单样本.
第5页/共28页
三、样本的分布
设总体X的分布函数为F(x),(X1, X2, … , Xn)是来自总体的样本, 则(X1, X2, … , Xn)的分布函数为
F( x1, x2, … , xn ) = F(x1) F(x2) … F( xn) 离散型:X~P(X=xi)=pi i=1,2,…则样本(X1 ,X2 ,…,Xn)的分布为:
P(X1=x1,X2=x2,…Xn=xn)=P(X=x1)P(X=x2)…P(X=xn)
连续型: X ~f(x),则样本 (X1, X2, … , Xn) 的密度函数为: f (x1,x2, … , xn) = f(x1) f(x2) … f( xn)
样本从总体带出的信息
统计推断:分析样本数据
是分散的、零乱的 统计量 对总体的分布作出结论
样本二重性: 容量为n 的样本 (X1, X2, … , Xn)
试验后 ( x1, x2, …xn )
由于试验的随机性,样本是 n维随机变量
数据=样本观测值n维常 数向量
简单随机样本:设取自总体X的样本(X1, X2, … , Xn)满足: (1) 每个Xi 与总体X同分布(代表性); (2) X1, X2, … , Xn相互独立(独立性). 则称 样本(X1, X2, … , Xn) 为简单随机样本,简称为样本.
1 n1
n i1
(Xi
X
)2
样本标准差 : S
S2
1 n 1
n i1
(Xi
X
)2
样本k阶原点矩:
Ak
概率论与数理统计-第六章
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
《概率论与数理统计》第六章
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
概率论与数理统计第6章
以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X
与
i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
概率论第六章样本及抽样分布
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
概率与统计中的统计量与抽样分布
概率与统计中的统计量与抽样分布在概率与统计学中,统计量与抽样分布是两个重要的概念。
统计量是用来描述样本数据的特征,而抽样分布则是研究统计量在重复取样过程中的概率分布。
本文将介绍统计量和抽样分布的基本概念,并对其在概率与统计学中的应用进行讨论。
一、统计量的定义与分类统计量是用于对样本数据进行总结和描述的量。
它通过计算样本数据的函数得到,可以是一个数值、一个向量或一个矩阵。
常见的统计量包括样本均值、样本方差、样本标准差等。
样本均值是最常用的统计量之一,表示样本数据的平均水平。
对于一个具有n个观测值的样本,样本均值的计算公式为:1/n样本均值= Σ xi * -------i=1其中,xi表示第i个观测值。
样本方差是衡量样本数据分散程度的统计量。
它的计算公式为: 1/n样本方差 = Σ(xi - x)^2 * -------i=1其中,xi表示第i个观测值,x表示样本均值。
除了样本均值和样本方差,还有许多其他的统计量,如样本中位数、样本偏度、样本峰度等。
这些统计量在实际问题中起着重要的作用,可以帮助我们理解和分析数据。
二、抽样分布的基本概念抽样分布是指在某一总体中,从中抽取样本的所有可能组合,并计算其统计量的概率分布。
抽样分布的性质是概率论和数理统计中的重要内容。
它与样本容量、样本分布以及统计量的选择有关。
常见的抽样分布包括正态分布、t分布和F分布。
其中,正态分布是最重要和最常用的抽样分布,具有许多重要的性质。
对于均值为μ、方差为σ^2的正态总体,样本均值的抽样分布也服从正态分布,其均值为μ,方差为σ^2/n。
这一性质被称为中心极限定理,是许多统计推断方法的基础。
t分布是在样本容量较小、总体标准差未知的情况下使用的抽样分布。
t分布的形状与样本容量有关,当样本容量较大时,t分布逼近于标准正态分布。
F分布是用于比较两个样本方差是否显著不同的抽样分布。
F分布的形状取决于两个样本容量的大小,具有非对称的特点。
《概率论与数理统计》第5章 统计量及其分布
23 April 2012
第五章 统计量及其分布
第13页
例5.1.4 设有一批产品共N个,需要进行抽样检 验以了解其不合格品率p。现从中采取不放回 抽样抽出2个产品,这时,第二次抽到不合格 品的概率依赖于第一次抽到的是否是不合格 品,如果第一次抽到不合格品,则
23 April 2012
第五章 统计量及其分布
第9页
表5.1.2 100只元件的寿命数据
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192]
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
简单起见,无论是样本还是其观测值,样本一般 均用 x1, x2,… xn 表示,应能从上下文中加以区别。
23 April 2012
第五章 统计量及其分布
第7页
例5.1.2 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果:
其算术平方根也称为样本标准差。
23 April 2012
第五章 统计量及其分布
第26页
在这个定义中, ( xi x )2 称为偏差平方和, n1称为偏差平方和的自由度。其含义是:
在 x 确定后, n 个偏差 x1x, x2x, …, xnx 中
只有n1个数据可以自由变动,而第n个则不 能自由取值,因为 (xi x ) = 0 .
概率论常用统计分布
又因为 Xi ~ N (0, 1),
由定义
X
2 i
~
2 (1),
即
X
2 i
~
1 2
,
1 2
,
i 1, 2, L , n.
因为X1, X2, , Xn相互独立,
所以
X12 ,
X
2 2
,
,
X n2也相互独立,
根据 分布的可加性知
2 n
n i 1
Xi2
~
n 2
,
1 2
.
(3) 2 分布的性质
,
(n2 4)
3) 设F ~ F (n1, n2 ),则当n2 4时,对任意x有
lim P{F E(F ) x} x
1
e
t2 2
dt
n1
D(F )
2π
这说明F分布极限分布也是正态分布.
例4 已知 T ~ t(n),试证 T 2 ~ F (1,n).
证 因为 T ~ t(n), 由定义5.7有 T X Yn
可直接查表5 ~ 8.
F0.05(14,30) 2.31 .
F0.025(7,8) 4.90,
此外,还可利用关系
F1
( n1 ,
n2 )
F
1 (n2 ,
. n1 )
由F求得F1 .
如:
F0.95 (12,9)
1 F0.05(9, 12)
1 2.8
0.357 .
F1
( n1 ,
n2 )
F
1 (n2 ,
h(t)
n
2
πn
1 n
1
t2 n
n1
2
,
概率论数理统计基础知识第五章
C
]
(A)Y ~ 2 (n). (B)Y ~ 2 (n 1). (C)Y ~ F (n,1). (D)Y ~ F (1, n).
【例】设 随机变量X和Y都服从标准正态分布,则[ C ]
(A)X+Y服从正态分布.
2 2 2
(B)X2 +Y2服从 2分布. Y
2
2 X (C)X 和Y 都服从 分布. (D)
(X ) ~ t ( n 1) S n
客、考点 10,正态总体的抽样分布
33/33
34/33
35/33
【例】设总体 X ~ N (0,1),X 1 , X 2 , X1 X 2
2 2 X3 X4
, X n 是简单随机
2 X i. i 4 n
样本 , 试问下列统计量服从什么分布? (1 ) ; (2 ) n 1X1
记:F分布是两个卡方分布的商
2. F 分布的上侧分位数
设 F ~ F (k1 , k2 ) ,对于给定的 a (0,1) ,称满足条件
P{F Fa (k1 , k2 )}
Fa ( k1 ,k2 )
f F ( x)dx a
的数 Fa (k1 , k2 ) 为F 分布的上侧a 分位数。
服从F分布.
§5.5 正态总体统计量的分布
一、单个正态总体情形 总体
X ~ N ( , 2 ) ,样本 X1 , X 2 , , Xn ,
1 n 样本均值 X X i n i 1
n 1 2 样本方差 S 2 ( X X ) i n 1 i 1
1. 定理1 若设总体X~N(μ,σ2), 则统计量
有一约束条件
(X
i 1
概率论与数理统计总结之第六章
第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。
概率论与数理统计第6章
, xi
解
f x1 , x2 , , x6 ; e
x
1
x1 !
e
x
2
x2 !
e
x
6
x6 !
e
6
6
xi
i 1
n
x !
i 1 i
, x , x ,, x
1 2
6
0,1,2,
二、样本
第6章 统计量和抽样分布
14
例5
设总体 X ~ U (0, ) , ( X1 , X 2 ,L , X n ) 是取自上均匀分布总体 X 的一个样本, 0 未知, 求样本( X1 , X 2 ,
⑵当总体 X 是连续型随机变量时, 定义总体分布为
f x; θ ˆ f X x; θ , 即为总体 X 的概率密度函数.
一、总体
第6章 统计量和抽样分布
6
例1 解
设总体
X ~ B 1 ,p ,试写出总体分布律 f x; p .
,n
f ( x; p) P( X x) (1 p)1 x p x , x 0,1, 2,
二、样本
第6章 统计量和抽样分布
11
⑵ 设 X 为连续型随机变量, 概率密度函数为 f x; θ ,
则样本
X1 , X 2 ,
, X n 的联合概率密度函数为:
,Xn
f x1 , x2 ,
, xn ; θ ˆ f X1 , X 2
x1 , x2 ,
, xn
f X1 x1 f X2 x2 f x1; θ f x2 ;θ
浙江大学《概率论与数理统计》(第4版)【名校笔记+课后习题+考研真题】第6章 样本及抽样分布【圣才出
十万种考研考证电子书、题库视频学习平台
第 6 章 样本及抽样分布
6.1 复习笔记
一、抽样分布 1.样本统计量 (1)常用的统计量(见表 6-1-1)
表 6-1-1 常用统计量
2.经验分布函数 设 x1,x2,…, xn 是总体 F 的一个容量为 n 的样本值,将 x1,x2,…,xn 按从小到大的
1
4 / 5 4 / 5
0.2628
(2)记 M=max{X1,X2,X3,X4,X5},因 Xi X i 的分布函数为Φ((x-12)/2),则
M 的分布函数为
FM(m)=[Φ((m-12)/2)]5
因而
P{max{X1,X2,X3,X4,X5}>15}=P{M>15}=1-P{M≤15}=1-FM(15)=1-[Φ ((15-12)/2)]5=0.2923
①定理一
设 X1,X2,…,Xn 是来自正态总体 N (, 2 ) 的样本,其样本均值和样本方差为
X
1 n
n i 1
Xi,S2
1 n 1
n i 1
Xi X
2
a.
(n 1)S 2 2
~
2 (n 1)
b. X ~ N (, 2 ) n
c. X 与 S2 相互独立。
③定理二
设 X1,X2,…,Xn 是来自正态总体 N (, 2 ) 的样本, X ,S2 分别是该样本的均值和
且两者是相互独立,因此
X1 X 2 X3 ~ N 0,1 , X 4 X5 X 6 ~ N 0,1
3
3
又两者相互独立,按χ2 分布的定义
(X1+X2+X3)2/3+(X4+X5+X6)2/3~χ2(2)
即 1/3Y~χ2(2),因此所求常数 C=1/3。
概率论与数理统计6.第六章:样本及抽样分布
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 样本及其抽样分布
样本与统计量 直方图与样本分布函数 常用统计量的分布
一、总体与样本
6.1 样本与统计量
1.总体 —— 研究对象全体元素组成的集合. 数理统计关心研究对象的某个(或某些)数量 指标——是一个随机变量(或多维随机变量),记为 X ——以此表示一个总体.
X 的分布函数和数字特征称为总体的 分布函数和数字特征.
(3) E( S ) D( X )
2
2
证明 (1)、(2)自证, 下面证明性质(3).
n 1 2 2 ES E ( Xi X ) n 1 i 1 n 1 2 E ( Xi X ) n 1 i 1
n 1 E ( X i2 2 XX i X 2 ) n 1 i 1
x 2,
1 2 2 2 s {(1 2) (2 2) (3 2) } 1 2
2
三、几个常用的统计量
1 n 1. 样 本 均 值 X X i , n i 1
n 1 2 2. 样本方差 S 2 ( X X ) i n 1 i 1
样本均方差( 标准差 ) S
对个体逐个观测来获取总体X的分布情况?
取样本!根据样本的取值情况来推断总体的情况.
×
2. 样本:来自总体的部分个体X1,… ,Xn ,如果满足: (1)代表性: Xi(i=1,…,n)与总体
同分布;
(2)独立性:X1,… , Xn 相互独立.
则称X1,… ,Xn为容量为n 的简
单随机样本,简称样本。而称 X1,… , Xn的一次实现为样本观 察值, 记x1, …, xn.
《数理统计》
数理统计学是关于数据资料收集、整理、分析、 和推断的一门应用性很强的学科。利用数理统计学 可对所考察的问题作出推断和预测,直至为采取一 定的决策和行动提供依据和建议. 数理统计学
合理收集数据-试验设计、抽样调查等
整理分析数据-统计推断
学习统计要在基本概念、方法原理的正确理解上 多花些时间. 统计软件包SAS,SPSS,MATLAB, STAT等, 都可以快速、简便地进行数据处理和分析.
特别地,若 X1 , X 2 , , X n ~ N ( , 2 )
则 X 1X ~ N , , i
n 2
i . i .d
X
n i 1
n
n
~ N 0,1
标准正态分布的 分位数
定义 若 P X u 则称u为标准正态 分布的上 分位数.
P X u
0.4 0.3 0.2 0.1
n n n 2 1 2 E X i 2 X X i X n 1 i 1 i 1 i 1
n 2 1 2 E X i 2 X nX nX n 1 i 1
DXi EX ( EXi )
2 i
2 2 2
(2) 指出下列哪些是统计量?
1 n X Xi , n i 1
n n 2 1 2 2 2 2 S X X , S X / i 1 i n 1 i 1 i 1
是, 称为 样本均值
是, 称为 样本方差
不是, 含 未知参数
(3)若样本观察值为1,2,3, 则样本均值与样 本方差是多少?
n
EX i2 ( EX i )2 DX i 2 2
2
总
一、总体与样本 二、统计量
结
三、几个常用的统计量
作业: P106—2(1)(2), 4, 5
正态分布外三大重要分布: 2分布、t分布、F分布
6.3 常用统计量的分布
一、正态分布 定理1(样本均值的分布)若X1, X2, …,Xn相互独立, n n n 2 2 2 X i N ( i , i ), 则 ai X i ~ N ai i , ai i i 1 i 1 i 1
解 {( x , 1
f ( x1 ,
1 ( 2 )
n
, xn ) : xi R, i 1,
n
, n}
1
2 ( x ) i 2
, xn ) f ( xi ) i 1
1 2
e n
1 2 ( xi )2 2 i 1
i 1
e
2
பைடு நூலகம்
n
来自总体X的随机样本X1,… , Xn可记为
X1 ,
, X n ~ X 或 f ( x ), F ( x ),
n
iid
显然,样本联合分布函数或密度函数为
F * ( x1 , x 2 , , x n ) F ( x i )
i 1
或 f * ( x , x , , x ) f ( xi ) 1 2 n
2
E( X ) ( E X ) D X n 1 n 1 2 2 2 2 2 ( ) n ( ) n 1 i 1 n
1 2 2 EX i nE ( X ) n 1 i 1
i 1
n
3.总体、样本、样本观察值的关系
总体
理论分布
样本
样本观察值
样本空间 —— 样本所有可能取值的集合.
二、统计量
例
定义:如果样本X1, … ,Xn 的函数g(X1, … ,Xn )不含
未知参数,则称之为总体X的一个统计量.
X ~ N ( , ) , 已知, 为未知参数,
2
2
X=(X1,… , Xn)是一样本, (1) 写出样本空间与样本X的联合密度函数;
S2
样本的数字特征
3.样本k阶矩 k阶原点矩 k阶中心矩
1 mk X ik n i 1
1 n M k ( X i X )k n i 1
n
m1 X n1 2 M2 S n S 2 ( n较大)
性质 如果总体X的期望为,方差为2,则 2 D( X ) (1) E ( X ) E ( X ) (2) D( X ) n n