概率论与数理统计第六章统计量,样本及抽样分布

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从国产轿车中抽5辆 进行耗油量试验 样本容量为5
抽到哪5辆是随机的
2021/3/11
8
对总体X在相同的条件下,进行n次重复、独立
观察,其结果依次记为X1,X2,,Xn . 这样得到的随机变量X1, X2 , Xn是来自总体X
的一个简单随机样本,与总体随机变量具有相同的
分布.n称为这个样本的容量.
一旦取定一组样本X1,… ,Xn ,得到n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 . 最常用的一种抽样叫作“简单随机抽样”,其特点:
• 皮肌炎是一种引起皮肤、肌肉、 心、肺、肾等多脏器严重损害的, 全身性疾病,而且不少患者同时 伴有恶性肿瘤。它的1症状表现如 下:
• 1、早期皮肌炎患者,还往往伴 有全身不适症状,如-全身肌肉酸 痛,软弱无力,上楼梯时感觉两 腿费力;举手梳理头发时,举高 手臂很吃力;抬头转头缓慢而费 力。
二、统计三大抽样分布
样本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是 样本取到样本值的规律,因而可以由样本值去推断 总体.
2021/3/11
12
小结
总体:研究对象的全体称为总体 个体:总体中每个成员称为个体
简单随机样本:
由简单随机抽样得到的样本称为简单随机样本, 它可以用与总体X独立同分布的n个相互独立的随机 变量 X1,X2,…,Xn表示, n为样本容量,
10
使c
X
2服
i

2分



26
三、几个重要的抽样分布定理
设总体X的均值为,方差为2,X1, X2 ,, Xn是 来自总体的一个样本,则样本均值X和样本方差S 2有
E(X) , D( X ) 2 n, E(S 2 ) D( X ) 2
2021/3/11
27
定理 1 (样本均值的分布)
设 X1, X2, …, Xn 是来自正态总体 N ( , 2 )
这种不含任何未知参数的样本的函数 g( X1, X2 ,, Xn )称为统 计量. 它是完全由样本决定的量,其取值(观察值)是 g( x1, x2 ,, xn )
2021/3/11
15
常用的统计量
它反映了总体均值
几个常见统计量
的信息
样本平均值
X
1 n
n i 1
Xi
观察值
x
1 n
n i 1
xi
样本方差
25
33.、FF分分布布
定义:设 U ~ 2 (n1 ),V ~ 2 (n2 ), 则称随机变量
F U n1 V n2
服从自由度为n1及 n2 的F分布,n1称为第自 由度,n2称为第二自由度,记作
F~F(n1,n2) .
由定义可见,
2021/3/11
1 V n2 F U n1
~F(n2,n1)
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
S2
1 n1
n i 1
(Xi
X )2
1 n
1
n
X
2 i
i 1
nX
2
它反映了总体 方差的信息
观察值
s2
n
1
1
n i 1
x
2 i
nx 2
样本标准差
S
n
1
n
1
(
i 1
X
i
X
)2
观察值 s
1 n1
n i 1
( xi
x)2
2021/3/11
16
样本k阶原点矩
Ak
1 n
n i 1
X
k i
k=1,2,…
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
近似
即当n足够大时,t ~ N (0,1).
2021/3/11
23
3. t分布的分位点 对于给定的,0 1,称满足条件
pt t(n) t(n) h(t)dt
总体
2021/3/11
4
我们关心的是总体中的个体的某项指标(如人的身高、 灯泡的寿命,汽车的耗油量…) .
由于每个个体的出现是随机的,所以相应的数量指 标的出现也带有随机性 . 从而可以把这种数量指标看 作一个随机变量X ,因此随机变量X的分布就是该数 量指标在总体中的分布.
总体就可以用一个随机变量及其分布来描述. 因此在理论上可以把总体与概率分布等同起来.
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
2 (n)
f
(
y)dy
的点2 (n)为 2(n)分布的上分位点,
如图所示. 2 (n)可通过查表求,例
2 0.1
(25)
34.381.
0.1, n 25,见P386
2 (n)
2021/3/11
21
2. t 分布
定义: 设X~N(0,1) , Y~ 2(n) , 且X与Y相互
独立,则称变量
t X Yn
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的全
国产轿车每公里耗油量
体就是总体
的全体就是总体
2021/3/11
3
一、总体和样本
1一.总个体统计问题总有它明确的研究对象.
研究对象的全体称为总体,
总体中每个成员称为个体, 总体中所包含的个体的个数称为总体的容量.
有限总体
总体

无限总体
研究某批灯泡的质量
1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布.
2. 独立性: X1,X2,…,Xn是相互独立的随机变量.
2021/3/11
9
由定简义单:随机抽样得到的样本称为简单随机样本, 它可以用与总体独立同分布的n个相互独立的随机
变量X1,X2,…,Xn表示.
若总体的分布函数为F(x)、概率密度函数为 f(x),则其简单随机样本的联合分布函数为
6
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数 F(x,y)来表示.
2021/3/11
统计中,总体这个概念 的要旨是:总体就是一个概 率分布.
7
2. 样本
总体分布一般是未知,或只知道是包含未知 参数的分布,为推断总体分布及各种特征,按一 定规则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息 ,这一抽取过程称为 “抽 样”,所抽取的部分个体称为样本. 样本中所包 含的个体数目称为样本容量.
所服从的分布为自由度为 n的 t 分布.
记为 t ~ t(n).
概t分率布密又度称函为数学为生:氏分布.t(n)分布的密度
h(t )
[(n 1)
2](1
t2
n1
)2
(n 2) n n
2021/3/11
t
22
2. t 分布
t分布的性质:
1. 具有自由度为n的t分布t ~ t(n),其数学期望 与方差为:E(t ) 0, D(t ) n (n 2) (n 2)
其观察值为 x1 , x2 , xn .
统计模型:样本( X1, X 2 ,, X n )的联合分布(独立同分布)
2021/3/11
13
第三节 样本及抽样分布
统计量 统计三大抽样分布 几个重要的抽样分布定理
2021/3/11
14
一、统计量
1. 统计量
由样本值去推断总体情况,需要对样本值进行“加工 ”,这就要构造一些样本的函数,它把样本中所含的(某 一方面)的信息集中起来.
设X1,X2,…,Xn是来自正态总体 N ( , 2 ) 的样本,
X和S2分别为样本均值和样本方差, 则有
(1)
(n 1)S2
2
~
2 (n 1)
(2) X与S 2独立.
n取不同值时 (n 1)S 2
的分布
2
(若正态总体的, 2已知,可由该定理求样本方差S 2)
2021/3/11
30
定理 3 (样本均值的分布)
F *( x1 , x2 ,, xn ) =F(x1) F(x2) … F(xn)
其简单随机样本的联合概率密度函数为
f *( x1, x2 ,, xn ) =f(x1) f(x2) … f(xn)
这里 ( x1 , x2 ,, xn )是总体随机样本( X1 , X 2 ,, X n )的取值
2021/3/11
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X

2



X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
的点t (n)为t(n)分布的上分位点.如图所示.
2021/3/11
t(n)
24
t分布的上分位点的性质: t1 (n) t (n)
t分布的上分位点t (n)可查表见P285
求得,例t0.025 (15) 2.1315.
t(n)
当n 45时,对于常用的的值,可用正态近似 t(n) z
2021/3/11
能获得局部观察资料.
2021/3/11
1
在数理统计中,不是对所研究的对象全体 ( 称 为总体)进行观察,而是抽取其中的部分(称为样本) 进行观察获得数据(抽样),并通过这些数据对总 体进行推断.
数理统计方法具有“部分推断整体”的 特征 .
2021/3/11
2
在数理统计研究中,人们往往研究有关对象的 某一项(或几项)数量指标和为此,对这一指标进行 随机试验,观察试验结果全部观察值,从而考察该 数量指标的分布情况.这时,每个具有的数量指标的 全体就是总体.每个数量指标就是个体.
这里样本方差S 2的值是s2
2021/3/11
n
1
1
i
x
2 i
nx
2
31

1.设
总 体X
~
N(0,1),X 1 ,
X2
,
X

3




X
2 1
X
2 2
X
2 3
~
2(3) ;
3X
~ t(3)
X
2 1
X
2 2
X
2 3
2.设X 1 , ,
X

10




,X
i
~
N (0,0.32 ),求c的 值 ,
2021/3/11
5
例如:研究某批灯泡的寿命时,关心的数量指标
就是寿命,那么,此总体就可以用随机变量X表示,
或用其分布函数F(x)表示.
总体
寿命 X 可用一概率分布 (如指数分布)来刻划
X:某批 灯泡的寿命
2021/3/11
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
的样本,X是样本均值,则有
即 X ~ N (0,1) n
X ~ N (, 2 ) n
(若正态总体的, 2已知,可由该定理求样本均值X)
2021/3/11
28
X ~ N (, 2 ) X ~ N (0,1) n n
请注意 :
n取不同值时样本
均值 X 的分布
2021/3/11
29
定理 2 (样本方差的分布)
设X1,X2,…,Xn是取自正态总体 N ( , 2 )
的样本, X和S2 分别为样本均值和样本方差,
则有
X ~ t(n 1)
Sn
证 由定理1、2,t分布的定义可得
X ~ N (0,1) , n
则 X n
(n
1)S 2 2
~
2(n
1)
且相互独立
(n 1)S 2 2
~
t(n 1)
(在未知总体, 2时,可用本定理计算样本均值X.
第一节 随机样本
数理统计学是一门应用性很强的学科. 它是研究 怎样以有效的方式收集、 整理和分析带有随机性的 数据,以便对所考察的问题作出推断和预测.
由于大量随机现象必然呈现它规 律性,只要对随机现象进行足够多次 观察,被研究的规律性一定能清楚地 呈现出来.
客观上, 只允许我们对随机现象
进行次数不多的观察试验 ,我们只
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶矩的信息
它反映了总体k 阶 中心矩的信息
2021/3/11
17
请注意 :
若总体X的k阶矩E( X k ) k存在,则当n 时,
Ak
1 n
n
i 1
X
i
k
p k
k 1,2,.
事实上 由X1, X2,, Xn独立且与X同分布,
有X
1. 2 分布 2分布是由正态分布派生出来的一种分布.
定义: 设 X1, X 2 ,, X相n 互独立, 都服从正态分布
N(0,1), 则称随机变量:
2
wk.baidu.com
X 12
X
2 2
Xn2
所服从的分布为自由度为 n的 2分布,记为 2(n)
(1)若X i
~
N (, 2 ),则 2
1
2
n
(Xi
i 1
)2
~
2(n)
相关文档
最新文档