概率论与数理统计第18讲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

23
例2 设X1,…,X6是来自总体N(0,1)的样本,
又设
Y=(X1+X2+X3)2+(X4+X5+X6)2 试求常数C, 使CY服从c2分布.
24
解 因为 X1+X2+X3~N(0,3) X4+X5+X6~N(0,3) 所以 X 1 X 2 X 3 ~ N (0,1), X 4 X 5 X 6 ~ N (0,1),
2
P{c ca (n)}
2 2
2

2
ca
f ( x)d x a
(2.2)
的数 ca (n) 为c (n)分布的水平a的上侧分位
2
数, 简称为上侧a分位数. 对不同的a与 n, 分位数的值已经编制成表供查用(参见附 表).
22
例如, 查表得
0.25 0.1 0.05 0.025 0.01 0.005
14.449
16.013 17.535 19.023 20.483 21.920 23.337 24.736
16.812
18.475 20.090 21.666 23.209 24.725 26.217 27.688
18.548
20.278 21.955 23.589 25.188 26.757 28.300 29.819
注: 称Q ( X i X ) 为样本的偏差平方和. 由Q ( X 2 X i X X ) X nX
i 1 i 1 2 i n n 2

n 1 2 2 2 S X i nX n 1 i 1
(1.9)
9
3. 样本标准差
c (25) 34.382
2 0.1
11 12 13
……………… 23 24 25 26 27 28 27.141 28.241 29.339 30.435 31.528 32.620 32.007 33.196 34.382 35.563 36.741 37.916 35.172 36.415 37.652 38.885 40.113 41.337 38.076 39.364 40.646 41.923 43.195 44.461 41.638 42.980 44.314 45.642 46.963 48.278 44.181 45.559 46.928 48.290 49.645 50.993
其中 X1,X2, ,Xm,Xm+1,Xm+2, ,Xm+n 均服从 N(0,1), 且相互独立, 于是由c 分布的定义 2 2 2 2 2 2 c1 c 2 X 1 X m X m 1 X m n
2
服从c (m+n).
2
21
(3) c 分布的分位数: 2 2 设c ~c (n), 对给定的实数a(0<a<1), 称满 足条件
[(n 1) / 2] x 2 f ( x) 1 n (n / 2) n

n 1 2
, x
26
t 分布概率密度的图形:
n=9
n=
n=2 4 3 2 1 O 1 2 3 4
x
27
t分布具有如下性质: (1) f(x)的图形关于y轴对称, 且 lim f ( x) 0;
3 3
且相互独立. 于是 2 2 X1 X 2 X 3 X 4 X 5 X 6 2 ~ c (2) 3 3 1 1 2 故应取C ,则有 Y ~ c (2). 3 3
25
三 t 分布 定义2 设X~N(0,1), Y~c2(n), 且X与Y相互独 立, 则称 X t Y /n 服从自由度为n的t分布, 记为t~t(n), t(n)分布 的概率密度:
c
2 0.05
(10) 18.307
………………
6
7 8 9 10
7.841
9.037 10.219 11.389 12.549 13.701 14.845 15.984
10.645
12.017 13.362 14.684 15.987 17.275 18.549 19.812
12.592
14.067 15.507 16.919 18.307 19.675 21.026 22.362
20
(2)若 c ~ c ( m), c ~ c ( n),且 c , c 相互独
2 1 2 2 2 2 2 1 2 2
c c ~ c ( m n). 2 证明 由c 分布的定义, 可设
立, 则
2 1 2 2 2
2 2 2 2 2 c12 X 12 X 22 X m , c2 Xm X X 1 m2 mn
1 x n/2 f ( x) 2 (n / 2) 0,

n 1 1 x 2 2
e
, x 0. x0
其中(x)为gamma函数, 定义为
( x) t e d t
x 1 t 0
16
( x) t e d t
x 1 t 0


ta / 2
f ( x)d x a ,
显然有 P{T>ta/2(n)}=a/2; P{T<ta/2(n)}=a/2. 对不同的a与n, t分布的上侧分位数可从附 表查得.
30
例如, 设t~t(8), 对水平a=0.05, 查表得到 ta(8)=t0.05(8)=1.8595, ta/2(8)=t0.025(8)=2.3060
第五章 数理统计的基础知识 §5.1 数理统计的基本概念
1
定义1 统计学中称随机变量(或向量)X为 总体, 并把随机变量(或向量)的分布称为 总体分布.
注: ①有时个体的特性的直接描述并非是 数量指标, 但是总可以将其数量化, 如检 验某学校全体学生的血型, 试验的结果有 O型,A型,B型,AB型4种, 若分别以1,2,3,4 依次记这4种血型, 则试验的结果就可以 用数量表示了.
14
二, c2分布 定义1 设X1,X2,…,Xn是相互独立服从标准 正态分布的随机变量, 则称统计量 2 2 2 2 c X1 X 2 X n (2.1)
服从自由度为n的c2分布, 记为c2~c2(n).
这里, 自由度是指(2.1)式右端所包含的独 立变量的个数.
15
c2(n)分布的概率密度:
1 2 S ( X i X ) (1.10) n 1 i 1 4. 样本(k 阶)原点矩 n 1 k Ak X i , k 1, 2, (1.11) n i 1 5. 样本(k 阶)中心矩 1 n k Bk ( X i X ) , k 2 , 3, n i 1
0.05 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125
j(x)
a/2
ua/2 O ua/2
a/2
x
13
例1 设a=0.05, 求标准正态分布的水平 0.05的上侧分位数和双侧分位数. 解: 由于F(u0.05)=10.05=0.95, 查标准正态分布函数表可得u0.05=1.645. 而水平0.05的双侧分位数为u0.025, 它满足 F(u0.025)=10.025=0.975, 查表得 u0.025=1.96. 注: 今后, 分别记ua与ua/2为标准正态分布 的上侧分位数与双侧分位数.
0.25 1 2 3 4 5 6 7 8 9 10 1.0000 0.8165 0.7649 0.7407 0.7267 0.7176 0.7111 0.7064 0.7027 0.6998
0.1 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722
Gamma 数的性质:
17
f(x)的图形:
0.40 0.30 0.20 0.10 n=2 n=1 n=4 n=6 n=11 8 10 12 14
O
2
4
6
x
18
c2分布的性质: (1) 若c2~c2(n), 则E(c2)=n, D(c2)=2n.
证明: 由Xi~N(0,1), 故
E ( X ) D( X i ) 1,
ta ( n )
f ( x)d x a
(2.5)
的数ta(n)为t(n)分布的水平a的上侧分位 数. 由密度函数的对称性, 可得 t1a(n)ta(n) (2.6)
29
类似地, 我们可以给出t分布的双侧分位数 P{| T | ta / 2 (n)}

ta / 2

f ( x)d x
2
总体的分布一般来说是未知的, 有时即使 知道其分布的类型(如正态分布, 二项分 布等), 但不知这些分布中所含的参数等 (如m,s2,p等). 数理统计的任务就是要通 过对总体X进行一系列的独立的同环境 下的随机试验, 获得一系列的试验值, 用 这些试验值来对X的分布或参数进行统 计推断.
3
二, 样本与样本分布 要研究总体X, 就要对X进行一系列的独 立试验, 通常进行n次试验, 这样,将n次试 验组合成一个试验, 又可以试验多次,ቤተ መጻሕፍቲ ባይዱ因 此, n次试验相当于根据总体X产生了和 总体的分布完全一样的, 相互独立的n个 随机变量X1,X2,…,Xn, 称它们是总体X的 样本; 而每n次试验的一个结果产生n个数 x1,x2,…,xn称为样本观察值或者样本值, n 被称为样本容量(或样本大小).
6
定义3 设X1,X2,…,Xn为总体X的一个样本, 称此样本的任一不含总体分布未知参数 的函数为该样本的统计量. 注: 当样本X1,X2,…,Xn未取一组具体样本 值时, 统计量用大写字母表示; 当样本 X1,X2,…,Xn取一组具体的样本值 x1,x2,…,xn 时, 统计量用小写字母表示.
7
2 i 4 i
1 E( X ) 2 x e 2
3 x 2
2



xe
x2 4 2
1 dx 2
2



x d(e
3
x2 2
)


3


x
1 e 2
x2 2
dx3
19
E ( X ) 1, E ( X ) 3
2 i 4 i
D ( X ) E ( X ) [ E ( X )] 3 1 2,
n
(1 . 1 2
10
§5.2 常用统计分布
11
一, 分位数 设随机变量X的分布函数为F(x), 对给定 的实数a(0<a<1), 若实数Fa满足不等式 P{X>Fa}=a, 则称Fa为X分布的水平a的上侧分位数.
j(x)
a
O
ua
x
12
若实数Ta满足不等式 P{|X|>Ta}=a, 则称Ta为X分布的水平a的双侧分位数.
2 i 4 i 2 i 2
i 1, 2,, n 由X1,X2,…,Xn的独立性, 于是
n n 2 2 2 E(c ) E X i E( X i ) n i 1 i 1 n n 2 2 2 D ( c ) D X i D ( X i ) 2n. i 1 i 1
七, 样本的数字特征 以下设 X1,X2, ,Xn 为总体 X 的一个样本. n 1 X Xi 1. 样本均值 n i 1 n 1 2 2 (Xi X ) 2. 样本方差 S n 1 i 1
8
1 n X Xi n i 1
n i 1 2 i
n 1 2 2 S (Xi X ) n 1 i 1 2
x
(2) 当n充分大时, t分布近似于正态分布; x2 1 2 lim f ( x) e . n 2 但当n较小时, t分布与标准正态分布仍 相差较大.
28
(3) t分布的分位数: 设T~t(n), 对给定的实数a(0<a<1), 称满足 条件
P{T ta (n)}
4
三, 统计推断问题简述(略) 四, 分组数据统计表和频率直方图(略) 五, 经验分布函数(略)
5
六, 统计量 为了由样本推断总体, 需构造一些合适的 统计量, 再由这些统计量来推断未知总体. 这里, 样本的统计量即为样本的函数. 广 义地讲, 统计量可以是样本的任一函数, 但由于构造统计量的目的是为推断未知 总体的分布, 故在构造统计量时, 就不应 包括总体的未知参数.
相关文档
最新文档