概率论与数理统计第6章(公共数学版)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2
1 n
n i 1
(Xi
X )2
0
样本修正方差
S*2
1 n1
n
(Xi
i 1
X )2
显然
S*2 n S2 S2 n1
S2 n 1 S*2 S *2 n
样本k阶原点矩 样本k阶中心矩
k
1 n
n i 1
X
k i
k
1 n
n
(Xi
i 1
X )k
显然
X 1
S2 2
17
6.2 数理统计中的某些常用分布
Y / 2n Y / n
28
0.4 00.3.45
0.35
t 0.03.分 53 布的密度曲线 0.3 0.3 0.25 00.2.255 0.2 00.2.2
0.15 00.1.155
000.1..11
N(0,1)
n=10 n=10 nn==33
n增大
000.0..00555
nnn===111
24
例1 查表求临界值
2 0.05
(20)
10.9
0.0252(20) 9.59
2 0.95
(20)
31.4
0.9752(20) 34.2
25
例2 设 X1 ,, X 6 是来自总体 N (0,1) 的样本, 又设 Y ( X1 X2 X3 )2 ( X4 X5 X6 )2,
4
互独立,令 T 4( X 2)
Yi2 , 试求 T 的分布,
i 1
并确定 t0 的值, 使 P{| T | t0 } 0.01. 解 由于 X 2 ~ N(0,1),Yi / 2 ~ N(0,1),i 1,2,3,4,
故由 t 分布的定义知
4( X 2) X 2
X 2
T
~ t(4),
数理统计
1
从历史的典籍中,人们不难发现许 多关于钱粮、户口、地震、水灾等等的 记载,说明人们很早就开始了统计的工 作 . 但是当时的统计,只是对有关事实 的简单记录和整理,而没有在一定理论 的指导下,作出超越这些数据范围之外 的推断.
2
到了十九世纪末二十世纪初,随着 近代数学和概率论的发展,才真正诞生 了数理统计学这门学科.
即x t0.01(9) t0.99 (9) 2.821
若P{| T | x} 0.95 则P{T x} 0.975
即x t0.975 (9) 2.2622
31
例4 设随机变量 X ~ N (2,1), 随机变量 Y1,Y2 ,
Y3 ,Y4 均服从 N (0,4), 且 X ,Yi (i 1,2,3,4) 都相
一、2 分布 二、t 分布 三、F 分布
一、 2 分布
2分布的定义及概率密度
设随机变量X1, X 2 ,, X n独立同分布,且
Xi ~ N (0,1),i 1,2,, n,若随机变量
2
X
2 1
X
2 2
X
2 n
,则称随机变量 2服
从自由度为n的 2 分布.记为 2 ~ 2(n).
19
2分布的密度函数为
30
例3 若T ~ t(9) 查表求下列临界值
t0.95 (9) 1.8331
t0.05 (9) t0.95 (9) 1.8331
t0.975(9) 2.2622
t0.025 (9) t0.975 (9) 2.2622
若P{T x} 0.99 则x t0.99(9) 2.821
若P{T x} 0.99 则P{T x} 0.01
3
概率论与数理统计是两个有密切联系 的学科,它们都以随机现象的统计规律为 研究对象.
但在研究问题的方法上有很大区别: 概率论 —— 已知随机变量服从某分布, 寻求分布的性质、数字特征、及其应用;
数理统计 —— 通过对试验数据的统计 分析,寻找所服从的分布和数字特征, 从而 推断总体的规律性.
4
数理统计的核心问题——由样本推断总体
P{ 1 F
即P{T t (n)}
t (n)
t1 (n)
对于P{T x} 称其解x t1 (n)为t(n)分布的上侧分位数
P{T x} 1 P{T x} P{T x} 1 x t1 (n)
由t 分布的对称性 P{T x} P{T x}
t (n) t1 (n) 查分位数的重要公式
n3
1
2n
23
若 2 ~ 2(n) 分布函数为F ( x)
,0 1 若F(x) P{ 2 x} 则其解称为 2 分布 的 分位数(临界值)
2(n)
1 2 (n)
记为x 2(n)
而称x
2 1
(n)为
2
分布的上侧分位数
P{ 2 1 2(n)} 1
P{ 2 2 (n)} 1
则0 1
称P{F x} 的解
为F 分布的 分位数
记为F (m, n)
即P{F F (m, n)}
F (m, n)
F1 (m, n)
称P{F x} 的解 x F1 (m, n)为F 分布的上侧分位数
即P{F F1 (m, n)} 或P{F F1 (m, n)} 1
概括起来可以归纳成两大类: 参数估计──根据数据,用一些方法对分布的 未知参数进行估计. 假设检验──根据数据,用一些方法对分布的 未知参数进行检验.
它们构成了统计推断的两种基本形式.这两 种推断渗透到了数理统计的每个分支.
5
第6章 数理统计的基本概念
6.1 总体和样本 6.2 数理统计中的某些常用分布 6.3 抽样分布
则 X1 X2 ~ 2n1 n2
(2) 设X1, X2,, Xn 相互独立, 都服从正态分布
N(, 2 ), 则
2
1
2
n
(Xi
i 1
)2
~
2
n
相互独立的 2 分布随机变量迭加,自由度也迭加
22
2分布的期望和方差 E( 2 ) n, D( 2 ) 2n
E(
2
)
E( X12
X22
36
定理 若F ~ F(m, n) 则0 1,有
1 ~ F (n, m),
F
且
F (m, n)
1 F1 (n, m)
证明: 因为F
X /m Y /n
~ F(m, n),
则
1 F
Y / n ~ F (n, m) X /m
又 P{F F (m, n)}
则
1 P{
F
1 F (m, n)} 1
引入统计量的概念
12
定义 设(X1, X2,, Xn )为来自总体X的一个样本,
若n元函数f (X1, X2,, Xn )不含任何未知参数, 则称f ( X1, X2,, Xn )为X1, X2,, Xn的一个统计量.
f (X1, X2,, Xn )是否为统计量关键是不含未知参数
13
例1 设(X1, X2,, Xn )为来自总体N(, 2 )的一个样本
33
三、F 分布 F 分布的定义及概率密度
设随机变量X ~ 2(m),Y ~ 2(n), X ,Y相互独立
则称随机变量F X / m 服从自由度分别为m, n的F 分布 Y /n
记为 F X / m ~ F (m, n) m, n分别为第一和第二自由度 Y /n
34
11 00..99 00..88 00..77 00..66 00..55 00..44 00..33 00..22 00..11
Xn)
1 n
n i 1
(Xi
X )2
其中X
1 n
n i 1
Xi
为一个统计量
(5)
f5
(
X1
,
X
2
,,
X
n
)
1
2
n
(Xi X )2
i1 不是统计量
(6)
f6( X1,
X2,, Xn )
1 n
n i 1
(Xi
X )k
其中k为常数 为一个统计量
15
常见统计量:
样本均值 样本方差
X
1 n
n i1
6
6.1 总体和样本
一、总体与个体 二、样本与简单随机样本 三、统计量
一、总体与个体 总体: 所研究的对象的全体,也称母体.一般用 X 表示
某工厂生产的产品的某项指标 民意测验的全体对象 某林区的树木直径 个体:组成总体的单个对象,一般用 X i 表示
X和Xi均是随机变量
8
二、样本与简单随机样本 抽样: 从总体中抽取一部分个体的过程 随机抽样: 从总体中随机抽取一部分个体的过程 简单随机抽样:总体中每个个体等可能被抽取的 随机抽样 样本: 经抽样取得的个体的集合
X6
2
~
2 (2),
故应取
C
1 3
,
则有
13Y
~ 2 (2).
26
二、t分布(学生氏分布) t分布的定义及概率密度
设 X ~ N(0,1), Y ~ 2(n), 且X,Y相互独立, 称随机变量 t X
Y /n
服从自由度为n的t分布.记为 t ~ t(n).
t分布的密度函数为:
f ( x, n)
000
-5--55
-4--44
-3-3
-2-2
-1-1
00
11
22
33
444
555
t 分布的密度曲线关于y轴对称 随着n的增大, t 分布的密度曲线越陡
n 时,t 分布趋于标准正态分布N(0,1)
29
若T ~ t(n)
则0 1 称P{T x} 的解
为t(n)的 分位数
记为t (n)
9
简单随机样本:经简单随机抽样取得的个体的集合
一般用 ( X1, X2 ,, Xn )表示
样本点:样本中的个体 样本容量:样本中包含的个体的数量 样本观测值:对样本进行观测的结果,
一般用( x1, x2,, xn )表示
以后未经声明 抽样即为简单随机抽样 样本即为简单随机样本
10
常见的要求和叙述:
当, 2为未知参数时
(1)
f1( X1,
X2 ,,
Xn)
1 n
n i 1
Xi
为一个统计量
(2)
f2( X1,
X 2 ,,
Xn)
1 n
n i 1
X
2 i
为一个统计量
(3)
f3( X1,
X 2 ,,
Xn)
1 n
n i 1
(Xi
EX )
因为EXi ,而未知 不是统计量
14
(4)
f4( X1,
X 2 ,,
试求常数 C , 使 CY 服从 2分布.
解 因为
X1 X 2 X 3 ~ N (0,3) X4 X5 X6 ~ N (0,3)
所以 X1 X 2 X 3 ~ N (0,1), 3
X4 X 5 X 6 ~ N (0,1), 3
且相互独立, 于是
X1
X2 3
X3
2
X4
X5 3
X
2 n
)
E( X12 ) E( X22 ) E( Xn2 )
nE(
X
2 i
)
n{D(
Xi
)
[E(
Xi
)]2
}
n(1 02 ) n
D(
2
)
D(
X12
X
2 2
Xn2
)
D(
X12
)
D(
X22
)
D(
X
2 n
)
nD(
X
2 i
)
n{E(
X i4
)
[
E(
X i2
)]2
}
n
x4
1
2
e
x2 2
d
x
12
f (x,n)
2n
1 2 (n
n1 x
x2 e 2 2)
0
x0 x0
其中伽玛函数 ( x) 通过积分
( x) et t x1dt, x 0 0
来定义.
20Biblioteka 2分布的密度函数的图形21
2分布的可加性
(1) 设 X1 ~ 2n1, X2 ~ 2n2 , 且X1 , X2相互独立,
[(n 1)
2] (1
x2
)
n1 2
(n 2) n n
27
若随机变量X ~ N(, 2 ),Y ~ 2(n), X,Y相互独立
则随机变量T X Y/n
~ t(n)
若随机变量X ~ N(, 2 ),Y / 2 ~ 2(n), X ,Y相互独立 则随机变量T X X ~ t(n)
00 00
0.5
F 分布密度曲线
F(20,20)
m, n增大
F(10,10)
F(5,5)
1
1.55
22
22..55
33
从F 分布密度曲线中可知 随着m, n的增大,密度曲线越来越陡
服从F 分布的随机变量的取值集中在1附近 m, n 时,密度曲线将近似地关于x 1对称
35
若F ~ F(m, n)