数理统计的基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X i2 ~ 2 ( n)
i 1 n
(2) 若总体 ~ N (, 2 ),而 X1 , X 2 ,, X n )为来自 的 X ( X
一个样本,则统计量
1 2 ( X i ) 2 ~ 2 ( n)
i 1 n
(3) 若 2 ~ 2 (n),则 2 的特征函数为(t ) (1 2it )
设 例: X 1 , X n为来自总体 X ~ N ( , 2 ) 的一个样本,
其中未知, 2已知, 问下列随机变量中那些是统 计量:
X1 X n X1 X n min(X 1 , X 2 , , X n ); ; ; 2 n ( X 1 X n ) 2 ( X 1 X n ) n . ; . 2 n
1 n 常用统计量: 样 本 均 值 : X X i n i 1 n 1 n 1 2 2 2 样本方差: S (Xi X ) [ X i nX 2 ] n 1 i 1 n 1 i 1
1 n 样本标准差: S2 S ( X i X )2 n 1 i 1
n
1 e 2
t2 2
性质3:设 T~t(n ), 则
n ET 0, (n 1);DT , (n 2) n2
min g x , max g x
a xb a xb
22
例
设总体
X f ( x)
,且
e x , x 0, f ( x) 其中 0 x 0. 0, X1 , X 2 ,, X n 为抽自总体X的样本,则
T 2( X1 X 2 X n ) 2n X 2 (2n) 证明:由于2 X1的密度为
ft ( 定理6:设t ~ t (n),其分布密度记作n) ( x),则
1 lim f t ( n ) ( x ) e n 2
x2 2
.
性质1: 密度函数关于y轴对称,且
lim f (t ; n ) 0
t
性质2: 中间高, 两边低, 左右对称,且
lim f t; n
经验分布函数的性质:
(1) 是分布函数
v ( x) (2) 随机变量样本函数 : E[vn ( x )] n F ( x ) E n ( ) F ( x) n
( 3) lim P Fn ( x ) F ( x ) 1 0 依概率收敛
n 2
并且E 2 n,D 2 2n。
定理1:自由度为 的2变量的分布密度为 n
n x 1 1 x2 e 2 n f ( x ) 2 2 ( n ) 2 0
x0 x0
其中( s ) t s 1e t dt ( s 0)为 函数。
n 2 n ( xi ) 1 i 1 e xp 2 2 2
(2) X1 , X 2 ,, X n的分布律为
P ( X 1 x1 , X 2 x2 ,, X n xn ) P ( X i xi )
d h y f h y dy , y fY y 0 , 其它
21
定理 (续)
d h y f h y dy , y fY y 0 , 其它
其中, x = h ( y ) 是 y = g ( x ) 的反函数
第二章 数理统计的基本概念 与抽样分布
数理统计是研究大量随机现象统计规律的 一门数学科学,以概率论为基础: 收集、整理和分析受到随机性影响的数据 为随机现象选择和检验数学模型 推断和预测随机现象的性质、特点和统计 规律 为决策提供依据和建议
(1) (2) (3) (4)
具体内容: 基本概念 经验分布函数和直方图 常用统计分布 抽样分布 顺序统计量与样本极差 充分统计量
n
(4) Fn ( x)以概率 一致收敛于它的理论分 1 布函数 ( x) F
P limsup| Fn ( x ) F ( x ) | 0 1 n x (格里纹科定理)
二、直方图
离散型:
设总体 为离散型随机变量,分 X 布列为 ( X ai ) pi P
X ~ N (0,4) ,
5 2 10
为来自总 X1 , X 2 , X10
2
Y X i X j i 1 j 6
试确定C使CY服从 2分布,并指出其自由度。
25
解:由已知条件有
X
i 1
5
i
~ N (0,20), 1 1
X
i 6 i
0
n=2 时,其密度函数为
1 2x 2e , f ( x) 0, x0 x0
是参数为1/2的指数分布.
Biblioteka Baidu19
( 2分布的可加性) 定理2:
2 若1 , 2 ,, 2为独立的随机变量,且 ~ 2 (nk ), 2 2 n k
k 1,2,, n,则
定义函数:
vi m 当ai x ai 1时 , 有 n ( x ) f ,i 0,1, , m 1, n ba
称f n ( x )在区间a, b)的图形为a, b)上的频率直方图 [ [ , 简称为直方图。
小区间个数:
m 1.87(n 1)
f n ( x) f ( x)
1 n k 样 本k阶(原 点)矩 :Ak X i k 1,2, n i 1 1 n k 样 本k阶 中 心 矩 : k ( X i X ) k 1,2, n i 1
抽样分布: 统计量的分布
§2.2 经验分布函数和直方图
一、经验分布函数
v n ( x )表示随机事件X x }在n次独立重复观测中 { 出现的次数
§2.1 数理统计的几个基本概念
一、总体和样本
总体: 研究对象的全体 个体: 每一个研究对象 研究对象的某个指标
总体的容量: 总体中所含有的个体的总数N
例:任何一个灯泡的寿命事先是不能确定的,而每 一个灯泡都确实对应着一个寿命值,所以可以 认为灯泡的寿命是一个随机变量。 总 体 随机变 量
抽样:在总体中抽取一定数量的个体进行观测 抽样方法原则: 1) 总体中每个个体被抽到的机会均等 2) 抽取一个个体后总体的成分不改变
n 2 2 k ~ nk . k 1 k 1
n
定理3: 若随机变量 2 ~ 2 (n),则 定理4: (Fisher定理)
2 - 2 n 1
2
2 n
2n
~ N (0,1)。
设2 ~ 2 (n),则
N (0,1)
n .
L
举例,先复习一个定理 设 X 是一个取值于区间[ a , b ],具有 概率密度 f ( x ) 的连续型随机变量 ;又设 y = g ( x ) 处处可导,且对于任意 x , 恒有 g ( x ) 0 或恒有 g ( x ) 0 ;则 Y = g (X) 是一个连续型随机变量 , 它的概率密度为
(2)
解:
X1 , X 2 ,, X n为来自于总体 (1, p)的样本 B
(1) X1 , X 2 ,, X n的联合概率密度函数为
n i 1 n
g( x1 , x2 ,, xn ) f ( xi )
i 1
( xi )2 1 e xp 2 2 2
样本值: 样本抽定后的具体数据
定理: 若( X 1 , X 2 ,, X n )是来自总体 ( x )的样本,则 F
( X 1 , X 2 ,, X n )的联合分布函数为
F(x )
i 1 i
n
例: 写出下列样本的联合概率函数
(1) X1 , X 2 ,, X n为来自于总体 (, 2 )的样本 N
简单随机样本(样本):
在不变条件下对总体(随机变量) X进行n次
样本容量:
无限总 体 有限总体
重复独立观测X 1 , X 2 ,, X n .
抽样次数n
无放回抽 样 有放回抽 样
n 很小 N
简单随机抽样的特点:
(1) 代表性; 每一个X i与总体有相同的分布
(2) 独立性: X1, X 2 ,, X n是相互独立的
10
i
~ N (0,20),
所以
Y1 Y2
X 20
i 1 10 i 6
5
~ N (0,1), ~ N (0,1),
X 20
i
且Y1 , Y2相互独立
1 故 Y Y12 Y22 ~ 2 (2) 20
26
二、t分布
定义2: X,Y独立,且 ~ N (0,1),Y ~ 2 ( n),则 设 X
2 5
§2.3 常用统计分布
一、 分布
2
定义1: ( X1 , X n )为来自于正态总体(0,1)的样本 设 N
则称统计量: X X
2 2 1 2 n
所 服 从 的 分 布 为 自 由 是n的 2分 布 。 度 记 为 ~ ( n)
2 2
常用的结论:
(1) 若总体 ~ N (0,1),而 X1 , X 2 ,, X n )为来自 的 X ( X 一个样本,则统计量
i 1 n
p xi (1 p)1 xi
i 1
n
p i 1 (1 p)
p (1 p)
k
xi
n
n
xi
i 1
n
n k
其中k为观测值x1 , x2 ,, xn )中1的个数, 0,1,, n。 ( k
二、统计量
对数据进行加工、提炼和压缩,把样本中所含 的有关信息集中起来。 统计量: 不含有任何未知参数的样本的函数
a a0 a1 am1 am b
vi 表示n次重复独立观测得样本, X 2 ,, X n中落在 X1 区间 ai , ai 1 ]中的个数 (
vi n
P
P{ai X ai 1 }
ai 1
ai
f ( x )dx
vi ba 当m, n充分大时, n f (ai ) m
令vi 表示事件 X ai }在n次重复独立观测中出现 { 的次数
vi n
p1
p2
P
pi
n
v3 n
p3
p4
v1 n
v2 n
v4 n
连续型:
设总体 为连续型随机变量,密f (x)为未知的 X 度
ba 对 任 一 有 限 区 间 , b], 等 分 成 个 子 区 间 , 其 长 度 为 [a m m
随机变量
X t Y n 称为自由度为的t变量,它所服从的分布 n
称为t分布,记为 ~ t (n)。 t
Y 注: 若X ~ N (, 2 ), 2 ~ 2 ( n), 且X,Y独 立 , 则
X t ~ t ( n). Y n
定理5: 若t ~ t (n),则t的分布函数为
n1 n1 2 2 2 1 x f ( x) n n n 2
vn ( x) ~ B(n, F ( x)).
经验频数
经验分布函数:
vn ( x ) Fn ( x ) n
把样本值 1 , x2 ,, xn按值从小到大排序 x
x(1) x( 2) x( n)
则
0 k Fn ( x ) n 1
x x( 1 ) x ( k ) x x( k 1 ) x( n ) x k 1,2, , n 1
1 1 x e 2 , x 0, f ( x) 2 0, x 0.
恰好是参数为2的 2分布
23
又由X1, X 2 ,, X n独立同分布,根据 分布的可加性
2
得到
T 2( X1 X 2 X n ) 2n X 2 (2n)
24
例:设总体 体的样本。令
i 1 n
(2) 若总体 ~ N (, 2 ),而 X1 , X 2 ,, X n )为来自 的 X ( X
一个样本,则统计量
1 2 ( X i ) 2 ~ 2 ( n)
i 1 n
(3) 若 2 ~ 2 (n),则 2 的特征函数为(t ) (1 2it )
设 例: X 1 , X n为来自总体 X ~ N ( , 2 ) 的一个样本,
其中未知, 2已知, 问下列随机变量中那些是统 计量:
X1 X n X1 X n min(X 1 , X 2 , , X n ); ; ; 2 n ( X 1 X n ) 2 ( X 1 X n ) n . ; . 2 n
1 n 常用统计量: 样 本 均 值 : X X i n i 1 n 1 n 1 2 2 2 样本方差: S (Xi X ) [ X i nX 2 ] n 1 i 1 n 1 i 1
1 n 样本标准差: S2 S ( X i X )2 n 1 i 1
n
1 e 2
t2 2
性质3:设 T~t(n ), 则
n ET 0, (n 1);DT , (n 2) n2
min g x , max g x
a xb a xb
22
例
设总体
X f ( x)
,且
e x , x 0, f ( x) 其中 0 x 0. 0, X1 , X 2 ,, X n 为抽自总体X的样本,则
T 2( X1 X 2 X n ) 2n X 2 (2n) 证明:由于2 X1的密度为
ft ( 定理6:设t ~ t (n),其分布密度记作n) ( x),则
1 lim f t ( n ) ( x ) e n 2
x2 2
.
性质1: 密度函数关于y轴对称,且
lim f (t ; n ) 0
t
性质2: 中间高, 两边低, 左右对称,且
lim f t; n
经验分布函数的性质:
(1) 是分布函数
v ( x) (2) 随机变量样本函数 : E[vn ( x )] n F ( x ) E n ( ) F ( x) n
( 3) lim P Fn ( x ) F ( x ) 1 0 依概率收敛
n 2
并且E 2 n,D 2 2n。
定理1:自由度为 的2变量的分布密度为 n
n x 1 1 x2 e 2 n f ( x ) 2 2 ( n ) 2 0
x0 x0
其中( s ) t s 1e t dt ( s 0)为 函数。
n 2 n ( xi ) 1 i 1 e xp 2 2 2
(2) X1 , X 2 ,, X n的分布律为
P ( X 1 x1 , X 2 x2 ,, X n xn ) P ( X i xi )
d h y f h y dy , y fY y 0 , 其它
21
定理 (续)
d h y f h y dy , y fY y 0 , 其它
其中, x = h ( y ) 是 y = g ( x ) 的反函数
第二章 数理统计的基本概念 与抽样分布
数理统计是研究大量随机现象统计规律的 一门数学科学,以概率论为基础: 收集、整理和分析受到随机性影响的数据 为随机现象选择和检验数学模型 推断和预测随机现象的性质、特点和统计 规律 为决策提供依据和建议
(1) (2) (3) (4)
具体内容: 基本概念 经验分布函数和直方图 常用统计分布 抽样分布 顺序统计量与样本极差 充分统计量
n
(4) Fn ( x)以概率 一致收敛于它的理论分 1 布函数 ( x) F
P limsup| Fn ( x ) F ( x ) | 0 1 n x (格里纹科定理)
二、直方图
离散型:
设总体 为离散型随机变量,分 X 布列为 ( X ai ) pi P
X ~ N (0,4) ,
5 2 10
为来自总 X1 , X 2 , X10
2
Y X i X j i 1 j 6
试确定C使CY服从 2分布,并指出其自由度。
25
解:由已知条件有
X
i 1
5
i
~ N (0,20), 1 1
X
i 6 i
0
n=2 时,其密度函数为
1 2x 2e , f ( x) 0, x0 x0
是参数为1/2的指数分布.
Biblioteka Baidu19
( 2分布的可加性) 定理2:
2 若1 , 2 ,, 2为独立的随机变量,且 ~ 2 (nk ), 2 2 n k
k 1,2,, n,则
定义函数:
vi m 当ai x ai 1时 , 有 n ( x ) f ,i 0,1, , m 1, n ba
称f n ( x )在区间a, b)的图形为a, b)上的频率直方图 [ [ , 简称为直方图。
小区间个数:
m 1.87(n 1)
f n ( x) f ( x)
1 n k 样 本k阶(原 点)矩 :Ak X i k 1,2, n i 1 1 n k 样 本k阶 中 心 矩 : k ( X i X ) k 1,2, n i 1
抽样分布: 统计量的分布
§2.2 经验分布函数和直方图
一、经验分布函数
v n ( x )表示随机事件X x }在n次独立重复观测中 { 出现的次数
§2.1 数理统计的几个基本概念
一、总体和样本
总体: 研究对象的全体 个体: 每一个研究对象 研究对象的某个指标
总体的容量: 总体中所含有的个体的总数N
例:任何一个灯泡的寿命事先是不能确定的,而每 一个灯泡都确实对应着一个寿命值,所以可以 认为灯泡的寿命是一个随机变量。 总 体 随机变 量
抽样:在总体中抽取一定数量的个体进行观测 抽样方法原则: 1) 总体中每个个体被抽到的机会均等 2) 抽取一个个体后总体的成分不改变
n 2 2 k ~ nk . k 1 k 1
n
定理3: 若随机变量 2 ~ 2 (n),则 定理4: (Fisher定理)
2 - 2 n 1
2
2 n
2n
~ N (0,1)。
设2 ~ 2 (n),则
N (0,1)
n .
L
举例,先复习一个定理 设 X 是一个取值于区间[ a , b ],具有 概率密度 f ( x ) 的连续型随机变量 ;又设 y = g ( x ) 处处可导,且对于任意 x , 恒有 g ( x ) 0 或恒有 g ( x ) 0 ;则 Y = g (X) 是一个连续型随机变量 , 它的概率密度为
(2)
解:
X1 , X 2 ,, X n为来自于总体 (1, p)的样本 B
(1) X1 , X 2 ,, X n的联合概率密度函数为
n i 1 n
g( x1 , x2 ,, xn ) f ( xi )
i 1
( xi )2 1 e xp 2 2 2
样本值: 样本抽定后的具体数据
定理: 若( X 1 , X 2 ,, X n )是来自总体 ( x )的样本,则 F
( X 1 , X 2 ,, X n )的联合分布函数为
F(x )
i 1 i
n
例: 写出下列样本的联合概率函数
(1) X1 , X 2 ,, X n为来自于总体 (, 2 )的样本 N
简单随机样本(样本):
在不变条件下对总体(随机变量) X进行n次
样本容量:
无限总 体 有限总体
重复独立观测X 1 , X 2 ,, X n .
抽样次数n
无放回抽 样 有放回抽 样
n 很小 N
简单随机抽样的特点:
(1) 代表性; 每一个X i与总体有相同的分布
(2) 独立性: X1, X 2 ,, X n是相互独立的
10
i
~ N (0,20),
所以
Y1 Y2
X 20
i 1 10 i 6
5
~ N (0,1), ~ N (0,1),
X 20
i
且Y1 , Y2相互独立
1 故 Y Y12 Y22 ~ 2 (2) 20
26
二、t分布
定义2: X,Y独立,且 ~ N (0,1),Y ~ 2 ( n),则 设 X
2 5
§2.3 常用统计分布
一、 分布
2
定义1: ( X1 , X n )为来自于正态总体(0,1)的样本 设 N
则称统计量: X X
2 2 1 2 n
所 服 从 的 分 布 为 自 由 是n的 2分 布 。 度 记 为 ~ ( n)
2 2
常用的结论:
(1) 若总体 ~ N (0,1),而 X1 , X 2 ,, X n )为来自 的 X ( X 一个样本,则统计量
i 1 n
p xi (1 p)1 xi
i 1
n
p i 1 (1 p)
p (1 p)
k
xi
n
n
xi
i 1
n
n k
其中k为观测值x1 , x2 ,, xn )中1的个数, 0,1,, n。 ( k
二、统计量
对数据进行加工、提炼和压缩,把样本中所含 的有关信息集中起来。 统计量: 不含有任何未知参数的样本的函数
a a0 a1 am1 am b
vi 表示n次重复独立观测得样本, X 2 ,, X n中落在 X1 区间 ai , ai 1 ]中的个数 (
vi n
P
P{ai X ai 1 }
ai 1
ai
f ( x )dx
vi ba 当m, n充分大时, n f (ai ) m
令vi 表示事件 X ai }在n次重复独立观测中出现 { 的次数
vi n
p1
p2
P
pi
n
v3 n
p3
p4
v1 n
v2 n
v4 n
连续型:
设总体 为连续型随机变量,密f (x)为未知的 X 度
ba 对 任 一 有 限 区 间 , b], 等 分 成 个 子 区 间 , 其 长 度 为 [a m m
随机变量
X t Y n 称为自由度为的t变量,它所服从的分布 n
称为t分布,记为 ~ t (n)。 t
Y 注: 若X ~ N (, 2 ), 2 ~ 2 ( n), 且X,Y独 立 , 则
X t ~ t ( n). Y n
定理5: 若t ~ t (n),则t的分布函数为
n1 n1 2 2 2 1 x f ( x) n n n 2
vn ( x) ~ B(n, F ( x)).
经验频数
经验分布函数:
vn ( x ) Fn ( x ) n
把样本值 1 , x2 ,, xn按值从小到大排序 x
x(1) x( 2) x( n)
则
0 k Fn ( x ) n 1
x x( 1 ) x ( k ) x x( k 1 ) x( n ) x k 1,2, , n 1
1 1 x e 2 , x 0, f ( x) 2 0, x 0.
恰好是参数为2的 2分布
23
又由X1, X 2 ,, X n独立同分布,根据 分布的可加性
2
得到
T 2( X1 X 2 X n ) 2n X 2 (2n)
24
例:设总体 体的样本。令