6.1-6.2母体与子样、经验分布函数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
称 1 , 2 , , n
为一组简单随机子样,简称为子样。
注:以下讨论的都是简单随机子样。 一般,对有限总体,放回抽样所得到的样本为简单随 机样本,但使用不方便,常用不放回抽样代替.而代替的条 N 件是 10
n
总体中个体总数
样本容量
设母体具有分布函数 F ( x ) ,
第
六
章
数理统计的基本概念
数 理 统 计 的 分 类
描述统计学 ——
对随机现象进行观测、试验, 以取得有代表性的观测值.
推断统计学 ——
对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性.
点估计 (第六章)
推断 统计学
假设检验 (第七章) 方差分析 (第八章) 回归分析 (第八章)
设( x 1 , x 2 x n ) 是取自分布为F (x)的母体中一个简单随机子样的 观测值,若把子样观测值由小到大进行排列得
x ( 1) x ( 2 ) x ( n ) ,
x 这里 x (1 ) 是子样观测值 ( x 1 , x 2 x n ) 中最小一个, ( i ) 是子样观测
一、教学目的与要求
1、掌握母体、子样、统计量等数理统计的基本概念; 2、熟练掌握正态总体的有关统计量的分布; 3、了解数理统计的基本思想方法以及应用领域。
二、教学重点和难点
本章的教学重点和难点都是正态总体的有关统计量的 分布。
§6.1 母体与子样、经验分布函数
主要内容
一、母体与个体 二、简单随机子样 三、经验分布函数
一、统计量的概念
我们知道子样是母体的反映,但是子样所含的信 息不能直接用于解决我们所要研究的问题,而需要把子 样所含的信息进行数学上的加工,使其浓缩起来,从而 解决我们的问题,这在数理统计学中往往通过构造一个 合适的依赖于子样的函数-------统计量来达到。
1.定义
定义6.1 一个统计量是子样的一个函数,如果子样容 量为n,它也就是n个随机变量的函数,并且要求这个 函数是不依赖于任何未知参数的随机变量,统计量的 分布称为抽样分布。
Fn ( x )
是一个分布函数,称作经验分布函数(或子
样分布函数)对于每一个固定的x,F n ( x ) 是事件“ x ”发生的 概率,当n固定时,它是一个随机变量,据贝努利大数定律,则
Fn ( x )
依概率收敛于F(x)即
n
0
有
lim P ( F n ( x ) F ( x ) ) 0
2
1
(x n
i 1
x)
2
1
n
xi x
2
2
2
i 1
分别为子样均值
和子样方差 S n
的观测值.
例 从一批机器零件毛坯中随机地抽取10件, 测得 其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199.求这组样本值的均值、方 差、二阶原点矩与二阶中心矩. 解 则 令
切可能结果的全体称为样本空间(子样空间)。
二、简单随机子样
定义:若 1 , 2 , , n 为来自母体 的一组子样,且满足
1 . 1 , 2 , , n 与母体具有相同的分布;
2 . 1 , 2 , , n 是相互独立的随机变量。
{( x1 , x2 , , xn ) xi 0,1, i 1,2, , n}
( 1 , 2 , , n )
的联合分布为
i 1 n
f 总 ( x1 , x 2 , , x n )
f ( xi ) p
xi
i 1
n
n
(1 p )
xi
i 1
n
概率函数的概念
2
( n )}
2 2
的 常 数 (n) 是 (n) 分 布 的 上 分 位 点 .
2
2.
t
分布
2
定 义 设 X N ( 0 ,1), Y ( n ), 且 X , Y 相 互 独 立 ,则 称 随 机 变 量 t X Y /n 为 n 的 t 分 布 , 记 为 t t ( n ). 对 于 给 定 的 0 1, 称 满 足 条 件 P { t t ( n )} 的 常 数 t ( n ) 是 t ( n ) 分 布 的 上 分 位 点 . 服从自由度
(x ) 2
2
2
e
( 1 , 2 n )
的联合概率函数为:
f ( x1 , x 2 x n )
i 1
n
f ( xi )
i 1
n
1 2
1
n 2
( xi ) 2
2
2
e
1 ( 2 )
n
e
2
( xi )
i 1
2
三、经验分布函数
实例1
设 1 , 2 , 3 是来自总体
2
N ( , ) 的一个
2
样本 , 其中 为已知 , 些是统计量 , 哪些不是
为未知 , 判断下列各式哪
?
T1 1 ,
T3 1 3 ( 1 2 3 ),
T2 1 2 e 3 ,
T 4 max( 1 , 2 , 3 ),
2
1.
2
分布
n 2
定 义 设 X 1 , X 2 , , X 的 样 本 ,则 称 自由度为 n的
2
来自标准正态总体
2 2
X1 X
X
2
2 n 2
服从
2
分 布,记 为
2
( n ). 2 n.
直接的计算可得 E
n, D
2
对 于 给 定 的 0 1, 称 满 足 条 件 P{
1, 0, 所取的产品是次品 所取的产品不是次品
服从参数为p 的0-1分布,可用如下表示方法:
f ( x, p) p (1 p) ,
x
1 x
x 0,1
设有放回地抽取一个容量为 n 的样本 其样本值为 样本空间为
( x1 , x 2 , , x n )
( 1 , 2 , , n ),
值中第i个小的数等,则
0 , x x (1) k F n ( x ) , x ( k ) x x ( k 1) n 1, x x ( n )
显然
Fn ( x )
是非减右连续函数,且满足
F n ( ) 0 , F n ( ) 1
由此可见
美国经济学家罗伯特 恩格尔
(Robert F. Engle 1942 ~) (Clive Granger 1934 ~)
英国经济学克莱夫 格兰杰
共同获得 2003年诺贝尔经济学奖
20 世纪 80 年代两位获奖者发明了新的统计方法 来处理许多经济时间数列中两个关键属性: 易 变 性 随时间变化的 非稳定性 恩格尔 研究方向主要是 利率、汇率和期权的金融计量分析 提出谱分析回归等创新性统计方法 格兰杰 的研究涉及 统计和经济计量学 特别是 时间序列分析、预测、金融、人口统计学、方法论 等领域.
2
来自标准正态总体
2 2
X1 X
X
2
2 n 2
服从
2
分 布,记 为
2
( n ). 2 n.
直接的计算可得 E
n, D
2
对 于 给 定 的 0 1, 称 满 足 条 件 P{
2
( n )}
2 2
的 常 数 (n) 是 (n) 分 布 的 上 分 位 点 .
是
2
Hale Waihona Puke Baidu
T5 1 2 2 ,
T7 1
2 2 2
T6
1 n
i 1
n
( i )
2
( 1 2 3 ).
T8
1
2
i
i 1
n
2
不是
2.常用统计量 定义6.2 1 , 2 n是由母体 取出的容量为n的子样, 统计量 统计量
的一组子样,则( 1 , 2 n ) 的联合概率函数为
n
f ( x1 , x 2 x n )
*
i 1
f ( xi )
例1.设母体 服从参数为 的泊松分布,( 1 , 2 n )
为取自母体 的一组子样,求( 1 , 2 n ) 的联合概率函数。 解:因为 所以
~ P ( ),
x
f ( x ) P ( x )
e
, x 0 ,1, 2
x!
从而 ( 1 , 2, , n ) 的联合概率函数为:
f ( x1 , x 2 x n )
*
i 1
n
f ( x i )
i 1
n
xi
e
xi !
xi
i 1
二、统计量的分布
定理6.1 设母体 的分布函数F(x)具有二阶矩,即
E , D
2
若 1 , 2 n 是取自母体的一个子样,则子样均值
的数学期望和方差分别为
E ,
D
n
2
1.
2
分布
n 2
定 义 设 X 1 , X 2 , , X 的 样 本 ,则 称 自由度为 n的
一、母体与个体
母体(总体):在数理统计学中我们把研究对象的全体
所构成的一个集合称为母体(总体)。
个体:而组成母体的每一单元成员称为个体。 随机抽样:在母体中按机会均等的原则随机的抽取一 些个体进行观测或测试的过程称为随机抽样。
样本(子样):从母体中随机抽取n个个体进行观测, 且这n个个体的某一指标为 ( 1 , 2 , , n ), 称这n个个体的指标 , , , 为一个样本(子样)。
S
2
1 n 1
1 n
i 1
n
i
2
称为样本均值;
1
n
i 1
n
2 ( i ) i n n 1 i 1
2
称为样本方差
统计量 统计量
Ak
k
1
n
i 1
n
k i
称为样本的k阶原点矩;
k
Bk
2
1 n
i 1
n
x 1 ! x 2 ! x n !
e
n
2 ~ N ( , ), ( 1 , 2 n ) 例2.设母体
为取自母体
的一组子样,求 ( 1 , 2 n ) 的联合概率函数。 解:因为 所以 从而
*
~ N ( , ),
2
f (x)
1 2
1 2 n
样本容量(容量):样本中的个体的数 目 这样本的样本容量(容量)。
1 , 2 , , n 的一组确定的值 x , x
1
n 称作为
样本值(观测值、数据):在一次抽样以后,观测到
2
, , xn
称为容
量为 n 的样本的样本值(观测值、数据)。
样本空间(子样空间):我们把样本 1 , 2 , , n 的一
进一步有
P sup F n ( x ) F ( x ) n 0 1 x
由此可见,当n相当大时,经验分布函数 函数F(x)的一个良好的近似。
F n ( x ) 是母体分布
§6.2
统计量及其分布
主要内容
一、统计量的概念 二、统计量的分布
若 为离散型随机变量,其分布列为 P 若 为连续型随机变量,其密度函数为 称
f (x)
X
, 令f ( x )
P x
;
p ( x ),
令
f ( x ) p ( x ).
f ( x ),
为
的概率函数,设母体 的概率函数为
( 1 , 2 n )为取自母体
n
的子样。则
1
, 2 , , n
的联合密度函数为
n
p ( x1, x2 ,, xn ) p ( xi )
* i 1
例如 设某批产品共有N 个,其中的次品数为M, 其 次品率为 pM /N
若 p 是未知的,则可用抽样方法来估计它.
从这批产品中任取一个产品,用随机变量 来描述它是否是次品:
n
( i )
n
称为样本的k阶中心矩.
2
统计量
S n B2
1
( n
i 1
i
)
1
n
i 1
n
2 i
2
.
若( x 1 , x 2 x n ) 是子样
( 1 , 2 , , n )
的一组观测值
x
1 n
i 1
n i
n
xi
n
Sn
1
, 2 , , n 为取自这一母体的容量为
n 的子样。则
*
1 , 2 , , n 的联合分布函数为
n
F ( x1 , x2 , , xn ) F ( xi )
i 1
设母体具有密度函数 p ( x ) ,
1
, 2 , , n
为取自这一母体的容量为
为一组简单随机子样,简称为子样。
注:以下讨论的都是简单随机子样。 一般,对有限总体,放回抽样所得到的样本为简单随 机样本,但使用不方便,常用不放回抽样代替.而代替的条 N 件是 10
n
总体中个体总数
样本容量
设母体具有分布函数 F ( x ) ,
第
六
章
数理统计的基本概念
数 理 统 计 的 分 类
描述统计学 ——
对随机现象进行观测、试验, 以取得有代表性的观测值.
推断统计学 ——
对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性.
点估计 (第六章)
推断 统计学
假设检验 (第七章) 方差分析 (第八章) 回归分析 (第八章)
设( x 1 , x 2 x n ) 是取自分布为F (x)的母体中一个简单随机子样的 观测值,若把子样观测值由小到大进行排列得
x ( 1) x ( 2 ) x ( n ) ,
x 这里 x (1 ) 是子样观测值 ( x 1 , x 2 x n ) 中最小一个, ( i ) 是子样观测
一、教学目的与要求
1、掌握母体、子样、统计量等数理统计的基本概念; 2、熟练掌握正态总体的有关统计量的分布; 3、了解数理统计的基本思想方法以及应用领域。
二、教学重点和难点
本章的教学重点和难点都是正态总体的有关统计量的 分布。
§6.1 母体与子样、经验分布函数
主要内容
一、母体与个体 二、简单随机子样 三、经验分布函数
一、统计量的概念
我们知道子样是母体的反映,但是子样所含的信 息不能直接用于解决我们所要研究的问题,而需要把子 样所含的信息进行数学上的加工,使其浓缩起来,从而 解决我们的问题,这在数理统计学中往往通过构造一个 合适的依赖于子样的函数-------统计量来达到。
1.定义
定义6.1 一个统计量是子样的一个函数,如果子样容 量为n,它也就是n个随机变量的函数,并且要求这个 函数是不依赖于任何未知参数的随机变量,统计量的 分布称为抽样分布。
Fn ( x )
是一个分布函数,称作经验分布函数(或子
样分布函数)对于每一个固定的x,F n ( x ) 是事件“ x ”发生的 概率,当n固定时,它是一个随机变量,据贝努利大数定律,则
Fn ( x )
依概率收敛于F(x)即
n
0
有
lim P ( F n ( x ) F ( x ) ) 0
2
1
(x n
i 1
x)
2
1
n
xi x
2
2
2
i 1
分别为子样均值
和子样方差 S n
的观测值.
例 从一批机器零件毛坯中随机地抽取10件, 测得 其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199.求这组样本值的均值、方 差、二阶原点矩与二阶中心矩. 解 则 令
切可能结果的全体称为样本空间(子样空间)。
二、简单随机子样
定义:若 1 , 2 , , n 为来自母体 的一组子样,且满足
1 . 1 , 2 , , n 与母体具有相同的分布;
2 . 1 , 2 , , n 是相互独立的随机变量。
{( x1 , x2 , , xn ) xi 0,1, i 1,2, , n}
( 1 , 2 , , n )
的联合分布为
i 1 n
f 总 ( x1 , x 2 , , x n )
f ( xi ) p
xi
i 1
n
n
(1 p )
xi
i 1
n
概率函数的概念
2
( n )}
2 2
的 常 数 (n) 是 (n) 分 布 的 上 分 位 点 .
2
2.
t
分布
2
定 义 设 X N ( 0 ,1), Y ( n ), 且 X , Y 相 互 独 立 ,则 称 随 机 变 量 t X Y /n 为 n 的 t 分 布 , 记 为 t t ( n ). 对 于 给 定 的 0 1, 称 满 足 条 件 P { t t ( n )} 的 常 数 t ( n ) 是 t ( n ) 分 布 的 上 分 位 点 . 服从自由度
(x ) 2
2
2
e
( 1 , 2 n )
的联合概率函数为:
f ( x1 , x 2 x n )
i 1
n
f ( xi )
i 1
n
1 2
1
n 2
( xi ) 2
2
2
e
1 ( 2 )
n
e
2
( xi )
i 1
2
三、经验分布函数
实例1
设 1 , 2 , 3 是来自总体
2
N ( , ) 的一个
2
样本 , 其中 为已知 , 些是统计量 , 哪些不是
为未知 , 判断下列各式哪
?
T1 1 ,
T3 1 3 ( 1 2 3 ),
T2 1 2 e 3 ,
T 4 max( 1 , 2 , 3 ),
2
1.
2
分布
n 2
定 义 设 X 1 , X 2 , , X 的 样 本 ,则 称 自由度为 n的
2
来自标准正态总体
2 2
X1 X
X
2
2 n 2
服从
2
分 布,记 为
2
( n ). 2 n.
直接的计算可得 E
n, D
2
对 于 给 定 的 0 1, 称 满 足 条 件 P{
1, 0, 所取的产品是次品 所取的产品不是次品
服从参数为p 的0-1分布,可用如下表示方法:
f ( x, p) p (1 p) ,
x
1 x
x 0,1
设有放回地抽取一个容量为 n 的样本 其样本值为 样本空间为
( x1 , x 2 , , x n )
( 1 , 2 , , n ),
值中第i个小的数等,则
0 , x x (1) k F n ( x ) , x ( k ) x x ( k 1) n 1, x x ( n )
显然
Fn ( x )
是非减右连续函数,且满足
F n ( ) 0 , F n ( ) 1
由此可见
美国经济学家罗伯特 恩格尔
(Robert F. Engle 1942 ~) (Clive Granger 1934 ~)
英国经济学克莱夫 格兰杰
共同获得 2003年诺贝尔经济学奖
20 世纪 80 年代两位获奖者发明了新的统计方法 来处理许多经济时间数列中两个关键属性: 易 变 性 随时间变化的 非稳定性 恩格尔 研究方向主要是 利率、汇率和期权的金融计量分析 提出谱分析回归等创新性统计方法 格兰杰 的研究涉及 统计和经济计量学 特别是 时间序列分析、预测、金融、人口统计学、方法论 等领域.
2
来自标准正态总体
2 2
X1 X
X
2
2 n 2
服从
2
分 布,记 为
2
( n ). 2 n.
直接的计算可得 E
n, D
2
对 于 给 定 的 0 1, 称 满 足 条 件 P{
2
( n )}
2 2
的 常 数 (n) 是 (n) 分 布 的 上 分 位 点 .
是
2
Hale Waihona Puke Baidu
T5 1 2 2 ,
T7 1
2 2 2
T6
1 n
i 1
n
( i )
2
( 1 2 3 ).
T8
1
2
i
i 1
n
2
不是
2.常用统计量 定义6.2 1 , 2 n是由母体 取出的容量为n的子样, 统计量 统计量
的一组子样,则( 1 , 2 n ) 的联合概率函数为
n
f ( x1 , x 2 x n )
*
i 1
f ( xi )
例1.设母体 服从参数为 的泊松分布,( 1 , 2 n )
为取自母体 的一组子样,求( 1 , 2 n ) 的联合概率函数。 解:因为 所以
~ P ( ),
x
f ( x ) P ( x )
e
, x 0 ,1, 2
x!
从而 ( 1 , 2, , n ) 的联合概率函数为:
f ( x1 , x 2 x n )
*
i 1
n
f ( x i )
i 1
n
xi
e
xi !
xi
i 1
二、统计量的分布
定理6.1 设母体 的分布函数F(x)具有二阶矩,即
E , D
2
若 1 , 2 n 是取自母体的一个子样,则子样均值
的数学期望和方差分别为
E ,
D
n
2
1.
2
分布
n 2
定 义 设 X 1 , X 2 , , X 的 样 本 ,则 称 自由度为 n的
一、母体与个体
母体(总体):在数理统计学中我们把研究对象的全体
所构成的一个集合称为母体(总体)。
个体:而组成母体的每一单元成员称为个体。 随机抽样:在母体中按机会均等的原则随机的抽取一 些个体进行观测或测试的过程称为随机抽样。
样本(子样):从母体中随机抽取n个个体进行观测, 且这n个个体的某一指标为 ( 1 , 2 , , n ), 称这n个个体的指标 , , , 为一个样本(子样)。
S
2
1 n 1
1 n
i 1
n
i
2
称为样本均值;
1
n
i 1
n
2 ( i ) i n n 1 i 1
2
称为样本方差
统计量 统计量
Ak
k
1
n
i 1
n
k i
称为样本的k阶原点矩;
k
Bk
2
1 n
i 1
n
x 1 ! x 2 ! x n !
e
n
2 ~ N ( , ), ( 1 , 2 n ) 例2.设母体
为取自母体
的一组子样,求 ( 1 , 2 n ) 的联合概率函数。 解:因为 所以 从而
*
~ N ( , ),
2
f (x)
1 2
1 2 n
样本容量(容量):样本中的个体的数 目 这样本的样本容量(容量)。
1 , 2 , , n 的一组确定的值 x , x
1
n 称作为
样本值(观测值、数据):在一次抽样以后,观测到
2
, , xn
称为容
量为 n 的样本的样本值(观测值、数据)。
样本空间(子样空间):我们把样本 1 , 2 , , n 的一
进一步有
P sup F n ( x ) F ( x ) n 0 1 x
由此可见,当n相当大时,经验分布函数 函数F(x)的一个良好的近似。
F n ( x ) 是母体分布
§6.2
统计量及其分布
主要内容
一、统计量的概念 二、统计量的分布
若 为离散型随机变量,其分布列为 P 若 为连续型随机变量,其密度函数为 称
f (x)
X
, 令f ( x )
P x
;
p ( x ),
令
f ( x ) p ( x ).
f ( x ),
为
的概率函数,设母体 的概率函数为
( 1 , 2 n )为取自母体
n
的子样。则
1
, 2 , , n
的联合密度函数为
n
p ( x1, x2 ,, xn ) p ( xi )
* i 1
例如 设某批产品共有N 个,其中的次品数为M, 其 次品率为 pM /N
若 p 是未知的,则可用抽样方法来估计它.
从这批产品中任取一个产品,用随机变量 来描述它是否是次品:
n
( i )
n
称为样本的k阶中心矩.
2
统计量
S n B2
1
( n
i 1
i
)
1
n
i 1
n
2 i
2
.
若( x 1 , x 2 x n ) 是子样
( 1 , 2 , , n )
的一组观测值
x
1 n
i 1
n i
n
xi
n
Sn
1
, 2 , , n 为取自这一母体的容量为
n 的子样。则
*
1 , 2 , , n 的联合分布函数为
n
F ( x1 , x2 , , xn ) F ( xi )
i 1
设母体具有密度函数 p ( x ) ,
1
, 2 , , n
为取自这一母体的容量为