几种统计分析模型介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
, k )
1 n
n i 1
Xi,
2
(
1
,
2
,
, k )
1 n
n i 1
X
2 i
,
k (1, 2 ,
, k )
1 n
n i 1
X
k i
从上述方程组中解出1, 2 , , k ,分别记作
ˆ1 ˆ1 ( X1, X 2 , , X n ), ˆ2 ˆ2 ( X1, X 2 , , X n ),
2 E( X 2 ) D( X ) E( X )2 2 2
令
12
A1, A 2,
即
A1
1 n
n i 1
Xi
X,
2
2
A2
1 n
n i 1
X
2 i
.
解此方程组得到 与 2 的矩估计量为
ˆ A1 X ,
经济数学模型:用数学方法描述经济活动。采用的 数学方法不同,对经济活动提示的程度不同,构成 各类不同的经济数学模型。
数理经济模型 计量经济学模型
本次培训主要模型
• 1、聚类分析 • 2、回归分析 • 3)因子分析和主成分分析 • 4)时间序列分析
第一部分:预备知识
样本与统计量
总体与样本 在数理统计中,把研究对象的全体称为总体
我们规定,使得 dL( ) 0的 ˆ就是θ的
d
极大似然估计值.由于ln x是单增函数,所以
与 L( ) 有ln 相L(同 )的驻点,因此只需从
d ln L( ) 0 d
(2)
中解出 ˆ 就是θ的极大似然估计值,称方程 (2)为极大似然方程.
例3 设总体X ~ N (, 2 ) ,与 2 未知,
ˆ 2
A2
A12
1 n
n i1
X
2 i
X
2
1 n
n i1
(Xi
X
)2.
注 此例说明,无论总体 X 服从什么分
布,样本均值 X 都是总体均值 的矩估计量, 样本二阶中心矩就是总体方差 的 矩2 估计
量.
例2 某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽 取12只,测得头部直径(单位:mm)如下:
福建省国家调查队系统统计建模培训
几种统计分析模型介绍
主讲人:张业圳 2009年6月8日
张业圳
福建师范大学经济学院副教授、博士、财金系副 主任
主要教学研究方向:数量经济学与金融实证分析 联系电话:87369087 13609525129 Email: zhangyz1971@126.com Q Q: 107345901 地址:福建师范大学经济学院 邮编:350108
X
与总体
i
X 具有相同的概率分布。
独立性——即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X 2 ,L , X n
是来自总体 X、与总体 X具有相同分布的随机变量.
ˆk ˆk ( X1, X 2 , , X n ).
以此作为未知参数 1, 2 , , k 的估计量,称为矩估计量.
如果样本观察值为( x1, x2, …,xn ),则
得未知参数 1, 2 , , k 的矩估计值为
ˆ1 ˆ1 (x1, x2 , , xn ), ˆ2 ˆ2 (x1, x2 , , xn ),
几个常用的统计量
设 ( X1, X 2,L , X n ) 是总体 X 的一个样本,
子样的K阶(原点)矩
子样的K阶中心矩
Ak
1 n
n i 1
X
k i
Bk
1 n
n i 1
Xi X
k
数据的简单处理
为了研究随机现象,首要的工作是收集原始数据. 一般通过抽样调查或试验得到的数据往往是杂乱无章 的,需要通过整理后才能显示出它们的分布状况。
众数:样本中出现最多的那个数。
数据的简单处理
(2)反映分散程度的特征数:极差、四分位差
极差——样本数据中最大值与最小值之差,R M m
四分位数——将样本数据依概率分为四等份的3个数椐, 依次称为第一、第二、第三四分位数。
第一四分位数Q1: PX Q1 0.25 第二四分位数Q2: PX Q2 0.5
其中θ为未知参数,取值范围为 .设 X1, X2, ,
Xn为n来自 X 的样本,则 X1, X2, ,Xn 的联合分布律
为 p(xi , ) .又设 x1, x2, , xn 为一组样本值,
令 i1
n
L( ) L(x1, x2 , , xn , ) p(xi , ), i 1
l (1 , 2 , , k ) E( X ,l ) l=1,2,…,k.
对于总体 X 的样本( X1, X2, …,Xn ),样本的 l 阶原点矩为
Al
1 n
n i 1
X,il l = 1, 2, …,k.
令
μl = Al , l=1,2,…,k,
即
1 (1, 2 ,
1 n
n i 1
Xi
样本方差(sample variance)
S 2 1 n n 1 i1
2
Xi X
几个常用的统计量
设 ( X1, X 2,L , X n ) 是总体 X 的一个样本,
样本均方差或标准差
S
1n
2
n 1 i1 X i X
它们的观测值用相应的小写字母表示.反映总 体X取值的平均,或反映总体X取值的离散程度。
称 L(θ)为样本的似然函数.
若有ˆ ˆ(x1, x2 , , xn ) ,使得对一切 ,有
L(ˆ) L( )
(1)
成立,则称 ˆ ˆ(x1, x2, , xn ) 为θ的极大( 或最大 )似然估计值,相应的统 计量 ˆ ˆ(X1, X2, , Xn称) 为θ的极大( 或最大 )似然估计量.
数据的简单处理是以一种直观明了方式加工数据。
它包括两个方面——数据整理 计算样本特征数
数据的简单处理
数据整理:将数据分组 作频率分布表
计算样本特征数:
计算各组频数 作频率直方图
(1)反映趋势的特征数
样本均值
X
1 n
n i 1
Xi
中位数:数据按大小顺序排列后,位置居中的那个数
或居中的两个数的平均数。
第三四分位数Q3: PX Q3 0.75
第二部分:参数估计
第一节 参数的点估计 一、点估计问题 设总体 X 的分布函数的形式为已知的F ( x,θ ) ,其中 x 是自变量,θ为未
知参数(它可以是一个数,也可以是一个向量).借助于总体 X 的一个样本
(X 1, X 2, …, X n ),来估计未知参数θ的值的问题,称为参数的点估计问题.
简单随机抽样
例如:要通过随机抽样了解一批产品的次品率, 如果每次抽取一件产品观测后放回原来的总量中,则 这是一个简单随机抽样。
但实际抽样中,往往是不再放回产品,则这不是一 个简单随机抽样。但当总量N很大时,可近似看成是简单 随机抽样。
例如:为了分析福建省居民家庭收入状况,对 福建省居民家庭收入进行调查。
ˆk ˆk (x1, x2 , , xn ).
上述估计未知参数的方法就叫做矩估计法.
例1 设总体 X 的均值为μ,方差为 ,2
且 0,但μ与 均未知,又设总体 X 的一个
样本为(X1, X2 , , Xn),求μ与 的 矩2 估计 量.
解 1 E( X ) ,
点估计的问题就是要构造一个适当的统计量 ˆ ˆ ( X1, X2, …,Xn ),用样 本的一组观察值( x1, x2, …,xn ),得到ˆ 的观察值 ˆ ˆ( x1, x2, …,xn ), 以此
来估计未知参数θ .称统计量 ˆ (ˆ X 1, X 2, …, X n )为θ的估计量,称 ˆ ˆ( x1, x2, …,xn )为θ的估计值.
统计量
定义 设( X1, X 2 ,L , X n )为总体X的一个样本,
f ( X1, X 2,L , X n ) 为不含任何未知参数的连续函数,则
称wenku.baidu.com
f (X1, X2,L
, X n )为样本( X1, X 2 ,L
,
X
)的一个统计量。
n
例如: 设 ( X1, X 2 , X3) 是从正态总体 N (, 2 ) 中抽取
二、矩估计法
设总体 X 的分布函数为F (x,1, 2 , , k ) , 其中1, 2 , , k 为 k 个未知参数. 假设总体 X 的
各阶原点矩 E( X l ) (l 1,2, , k)存在, 则E (X l )是
1, 2 , , k 的函数,记作μl=μl( 1, 2 , ,)k 即
ˆ 2
1 12
12 i1
( xi
x )2
1 [(13.3113.41)2 (13.38 13.41)2 12
(13.50 13.41)2
0.0059 .
三、极大似然估计法
1.设总体X为离散型随机变量,其分布律为
PX xk p(xk , ), k 1,2,
13.30 13.38 13.40 13.43 13.32 13.48 13.54 13.31 13.34 13.47 13.44 13.50
设铆钉头部直径这一总体 X 服从正态分布 N ( , 2 ) ,试求 与 2 的矩估计
值.
解 由例4可得
ˆ x 1 ( 13.30 13.38 13.50 ) 13.41, 12
(population)或母体,而把组成总体的每个单元 称为个体。
抽样 要了解总体的分布规律,在统计分析工作中,往往
是从总体中抽取一部分个体进行观测,这个过程称为抽 样。
样本与统计量
子样 在抽取过程中,每抽取一个个体,就是对总体X进
行一次随机试验,每次抽取的n个个体 X1, X 2 ,L , X n ,
( X1, X2 , … , Xn )为总体 X 的样本,求 与 2
的极大似然估计量.
解 X 的概率密度为
f (x, , 2 )
1
e ,
(
x)2 2 2
x
2
设 x1, x2,…, xn 为样本值,似然函数为
n
n
L(, 2 ) f (xi , , 2 )
1 2
n i1
xi
n
0,
ln L 2
n 2 2
1 2( 2 )2
n
(xi
i1
)2
0,
解得 与 2 的极大似然估计值为
ˆ
的一个样本,其中 为已知参数, 为未知参数,
则 X1 X 2 3 X3
X
2 1
3
X
2
X
3
是统计量
X1
X
2
X
2 3
X1X 2 X3 不是统计量
几个常用的统计量
设 ( X1, X 2,L , X n ) 是总体 X 的一个样本,
样本均值(sample mean)
X
i 1
i 1
1
( xi )2
e 2 2
2
1 n
(2 ) e , 2
1
2 2
n
( xi )2
i 1
n
ln L(, 2 ) n ln 2
2
n ln 2
2
1
2 2
n
(xi
i 1
)2.
令
ln L
经济统计分析
统计学研究如何测定、收集、整理、归纳和分 析反映客观现象总体数量的数据,以便给出正确认 识的方法论科学。
经济统计分析就是用统计方法来分析经济现 象数量特征和经济变量之间的关系。主要的工作 有: 1)分析经济现象中变量之间相互关系 2)经济预测 3)政策评价
什么是经济统计分析模型
模型 对现实的描述和模拟。 用不同方法对现实进行描述 和模拟,就构成不同的模型。语义模型、物理模型、 几何模型、数学模型和计算机模拟模型。
称为总体X的一个容量为n的样本(sample)或子 样;其中样本中所包含的个体数量称为样本容量。
子样 X1, X 2 ,L , X n 是n个随机变量,抽取之后 的观测数据 x1, x2 ,L , xn 称为样本值或子样观察值。
随机抽样方法的基本要求
代表性——即子样( X1, X 2 ,L
, X n)的每个分量