第三章回归模型的估计概论(高级计量经济学清华大学.pptx
第三章回归模型的估计概论(高级计量经济学清华大学
3、总体方差的估计
对=2=E(Y- Y)2= 2 (Y未知),类比法得
第三章回归模型的估计概论(高级计 量经济学清华大学
• 则E(S*2)=2,S*2为总体方差2的无偏估计。 • 尽管S2是2的有偏估计,但却是2的一致估计量。
第三章回归模型的估计概论(高级计 量经济学清华大学
4、总体协方差的估计 对=XY=Cov(X,Y)=E[(X-X)(Y- Y)],类比法得
我们可以寻找一个关于的估计量(estimator)T, 它是关于所抽样本Y的函数:T=h(Y)
对于某一样本(Y1,Y2,…,Yn)’,则有一个估计值 (estimate):
t=h(Y1,Y2,…,Yn)
第三章回归模型的估计概论(高级计 量经济学清华大学
一、衡量参数估计量优劣的准则 Criteria for an Estimator
• 而当上述总体回归函数呈现线性形式
•
E(Y|X)=X’0
•时,则称回归模型 Y=X’+u
•关于E(Y|X)正确设定,这时“真实”参数0等于最
佳线性最小二乘解*:
•
0=*=[E(XX|X)=0 E(Xu)=0
第三章回归模型的估计概论(高级计 量经济学清华大学
问题是:我们往往不知道总体的p(X,Y)。因此, 只能通过样本来估计总体的相关信息。
第三章回归模型的估计 概论(高级计量经济学清
华大学
2020/12/7
第三章回归模型的估计概论(高级计 量经济学清华大学
第二章指出,当联合概率分布p(X,Y)已知时,在 MSE最小化准则下,E(Y|X)是Y的最佳代表,被称 为是Y关于X的回归函数(regression function),也可 称为总体回归函数(population regression function)。
2024版计量经济学全册课件(完整)pptx
REPORTING
2024/1/28
23
EViews软件介绍及操作指南
EViews软件概述
EViews是一款功能强大的计量经济学 软件,提供数据处理、统计分析、模型
估计和预测等功能。
统计分析与检验
2024/1/28
详细讲解EViews中的统计分析工具, 包括描述性统计、假设检验、方差分
析等。
数据导入与预处理 介绍如何在EViews中导入数据,进行 数据清洗、转换和预处理等操作。
随着大数据时代的到来,机器学 习算法在数据挖掘、预测和分类 等方面展现出强大的能力,为计 量经济学提供了新的研究工具和 方法。
机器学习在计量经济 学中的应用领域
机器学习在计量经济学中的应用 领域广泛,如变量选择、模型选 择、非线性模型估计、高维数据 处理等。
机器学习在计量经济 学中的常用算法
机器学习在计量经济学中常用的 算法包括决策树、随机森林、支 持向量机(SVM)、神经网络等。 这些算法可以用于分类、回归、 聚类等任务,提高模型的预测精 度和解释力。
面板数据特点
同时具有时间序列和截面数据的特征,能够提供更多的信息、更多的变化、更少共 线性、更多的自由度和更高的估计效率。
2024/1/28
20
固定效应模型与随机效应模型
固定效应模型(Fixed Effects Model)
对于特定的个体而言,其截距项是固定的,不随时间变化而变化。
随机效应模型(Random Effects Mode…
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式, 解释因变量、自变量和误差项的含义, 阐述最小二乘法(OLS)进行参数估 计的原理。
高铁梅计量经济学课件共75页文档
6
在统计操作中会用到滞后序列,可以使用与滞后序列相同的 名字来产生一个新序列,把滞后值放在序列名后的括号中。
cs c cs(-1) inc 相当的回归方程形式为:
cs = c(1)+ c(2) cs(-1)+c(3) inc。 通过在滞后中使用关键词 to 可以包括一个连续范围的滞后 序列。例如:
§3.4 方程输出
在方程说明对话框中单击OK钮后,EViews显示估计结果:
根据矩阵的概念, 标准的回归可以写为:
yXβu
其中: y 是因变量观测值的 T 维向量,X 是解释变量观测值的
标准的单方程回归用最小二乘估计。其他的方法在以后的 章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的 方 程 可 以 用 一 个 公 式 说 明 。 非 线 性 方 程 不 允 许 使 用 binary , ordered,censored,count模型,或带有ARMA项的方程。
10
8
用公式说明方程的好处是可以使用不同的系数向量。 要创建新的系数向量,选择Object/New Object… 并从主 菜单中选择Matrix-Vector-Coef , 为系数向量输入一个名字。 然 后 , 选 择 OK 。 在 New Matrix 对 话 框 中 , 选 择 Coefficient Vector 并说明向量中应有多少行。带有系数向
3
§3.1 创建方程对象
EViews中的单方程回归估计是用方程对象来完成 的。为了创建一个方程对象: 从主菜单选择Object/New Object/Equation 或 Quick/Estimation Equation …,或 者在命令窗口中输入关键词equation。
第三章 回归模型的估计 概论(高级计量经济学-清华大学 潘文清)
2、极大似然估计
对具有pdf或pmf为f(Y;)的随机变量Y(其参数未知), 随机抽取一容量为n的样本Y=(Y1,Y2,…Yn)’其联合分布为:
gn(Y1,Y2,…Yn;)=if(Yi;) 可将其视为给定Y=(Y1,Y2,…Yn)’时关于的函数,称其为关于 的似然函数(likelihood function),简记为L() : L()= gn(Y1,Y2,…Yn;)=if(Yi;) 对离散型分布,似然函数L()就是实际观测结果的概率。 极大似然估计就是估计参数,以使这一概率最大; 对连续型分布,同样也是通过求解L()的最大化问题,来 寻找的极大似然估计值的。
二、类比估计法(The Analogy Principle)
1、基本原理
• 总体参数是关于总体某特征的描述,估计该参数, 可使用相对应的描述样本特征的统计量。 (1)估计总体矩,使用相应的样本矩
(2)估计总体矩的函数,使用相应的样本矩的函数 对线性回归模型: Y=0+1X+u
上述方法都是通过样本矩估计总体矩,因此,也 称为矩估计法(moment methods, MM)。 (3)类比法还有: • 用样本中位数估计总体中位数; • 用样本最大值估计总体最大值; • 用样本均值函数mY|X估计总体期望函数Y|X,等
可见,总体均值的极大似然估计就是样本均值,总 体方差的极大似然估计就是样本方差。
3、极大似然估计的统计性质
由数理统计学知识: (n-1)s*2/2~2(n-1)
因此, Var[(n-1)s*2/2]=2(n-1)
Var(S*2)=24/(n-1)
§3.2 估计总体关系 Estimating a Population Relation 一、问题的引入(Introduction)
计量经济学-3章:多元线性回归模型PPT课件
YXβ ˆe
Y ˆ Xβ ˆ
4/5/2021
.
17
2 模型的假定
(1) 零均值假设。随机误差项的条件期望为零,即 E(ui)=0 ( i=1,2,…,n)
其矩阵表达形式为:E(U)=0 (2)同方差假设。随机误差项有相同的方差,即
Var(ui)E(ui2) 2 (i=1,2,…,n)
(3)无自相关假设。随机误差项彼此之间不相关,即
(i=1,2,…,n)
上式为多元样本线性回归函数(方程),简称样本回归函 数(方程)(SRF, Sample Regression Function).
ˆ j (j=0,1,…,k)为根据样本数据所估计得到的参数估计量。
4/5/2021
.
13
(4)多元样本线性回归模型
对应于其样本回归函数(方程)的样本回归模型:
4/5/2021
.
3
教学内容
一、模型的建立及其假定条件 二、多元线性回归模型的参数估计:OLS 三、最小二乘估计量的统计性质 四、拟合优度检验 五、显著性检验与置信区间 六、预测 七、案例分析
4/5/2021
.
4
回顾: 一元线性回归模型
总体回归函数 E (Y i|X i)01X i
总体回归模型 Y i 01Xiui
0 0
2 0 0 2
0
0
0 0 0 2
2I n
4/5/2021
.
u1un
u2un
un2
20
(4)解释变量X1,X2,…,Xk是确定性变量,不是随机 变量,与随机误差项彼此之间不相关,即
Cov(Xji,ui)0 j=1,2…k , i=1,2,….,n
高级计量课件-第三章(1)-精选文档
a Y bX
11
例3-1上海经济的消费规律研究
年份
1981 1982 1983
可支配收入 消费性支出 X Y
636.82 659.25 685.92 585 576 615
年份
1990 1991 1992
可支配收 入X
2181.65 2485.46 3008.97
消费性支出 Y
1936 2167 2509
2
本章内容
第一节 线性回归模型及其假设 第二节 参数估计 第三节 线性回归拟合度评价、统计推断和 预测 第四节 线性回归问题诊断和处理
3
第一节 线性回归模型及其假设
一、线性回归模型 线性回归分析主要研究经济变量之间的线性因 果关系。 因果关系中作为原因的变量称为“解释变量”, 作为结果的变量称为“被解释变量”。 线性回归分析是典型的结构模型法计量经济分 析,以预先设定的线性回归模型为基础,而且 设定的模型一般有经济理论根据。
代替中的 ,得到服从自由度为
2
n K 1
31
(三)单参数置信区间
由于参数估计总是有偏差的,因此判断参数 真实性的可能范围有很重要的价值。 参数估计值的范围在统计上称为“置信区 间”。 利用根据参数估计量构造的t统计量构造各个 参数的置信区间: b k k tk t/2 2 1 )k1,k1 S (XX
21
同时满足线性性、无偏性和最小方差性的参数 估计量称为“最优线性无偏估计”(BLUE估 计)。 在模型假设成立的前提下,线性回归参数的最 小二乘估计是BLUE估计,这个结论也称为“高 斯──马尔可夫定理”。 BLUE估计是最小二乘估计最重要的小样本性质, 是对最小二乘估计有效性和价值的有力支持。
计量经济学第3章-多元线性回归模型PPT课件
第三章 经典单方程计量经济学模型:多元线性回 归模型
• 多元线性回归模型 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测
第3页/共63页
第一节 多元线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
第4页/共63页
一、多元线性回归模型
因为n < 30时构造不出用于检验的服从标准正态分布的统计量;
t 检验在 n k 8 时才比较有效,因为 n k 8 时 t 分布才比较稳定。 一般经验认为,当 n 30或者至少 n (3 k 1)时,才能满足基本要求。
第27页/共63页
第三节 多元线性回归模型的统计检验
一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间
X X1i
X
ki
X
2 ki
ki
ˆ0 ˆ1
ˆ k
1 X 11
X k1
1 X 12
X k2
1 Y1 X 1n Y2 X kn Yn
即
(XX)βˆ XY
由于X’X满秩,故有 βˆ (XX)1 XY
第19页/共63页
⃟正规方程组 的另一种写法 对于正规方程组
多元线性回归模型:表现在线性回归模型中的 解释变量有多个。
一般表现形式:
Yi 0 1 X 1i 2 X 2i k X ki i i=1,2…,n 其中:k为解释变量的数目,j称为回归系数
(regression coefficient)。
第5页/共63页
习惯上:把常数项(或截距项)看成为 一虚变量的系数,该虚变量的样本观测值始 终取1。于是: 模型中解释变量的数目为(k+1)
计量经济标准线性回归模型PPT课件
吸烟
肺癌
某种基因 第6页/共69页
2、因果分析的方法
第7页/共69页
6、因果分析的方法
吸烟 不吸烟
患癌症 40 20
未患癌症 60 80
吸烟 不吸烟
女性 患癌症
0 0
未患癌症 60 80
患癌症 40
男性 未患癌症 0
20
0
第8页/共69页
Granger检验
• 检验要求估计如下回归
p
p
Yt i X ti jYt j u1t
7.模型的评价
• MC要大于0,不能和X轴有交点:
b2 4ac 0
4
2 2
121 3
2 2
31 3
第44页/共69页
7.模型的评价
• 例2:洛伦兹曲线的估计
收L
入
累1
计
比 重
0.8
0.6
0.4
0.2
0O 0
L aF3 bF 2 cF
F 1, L 1
P
abc 1
c 1a b
L
D
一阶导大于0
• 常用手段: 1)增设二次项
适用于解释变量X对于被解释变量Y的边际影响取决于 解释变量X的水平的情况
Demand 0 1Advertisement 2 Advertisement 2 u
第27页/共69页
4.函数的设定 1 0, 2 0
第28页/共69页
4.函数的设定
1 0, 2 0
• 当在自变量数目不同的模型间进行选择时,修正R2更适合作为选择标准
第49页/共69页
7.模型的评价
• 帽子矩阵(hat matrix)——寻找杠杆点
Yˆi ˆ0 ˆ1 X i
回归分析课件-第三章
,
,
0 1 M p
1 2 M n
,
Y X
上海财经大学 统计与管理学院 7
第三章 多元线性回归分析
多元线性回归模型
假设 1. 自变量 x1, x2 ,K , xp 是确定性变量,不是随机变量,且
上海财经大学 统计与管理学院
5
第三章 多元线性回归分析
多元线性回归模型
若已经获得 n 组观测数据, xi1 , xi 2 ,K , xip ; yi , i 1, 2,K , n ,则
y1 0 1 x11 2 x12 L p x1 p 1 y x x L x 2 0 1 21 2 22 p 2p 2 L L L L L L L L yn 0 1 xn1 2 xn 2 L p xnp n
第三章 多元线性回归分析
多元线性回归模型参数的最小二乘估计
证明:由
n n n n 2 n 2 2 E ei E ei Varei E ei Varei 1 hii 2 i 1 i 1 i 1 i 1 i 1
假设 3. 正态分布的假设条件为:
1 , 2 ,K , n ~ N 0, 2
i.i.d .
上海财经大学 统计与管理学院
Байду номын сангаас
8
第三章 多元线性回归分析
多元线性回归模型
y X E ( ) 0, Var ( ) 2 I n
y X 2 ~ N (0, I n )
上海财经大学 统计与管理学院
14
高级经济计量学课件(绪论——第三章)
变量“线性”,参数”非线
24
随机扰动项ui
◆概念 各个 Yi 值与条件均值 E(Yi X i ) 的偏差 u i 代表排除在模型以外的 所有因素对Y的影响。
Y
u
Xi
X
◆性质: u i 是期望为0有一定分布的随机变量 重要性:随机扰动项的性质决定着计量经济方法的选择
25
◆引入随机扰动项的原因
13
高级计量经济学——本课程核心 第4部分 时间序列计量模型
第10章 第11章 第12章 第13章
时间序列模型 协整与误差修正模型 向量自回归模型 时间序列条件异方差模型
14
高级计量经济学——本课程核心 第5部分 回归分析的深入议题
第14章 面板数据计量模型 ——固定效应与随机效应模型 第15章 二元因变量模型 ——probit与logit回归模型 第16章 计量经济模型的建立 ——传统与现代计量经济学方法论
i
31
第二节 一元线性回归模型的参数估计
1、普通最小二乘法OLS
◆OLS的基本思想: ●不同的估计方法可得到不同的样本回归参 ˆ ˆ ˆ 数 1和 2 ,所估计的 Yi 也不同。 ˆ ●理想的估计方法应使 Yi 与 Yi 的差即剩余 ei 越小越好 ●因 ei 可正可负,所以可以取 ei 2 最小 即 ^ ^ 2 2 min ei min (Yi 1 2 X i )
三、一元线性回归模型
一元线性回归模型形式如下
Yi 0 1 X i ui
上式表示变量Yi和Xi之间的真实关系。其中Yi 称被解释变量(因变量),Xi称解释变量(自变 量),ui称随机误差项,0称常数项,1称回归系 数(通常未知)。 上述模型可以分为两部分。 (1)回归函数部分,E(Yi) = 0 + 1 Xi, (2)随机部分, ui 。
一元线性回归模型
平均的数学分数。
但对于某一个学生,他的数学分数可能与该平均水平
有偏差。
可以解释为,个人数学分数等于这一组的平均值加上
或减去某个值。用数学公式表示为:
Yi B1 B2 X i ui
其中,u i 表示随机扰动项,简称扰动项。扰动项是一 个随机变量,通常用概率分布来描述。
3.2
随机扰动项的来源
3.1
回归的涵义
例:学生的家庭收入与数学分数有怎样的关系?
总体回归函数(population regression function,PRF)
3.1
回归的涵义
根据上面数据做散点图
总体回归函数(population regression function,PRF)
3.1
回归的涵义
上图中,圆圈点称为条件均值;条件均值的连线称为
样本回归函数(sample regression function, SRF)
3.1
回归的涵义
对“线性”有两种解释:变量线性和参数线性。 变量线性:例如前面的总体(或样本)回归函数;下
“线性”回归的特殊含义
面的函数不是变量线性的:
E Y B1 B2 X ,
2 i
参数线性:参数B1、B2仅以一次方的形式出现。下面
通常,我们仅仅有来自总体的一个样本。 我们的任务就是根据样本信息估计总体回归函数。 怎么实现?
3.1
回归的涵义
表2-2、2-3的数据都是从表2-1中随机抽取得到的。
样本回归函数(sample regression function, SRF)
3.1
回归的涵义
通过散点得到两条“拟合”样本数据的样本回归线。
new-第三章 金融计量学-回归模型
第三章 回归模型及应用[学习目标]◆ 掌握一元线性回归及多元线性回归模型系数的估计和检验方法;◆ 掌握用普通最小二乘法求券的β系数及系统风险占总风险的比例;◆ 掌握多重共线、异方差、序列相关的检验及处理方法;◆ 理解货币需求函数稳定性的研究意义及实证研究方法;◆ 熟悉联立方程模型、面板数据模型、离散变量因模型的处理方法;◆ 熟练掌握用Eviews 计量经济软件进行线性回归模型的估计与检验。
考虑增加-虚拟变量的例子。
Logistic 的例子。
另外,主成分分析与信用评级的例子 样本内检验与样本外检验-滚动回归第一节 数据和模型在研究经济问题时所用的数据通常可分为以下三类:表3-1 数据的不同类型在金融计量学研究与实践中,时间序列数据占有很大比重。
在得到数据之后,可建立两种模型。
一种是回归模型,一种是时间序列分析模型。
回归模型主要是以揭示经济现象中的因果关系为目的,以一定经济理论为依据,考虑被研究的经济变量与其他变量之间的关系。
在数学上主要应用回归分析方法,在相当长的时间里代表了计量经济学的主流,故又称之经典线性模型1。
例如,研究某只股票价格变化率(收益率)T t R t ,,2,1, =的影响因素时,一种思路是考虑个股的价格变化受整个市场指数变化的影响,故可建立t R 与市场指数变化1 《高等计量经济学》李子奈、叶阿忠编,清华大学出版社2000年9月出版率的线性回归模型。
而时间序列分析模型较早的是由伯克斯-詹金斯(Box-Jenkins )1970年提出,其基本思想是不考虑被研究变量以外的其他变量,而是通过该变量本身的变化规律,应用变量的过去值通过某种机制来预测该时间序列现期及未来的变化。
如可以通过股票前期的价格变化率数据 ,,21--t t R R 来解释该股票本期的价格变化率t R 。
在上述两种方法建立模型时,都要求所用的数据具有平稳性2;而70年代以来以两次石油危机为先导造成的经济动荡,使各国经济变量表现出非平稳性并由此引起虚假回归问题3,促使了包括单位根检验、协整、误差修正模型、向量自回归技术等为主要内容的计量经济技术的重大发展。
高级计量经济学 广义回归模型
普通最小二乘法估计模型(7.3),得到 ˆ1 ,然后再利用(7.1)式求出 ˆ2 。
下面以道格拉斯(Douglass)生产函数为例,做进一步说明。
Yt = K Lt Ct eut
(7. 4)
其中 Yt 表示产出量,Lt 表示劳动力投入量,Ct 表示资本投入量。两侧取自
然对数后,
LnYt = LnKt + LnLt + LnCt + ut
但却使1、2的组合1+2的估计量的方差变小, 因此使该组合的估计变得更准确。
6.多重共线性的检验 (1)初步观察。当模型的拟合优度(R 2)很高,F 值很高,而每个回归
参数估计值的方差 Var(j) 又非常大(即 t 值很低)时,说明解释变量间可
能存在多重共线性。 (2)Klein 判别法。计算多重可决系数 R2 及解释变量间的简单相关系数
这里,X2’M1X2恰为如下辅助回归的残差平方和SSR X2=X1B+v
于是: Var(b2)=2/SSR
表明:第k个解释变量参数估计量的方差,由 模型随机扰动项的方差2 第k个解释变量的样本方差SXk2 第k个解释变量与其他解释变量的相关程度Rk2 样本容量n
四个方面的因素共同决定。
四个因素共同影响着bj方差的大小。 Rj2为Xj关于其他解释变量这一辅助回归的决定系数 1/(1-Rj2)称为方差膨胀因子(variance inflation factor)
3.多重共线性的经济解释
(1)经济变量在时间上有共同变化的趋势。如在经济上升 时期,收入、消费、就业率等都增长,当经济收缩期,收入、 消费、就业率等又都下降。当这些变量同时进入模型后就会 带来多重共线性问题。 (2)解释变量与其滞后变量同作解释变量。
高级计量经济学- 回归模型的估计PPT文档45页
coCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿
高级计量经济学- 回归模型 的估计
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
高级计量经济学系统回归模型
系统模型的一般形式
由于造成系统回归模型估计问题的根源不 同,因而相应的处理方法也不同。 现有的计量经济学软件提供了多种解决问 题的办法,从事应用研究的人员需要了解 各种方法所针对的问题,从而有能力选择 适当的技术,并对其做出正确的解释。
10
联立方程组模型的形式
结构形式(Structural form)
16
联立方程组模型产生的问题
在联立方程的结构式中,解释变量不仅包含前定 变量,而且包含内生变量,因而产生下列问题:
用作解释变量的内生变量与方程误差项出现相关;
此时用OLS得到的结构参数估计量是有偏的,并且是不
一致的; 方程间的误差项可能出现相关。
17
联立方程组模型产生的问题
下面用一个简单的联立方程模型来证明上述结论。 考虑由两个方程组成的方程组模型 Y1i 0 1Y2i 2 X i u1i Y2i 0 1Y1i 2 X i u2i
13
结构形式与简化形式的比较
简化形式参数是结构形式参数的函数,简化形式误差项是 结构形式误差项的函数。 简化形式参数考虑了内生变量之间的相互依存性,可以度 量前定变量的变化对内生变量的综合影响,包括直接和间 接影响。结构形式参数只表示单一自变量变化的直接影响。 简化形式本身是模型解的表达式,根据已知的外生变量值 和内生变量滞后值,可以由简化形式直接计算出内生变量 的值。 简化形式可以直接用于做政策分析和预测,但是结果的含 义不同于用结构模型做的预测。
22
模型识别的条件
设:
G=模型中内生变量(方程)的个数 K=模型中前定变量的个数; Gi=第i个方程中内生变量的个数; ki=第i个方程中前定变量的个数;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意:
(1)大样本BAN准则是小样本MVUE准则的渐近版 本(version);
(2)在计量经济学中,除了精确分布已知的情况, 最佳渐近正态性,或称为渐近有效性(asymptotic efficiency),是最常选择的准则。
(3)渐近有效估计量的直观表述为
二、类比估计法(The Analogy Principle)
1、基本原理 • 总体参数是关于总体某特征的描述,估计该参数,
可使用相对应的描述样本特征的统计量。 (1)估计总体矩,使用相应的样本矩
(2)估计总体矩的函数,使用相应的样本矩的函数 对线性回归模型: Y=0+1X+u
上述方法都是通过样本矩估计总体矩,因此,也 称为矩估计法(moment methods, MM)。
样本均值是样本的1阶原点矩,它是总体期望,即 总体1阶原点矩的无偏估计量。
E(T-)2 由于T关于的均方误有如下分解式
E(T- )2=Var(T)+[E(T)- ]2 记[E(T)- ]=E(T)- 为T关于的偏差(bias)。
Var(T)刻画了统计量T的真正的离散程度,如果 它较小,表明T不太受数据随机波动的影响;
如果E(T)-较小,表明T的分布密切围拢着。
定义: T is an unbiased estimator of iff E(T- )=0, for all .
对于某一样本(Y1,Y2,…,Yn)’,则有一个估计值 (estimate):
t=h(Y1,Y2,…,Yn)
一、衡量参数估计量优劣的准则 Criteria for an Estimator
1、有限样本准则
记T为所选取的统计量,则T与参数的差异可用 均方误(mean square error, MSE)刻画:
(3)类比法还有: • 用样本中位数估计总体中位数; • 用样本最大值估计总体最大值; • 用样本均值函数mY|X估计总体期望函数Y|X,等
Questions: Are analog estimator sensible from a statistical point of view?
How reliable are they? What shall we do when an analog estimator is unreliable?
(a) E(T- )=0 for all , and
(b) V(T)≤V(T*) for all T* such that E(T*- )=0
最小方差无偏估计量也称为无偏有效估计量 (Unbiased and efficient estimator)
2、无限样本准则(Asymptotic Criteria)
2、总体均值的估计 对E(Y)=,Var(Y)=2的某总体随机抽样,由类
比法(矩法)知:
记T=∑iciYi,ci为不全为0的常数。 E(T)=E(∑ciYi)=∑ciE(Yi)=∑ci Var(T)=∑ci2Var(Yi)=2∑ci2 于是,任何无截距项,系数和为1的Yi的线性组 合都是的无偏估计量。
根据样本估计总体构成了回归分析的主体内容。
§3.1 参数估计:概论 Parameter Estimation: General Approaches
设(Y1,Y2,…,Yn)’是从未知总体Y~f(Y)中随机抽取 的一个样本,并由此估计总体的特征,如参数。
我们可以寻找一个关于的估计量(estimator)T, 它是关于所抽样本Y的函数:T=h(Y)
有限样本往往需要知道估计量的精确分布,而这是建立 在对总体分布已知的情况下的。
如果总体分布未知,则需要依赖无限样本准则:
注意: (1)一致性的充分条件是:lim E(Tn)=, 且 lim Var(Tn)=0 (2)同一参数可能会有多个一致估计量。如从对称分布的
总体中抽样,则样本均值与样本中位数都是总体期望=E分同一参数不同的一致估计量, 需要从退化极限分布(degenerate limiting distribution) 转向渐近分布(asymtotic distribution)
尤其是,一致估计量具有以参数真实值为中心的 渐近正态分布(asymptotic normal distribution)。
要寻找最佳估计量,则需在约束∑ci=1下求解 min ∑ci2
记 Q=∑ci2-(∑ci -1)
则 Q/ci=2ci -
(i=1,2,…,n)
Q/= - (∑ci -1) 由极值求解条件得:
ci=/2, ∑ci =1 于是 ∑ci = n/2 =2/n, ci=1/n
Theorem. 从任何总体中进行简单随机抽样,样本均 值是总体期望的最小方差线性无偏估计量(minimum variance linear unbiased estimator,MVLUE)。
第三章 回归模型的估计: 概论
Regression Model Estimation: General Approaches
第二章指出,当联合概率分布p(X,Y)已知时,在 MSE最小化准则下,E(Y|X)是Y的最佳代表,被称 为是Y关于X的回归函数(regression function),也可 称为总体回归函数(population regression function)。
而当上述总体回归函数呈现线性形式
E(Y|X)=X’0
时,则称回归模型 Y=X’+u
关于E(Y|X)正确设定,这时“真实”参数0等于最
佳线性最小二乘解*:
0=*=[E(XX’)]-1E(XY)
且
E(u|X)=0 E(Xu)=0
问题是:我们往往不知道总体的p(X,Y)。因此, 只能通过样本来估计总体的相关信息。
对无偏估计量, MSE=Variance,因此,在实践 中还希望从无偏估计量中选择方差最小的。于是, 有如下最小方差无偏准则(minimum variance unbiasedness criterion)
定义: T is a minimum variance unbiased estimator, or MVUE, of iff