计量经济学导论斯托克第二课和第三课课件
2024版计量经济学全册课件(完整)pptx
REPORTING
2024/1/28
23
EViews软件介绍及操作指南
EViews软件概述
EViews是一款功能强大的计量经济学 软件,提供数据处理、统计分析、模型
估计和预测等功能。
统计分析与检验
2024/1/28
详细讲解EViews中的统计分析工具, 包括描述性统计、假设检验、方差分
析等。
数据导入与预处理 介绍如何在EViews中导入数据,进行 数据清洗、转换和预处理等操作。
随着大数据时代的到来,机器学 习算法在数据挖掘、预测和分类 等方面展现出强大的能力,为计 量经济学提供了新的研究工具和 方法。
机器学习在计量经济 学中的应用领域
机器学习在计量经济学中的应用 领域广泛,如变量选择、模型选 择、非线性模型估计、高维数据 处理等。
机器学习在计量经济 学中的常用算法
机器学习在计量经济学中常用的 算法包括决策树、随机森林、支 持向量机(SVM)、神经网络等。 这些算法可以用于分类、回归、 聚类等任务,提高模型的预测精 度和解释力。
面板数据特点
同时具有时间序列和截面数据的特征,能够提供更多的信息、更多的变化、更少共 线性、更多的自由度和更高的估计效率。
2024/1/28
20
固定效应模型与随机效应模型
固定效应模型(Fixed Effects Model)
对于特定的个体而言,其截距项是固定的,不随时间变化而变化。
随机效应模型(Random Effects Mode…
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式, 解释因变量、自变量和误差项的含义, 阐述最小二乘法(OLS)进行参数估 计的原理。
计量经济学课件PPT课件
非线性模型转换方法
多项式回归
通过引入自变量的高次项,将非线性关系转化为线性 关系进行处理。
变量变换
对自变量或因变量进行某种函数变换,以改善模型的 拟合效果。
非参数回归
不假定具体的函数形式,通过数据驱动的方式拟合非 线性关系。
实例分析:金融时间序列预测
数据准备
收集金融时间序列数据,如股票 价格、交易量等,并进行预处理。
模型选择依据
Hausman检验,LM检验等。
实例分析:经济增长收敛性问题研究
研究背景
探讨不同国家或地区间经济增长差异及其收 敛性。
模型构建
选择合适的面板数据模型,设定经济增长收 敛假设。
实证分析
收集相关数据,运用计量经济学软件进行回 归分析,检验收敛性假设是否成立。
结论与政策建议
根据实证结果得出结论,提出促进经济增长 收敛的政策建议。
机器学习算法与计量经济学模型结合
将机器学习算法与传统计量经济学模型相结合,形成更具解释性和预测能力的混合模型。
大数据背景下计量经济学挑战与机遇
01
大数据背景概述
数据量巨大、类型多样、处理速度快等 特点。
02
计量经济学面临的挑 战
数据质量、计算效率、模型可解释性等 问题。
03
计量经济学面临的机 遇
利用大数据技术挖掘更多信息,提高模 型预测精度和政策评估效果;同时推动 计量经济学理论和方法的发展创新。
Geary's C指数
与Moran's I指数类似,也是用于检验全局空间自相关。
LISA集聚图 用于检验局部空间自相关,可以直观展示空间集聚或异常 值区域。
空间滞后和空间误差模型选择
空间滞后模型(SLM)
计量经济学导论PPT课件
第一章 导 论
什么是计量经济学 计量经济学研究的步骤 计量经济学模型与数据 计量经济学的产生与发展
第一节 什么是计量经济学
◆ 计量经济学的定义 ◆ 计量经济学与其它学科的关系 ◆ 计量经济学的内容体系
一、计量经济学的定义
▼ 第一届诺贝尔经济学奖得主挪威经济学家R. Frisch将计量经济学定义为经济理论、统计学和 数学的结合;
▼ P.A.Samuelson、T.C.Koopmans、R.Stone将 计量经济学定义为“应用合适的方法对经济理论 和观察到的事实加以联系和推导,对现实经济现 象进行定量分析”。
一、计量经济学的定义
应用计量经济学——运用理论计量经济学所提供的理论
与方法研究 特定领域的具体经济活动的数量关系,侧重于建 立与应用模型过程中的实际问题的处理,除依赖理论计量经 济学外,需要依赖经济理论建立模型,根据具体的经济数据 进行分析、预测、评价等。
宏观计量经济学与微观计量经济学
区分依据:
对应于宏观经济学与微观经济学的划分
(对数学的应用)
第一,对非线性函数进行线性转化的方法和技巧,是 数学在计量经济学中的应用
第二,任何的参数估计归根结底都是数学运算,较复 杂的参数估计方法,或者较复杂的模型的参数估计, 更需要相当的数学知识和数学运算能力
第三,在计量经济理论和方法的研究方面,需要用到 许多的数学知识和原理
计量经济学与其它学科的区别
个人消费C
GDP
1980
2447.1
3776.3
1981
2476.9
3843.1
1982
2503.7
计量经济学课件PPT3
¼ò µ¥ µØ Ëæ × Å ½â ÊÍ ± ä Á¿ ¸ö Êý µÄ Ôö ¼Ó ¶ø Ôö ´ó £¬ µ±± ä Á¿ ¸ö Êý Ôö ¼Ó µ½ Ò» ¶¨³Ì
¶È ʱ£¬ Ëü ½« ¿ª ʼ Ï ½µ ¬£ Èç ͼ Ëù ʾ ¡£
r2
R2
1
1
K ± ä Á¿ ¸ö Êý
k Ôö ¼Ó ʹ µÃ r 2 Ôö ¼Ó £¬ ´Ó ¶ø R2 Ôö ¼Ó k Ôö ¼Ó £¬ ʹ µÃ R2 ¼õ ÉÙ · ¶ Χº£ R2 £ r 2 £¬ µ± n ® ¥ £¬ R2 ®r 2
K ± ä Á¿ ¸ö Êý
返回
12
二、方程显著性检验(F检验)
依据假设检验的原理和步骤,把模型作为一个 整体进行假设检验,检验模型中被解释变量 与解释变量之间的线性关系是否显著的成立。
s 2 1 n k 1 1 R TSS
r 2
sT
n 1
R2
1
RSS TSS
n
n
1 k 1
1
(1
r2)
n
n
1 k 1
11
引入调整可决系数的作用
Ìí ¼Ó ½â ÊÍ ± ä Á¿ £¬ Ôò r 2 Ôö ¼Ó ¡£ µ÷Õû ¿É ¾ö ϵ Êý R2 ¿¼ ÂÇ ÁË × Ô ÓÉ ¶È £¬ Æä ²¢ ²»
F显著性性检验检验模型总体线性关系的显著性。 两者有如上的关系。
拟合优度是感性的,不宜苛求,应以F检验为准。 但F检验它只是把模型作为一个整体进行了检验, 还应对模型中的各个变量进行检验,决定它们是 否应当保留在模型之中。
16
F检验的步骤
《计量经济学导论》课件
简单回归分析
通过单独的自变量和因变量建立线性回归方 程,了解不同变量之间的关系。
多元回归分析
通过多个自变量与因变量建立线性回归模型, 研究个体变量和经济体系之间关系的多元方 法。
假设检验
通过可靠的统计分析方法,掌握有强科学性 的实证检验体系,实现对数据有效性和可信 程度的评估。
三、回归模型的常见问题
计量经济学的应用领域
计量经济学应用广泛,涉及金融、政策、市场 等领域。它可以预测未来趋势、修复经济体系 中的异常、通过政策和决策可视化经济走向。
计量经济学的重要性
计量经济学是了解经济运行的内在规律和复杂 性的重要方式。它为预测未来趋势、指导政策
二、基础知识概述
数据类型
数字型、分类型、时间序列型等。掌握不同 数据类型的基本方法,可以更准确地描述数 字在数据分析和应用中的实际含义。
《计量经济学导论》PPT 课件
这堂课将带领您进入计量经济学的精彩世界,发掘数据背后的价值,实现对 数据的科学管理,提升对经济体系的理解和应用。快来开启您的计量之旅吧!
一、导言
什么是计量经济学?
计量经济学是一门探索kw【经济变量之间内在 关系】/kw的学问,可通过数据方法,深入研究 数字背后的规律,了解数字的真实含义。
1
多重共线性
独立变量之间具有高度相关性,导致
异方差性
2
难以准确度量变量对因变量的影响。
存在变量误差的果的可靠性和
准确性。
3
自相关性
存在观测值之间的相关性,导致参数
的不一致性和标准误的高估。
非常见事件与离群值
4
可能存在离群值和异常数据,影响分 析结果的稳健性和可靠性。
2 练习题解析和讨论
计量经济学导论-ch3 36页PPT文档
Now measures effect of education explicitly holding experience fixed
All other factors…
Hourly wage
Years of education
Labor market experience
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Multiple Regression Analysis: Estimation
Definition of the multiple linear regression model
„Explains variable in terms of variables
计量经济学课件第一章 导论
计量经济学课件第一章导论第一章导论1 / 52计量经济学课件第一章 导论2 / 52第一章 导论 关于导论导论是课程的纲。
学好导论,可以说学好了课程的一半,做到高屋建瓴。
导论课的目的:对《计量经济学》整体的概略认识,了解课程的性质、地位、内容体系和将要讲授的内容;了解课程的重点和难点;了解进一步学习的相关途径。
不必全懂,只需似懂非懂。
计量经济学课件第一章导论内容:●什么是计量经济学●计量经济学的基本研究方式●计量经济学中最基本的概念———变量、参数、数据和模型3 / 52第一节什么是计量经济学计量经济学课件第一章导论本节基本内容:●计量经济学的产生及发展●计量经济学的性质●计量经济学及其他学科的关系4 / 52什么是计量经济学?计量经济学课件第一章导论从感性认识到理性认识——先看实例:实例1:对中国经济增长的定量研究●中国经济总量的度量及增长的状况怎样?(GDP的度量、增长速度、波动)●分析影响中国GDP增长的因素有哪些?(如投资、消费、出口、货币供应量等)●中国GDP及各种影响因素关系的性质是什么?(如增加、减少)●各种因素对中国GDP影响的程度和具体数量规律是什么?(各种因素变动具体会引起GDP变动多少)●所作数量分析结果的可靠性如何?●对经济增长的政策效应分析、对中国GDP发展趋势的预测等5 / 52计量经济学课件第一章 导论 6 / 52实例2:中国家庭用汽车市场的研究 ●家用汽车市场状况如何?(用销售量观测)●影响汽车销量的主要因素是什么?(如收入、价格、费用、道路状况、政策、消费行为特征等) ●各种因素对汽车销量影响的性质怎样?(正、负)●各种因素影响汽车销量的具体数量关系是什么?●所得的分析结论是否可靠?●今后汽车市场的发展前景怎样?应如何制定汽车的产业政策?计量经济学课件第一章 导论 7 / 52 实例3:中国股票价格波动的研究 ●股票价格变动的情况怎样? (用股价指数观测) 25002000 1500●影响股票价格变动的主要因素是什么? 1000 50012/ 19/ 9010/ 19/ 94 SHZ S8/ 19/ 98 (基本面、资金、政策、利率、公司业绩、投资者信心等) ●股价及各种影响因素的关系是什么?(利空、利多)●各种因素影响的具体数量规律是什么?●所得的数量分析结果可不可靠?●今后股票价格的发展趋势可能会怎样?计量经济学课件第一章 导论8 / 52这类实例需要研究的共性问题: 确定作为研究对象的经济现象的变量●提出所研究的经济问题及度量方式(如GDP 、股票价格、汽车)●分析主要影响因素(根据经济理论、实际经验)选择若干作为影响因素的变量● 分析各种影响因素及所研究经济现象的相互关系决定相互联系的数学关系式● 确定所研究的经济问题及各种影响因素间的数量规律需要有科学的数量分析方法● 分析和检验所得数量结论的可靠性需要运用统计检验方法● 运用数量研究的结果作经济分析和经济预测对数量分析的实际应用计量经济学课件第一章 导论9 / 52 一、计量经济学的产生及发展产生的历史:起因:对经济问题的定量研究名词:1926年弗瑞希仿造出“Biometrics ”“Econometrics”标志:1930年成立计量经济学会说明: “计量经济学” “经济计量学” 9计量经济学课件第一章导论特点计量经济学的重要特点是它自身并没有固定的经济理论,计量经济学中的各种计量方法和技术,大多来自数学和统计学。
《计量经济学》ppt课件
04
时间序列分析
时间序列基本概念与性质
时间序列定义
按时间顺序排列的一组数据,反映现象随时间 变化的发展过程。
时间序列构成要素
现象所属的时间(横坐标)和现象在某一时间 上的指标数值(纵坐标)。
时间序列性质
长期趋势、季节变动、循环变动和不规则变动。
时间序列平稳性检验方法
图形判断法
通过观察时间序列的折线图或散点图,判断 其是否具有明显的趋势或周期性变化。
05
非参数和半参数估计方法
非参数估计方法原理及应用
原理
非参数估计方法不对总体分布做具体假设,而是利用样本数据直接进行推断。其核心思想是通过核密度估计、最 近邻估计等方法,对样本数据的分布进行平滑处理,从而得到总体分布的估计。
应用
非参数估计方法广泛应用于各种实际问题中,如金融市场的波动率估计、生物医学中的生存分析、环境科学中的 气候变化预测等。其优点在于灵活性高,能够适应各种复杂的数据分布,但同时也存在计算量大、对样本量要求 较高等问题。
计量经济学研究方法与工具
研究方法
主要包括理论建模、实证分析和政策评估等方法。
工具
运用数学、统计学和计算机技术等多种工具,如回归分析、时间序列分析、面 板数据分析等。
02
经典线性回归模型
线性回归模型基本概念
线性回归模型定义
描述因变量与一个或多个自变量之间线性关系的数学模型。
回归方程
表示因变量与自变量之间关系的数学表达式,形如 Y=β0+β1X1+β2X2+…+βkXk。
利用指数平滑技术对时间序列进行预测, 适用于具有线性趋势和一定周期性变化的 时间序列。
ARIMA模型
神经网络模型
计量经济学课件全完整版
时间序列平稳性检验方法
图形判断法
通过观察时间序列的折 线图或散点图,判断其 是否具有明显的趋势或 周期性变化。
自相关函数法
利用自相关函数描述时 间序列的自相关性,若 自相关函数迅速衰减, 则表明时间序列可能是 平稳的。
单位根检验法
通过检验时间序列是否 存在单位根来判断其平 稳性,常用的单位根检 验方法有ADF检验和PP 检验。
非线性模型定义
非线性模型指的是响应变量与解释变量 之间的关系无法用线性方程来描述的统 计模型。这类模型通常涉及到复杂的数 学函数和算法,用于拟合和预测非线性 关系的数据。
VS
非线性模型分类
根据模型的数学形式和特点,非线性模型 可分为多种类型,如多项式回归、神经网 络、支持向量机等。
广义线性与非线性模型比较
ARIMA模型
自回归移动平均模型,适用于平 稳和非平稳时间序列的预测,通 过识别、估计和诊断模型参数来 实现预测。
05
面板数据分析方法及应用
面板数据基本概念及特点
面板数据定义
面板数据,也叫时间序列截面数据或混合数 据,是指在时间序列上取多个截面,在这些 截面上同时选取样本观测值所构成的样本数 据。
参数解释
β0为截距项,β1至βk为斜率项,ε为随机误差项
最小二乘法估计
通过最小化残差平方和来估计参数β0, β1, ..., βk
回归模型假设条件及检验方法
线性关系假设
自变量与因变量之间存在线性关系
误差项独立同分布假设
误差项之间相互独立且服从同一分布
回归模型假设条件及检验方法
• 无多重共线性假设:自变量之间不存在完 全线性关系
时间序列分析与预测
时间序列基本概念及性质
Stock 计量经济学ppt一到三章
The Statistical Analysis of Economic (and related) Data
Brief Overview of the Course
Economics suggests important relationships, often with policy implications, but virtually never suggests quantitative magnitudes of causal effects. What is the quantitative effect of reducing class size on student achievement? How does another year of education change earnings? What is the price elasticity of cigarettes? What is the effect on output growth of a 1 percentage point increase in interest rates by the Fed? What is the effect on housing prices of environmental improvements?
9
Initial data analysis: Compare districts with “small” (STR < 20) and “large” (STR ≥ 20) class sizes:
Class Size Average score (Y ) Small 657.4 Large 650.0 Standard deviation (sBYB) 19.4 17.9 n 238 182
《计量经济学》课件
序计 量 经 济 研 究 的 工 作 程
(三)参数估计
矩法 常用的参数估计方法极大似然法
最小二乘法
• 矩法——以样本矩代替总体矩建立方程, 求解参数的方法。
• 极大似然法——根据极大似然原理建立方 程,求解参数的方法。
• 最小二乘法——根据最小二乘原理建立方 程,求解参数的方法。
(四)模型的检验
前定变量外 滞生 后变 变量 量
滞后内生变量 滞后外生变量
前期的内生变量 前期的外生变量
• (4)控制变量
• 控制变量——人为设置的反映政策要求、决策 者意愿、经济系统的运行条件和运行状态等方 面的变量。
模型设计工作
经济变量的确定 模型方程的设定
• 计量经济模型——为了研究分析经济系统中的经 济变量之间的数量关系而采用的随机性 的数学方程。 y f (x1, x2 ,, xn ) u
• 结构分析包括:(1)利用模型分析和测度系统 中某一变量的(绝对和相对)变化对其他变量 的影响;(2)比较分析变量及参数变化对经济 系统平衡的影响;(3)分析与研究变量相互关 系的变化对经济系统平衡点位移的内在联系。
• 政策评价——利用计量经济模型和计算机技术, 模拟在不同政策(或决策)条件下,经济系统 运行的态势和结果,对政策(或决策)进行评 价和优选。
济 学 概
• 数理经济学为计量经济学提供经济模型; • 经济统计学为计量经济学提供经济数据;
述 • 数理统计学为计量经济学提供分析工具和
研究方法;
计量经济学与相关学科的关系图
经济学
数理经 济学
计量经 济学
经济统 计学
数学
数理统 计学
统计学
(四) 计量经济学的分类
计
《导论计量经济学》课件
面板数据分析实例
面板数据分析实例
利用面板数据,分析不同个体在一段时间内的行为和表现。例如,分析不同国家在一段 时间内的经济增长和贸易情况。
面板数据模型选择
根据研究目的和数据特点,选择合适的面板数据模型,如固定效应模型、随机效应模型 等。
面板数据异方差性和序列相关性检验
在进行面板数据分析时,需要注意数据的异方差性和序列相关性,以避免模型估计的偏 误和无效。
参数估计与最小二乘法
总结词
估计模型参数的方法
详细描述
最小二乘法是一种常用的参数估计方法,通 过最小化预测值与实际观测值之间的残差平 方和来估计参数。具体来说,对于线性回归 模型,最小二乘法会找到一组参数值,使得 因变量的观测值与通过自变量和这组参数预
测的值之间的差距最小。
模型的检验与诊断
总结词
评估模型质量的过程
ABCD
机器学习与计量经济学的结合
机器学习算法的引入将有助于改进计量经济学模 型的预测精度和解释能力。
领域交叉融合
计量经济学将与金融、环境、生物等领域交叉融 合,拓展研究领域和应用范围。
计量经济学与其他学科的交叉研究
计量经济学与金融学的交叉研究
01
探讨金融市场中的资产定价、风险管理等问题。
计量经济学与环境学的交叉研究
描述变量之间的关系
详细描述
线性回归模型用于描述因变量和自变量之间 的线性关系,基本形式为 (Y = beta_0 + beta_1X_1 + beta_2X_2 + ldots + beta_kX_k + epsilon) 其中 (Y) 是因变量, (X_1, X_2, ldots, X_k) 是自变量,而 (beta_0, beta_1, ldots, beta_k) 是待估计 的参数,(epsilon) 是误差项。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Y 抽样分布的均值和方差
一般情况: Yi i.i.d. 取自任何分布, 不一定是 Bernoulli: 1 n 1 n 1 n 均值: E(Y ) = E( Yi ) = E (Yi ) = Y = Y n i 1 n i 1 n i 1 方差: var(Y ) = E[Y – E(Y )]2 = E[Y – Y]2
统计理论复习
统计推断的概率框架 贯穿计量经济学始终的三种类型的统计方法 估计 检验 置信区间 统计推断的概率框架
总体, 随机变量, 分布 分布矩 (均值, 方差, 标准差, 协方差, 相关系数) 条件分布、条件均值 从总体中随机抽取的样本服从的分布(抽样分布)
1
△
(1)总体、随机变量和分布
1 n n = 2 cov(Yi ,Y j ) n i 1 j 1 1 = 2 n
2 Y i 1 n
=
Y2
n
20
Y 抽样分布的均值和方差(续)
E(Y ) = Y var(Y ) =
Y2
n
结论:
1. 2.
Y 是Y 的无偏估计量(即, E(Y ) = Y) var(Y ) 与 n 成反比 抽样分布的离散程度与 1/ n 成比例 因此Y 的抽样不确定性与 1/ n 成比例(样本越大, 不确定性越小, 根号 n 定律)
8
相关系数度量了线性相关 性
9
条件分布和条件均值
条件分布 Conditional distributions
给定其他随机变量 X 取值时,Y 的分布 例: 给定 STR<20 时测试成绩的分布 条件期望 Conditional expectations 和条件矩 nditional moments 条件均值 = 条件分布的均值 = E(Y|X = x) (重要概念和符号) 条件方差 = 条件分布的方差 例: E(Test scores|STR < 20) = 小班规模的学区的平均测试 成绩
12
简单随机抽样下 Y1,…, Yn 的分布
由于个体 #1 和 #2 是随机抽取的, 因此 YB1取值中不包含 B : Y2 B 的信息。故 B Y1 B B 和 YB2B 是 独立分布的 independent distributed Y1 B B 和 YB2B 取自同一分布, 即, YB1, B YB2B 同分布 identically distributed 于是, 简单随机抽样下, YB1B 和 YB2B 独立同分布 (i.i.d.). 更一般地, 简单随机抽样下, {YiB }, B i = 1,…, n, i.i.d.
17
关于抽样分布我们要了解的:
Y 的均值是多少? 如果 E(Y ) =真实的 = .78, 则Y 是 of 的无偏 unbiased 估计量 Y 的方差是多少? var(Y ) 如何依赖于 n (著名的 1/n 公式) 当 n 较大时 Y 是否靠近 ? 大数定律: Y 是 的相合 consistent 估计量 当 n 较大时,Y 表现出钟形形状…普遍成立吗? 事实上, 当 n 较大时,Y 近似服从正态分布 (中心极限 定理)
6
测试成绩Test Score和学生教师比STR负相关:
相关系数也为负
7
相关系数是利用协方差定义的:
cov( X , Z ) XZ corr( X, Z ) = = rX Z var( X ) var( Z ) X Z
1 corr( X, Z ) 1 corr( X, Z ) = 1 表明完全线性正相关 corr( X, Z ) = 1 表明完全线性负相关 corr( X, Z ) = 0 表明不存在线性关系(线性不相关)
4
5
(3)2个随机变量: 联合分布与协方差
随机变量 X 和 Z 服从某一 联合分布 joint distribution X 和 Z 之间的协方差定义为 cov(X,Z) = E[(X – X)(Z – Z)] = XZ 协方差是 X 和 Z 线性关联程度的度量; 其单位为 X 的单位 ´ Z 的单位 cov(X,Z) > 0 表明 X 和 Z 正相关 若 X 和 Z 独立分布, 则 cov(X,Z) = 0 (反之不成立!!) r.v.与其自身的协方差就是它的方差 : 2 cov(X,X) = E[(X – X)(X – X)] = E[(X – X)2] = X
3
矩(续)
3 E Y Y 偏度 skewness = 3
Y
=分布不对称性的度量 偏度 = 0: 分布是对称的 偏度 > (<) 0: 分布具有右(左)长尾
4 E Y Y 峰度 kurtosis = 4
Y
= 尾部厚薄的度量 = 出现大值的可能性度量 峰度 = 3: 正态分布 峰度 > 3: 厚尾 (“尖峰 leptokurtotic”)
21
Y 的抽样分布
1. 对任何的样本容量(特别当样本容量较小时), Y 的分布 很复杂,但当总体服从正态分布时,Y 精确服从正态分布 2. n 较大时, 抽样分布很简单!
当 n 增大时, Y 的分布越来越紧密的聚集于 Y 周围(大数定律 Law of Large Numbers) 此外, Y 的分布近似为正态 (中心极限定理 Central Limit Theorem)
15
Y 的抽样分布(续)
例: 设 Y 取 0 或 1 ( Bernoulli 随机变量),服从概率分布,
Pr[Y = 0] = .22, Pr(Y =1) = .78 则 E(Y) = p1 + (1 – p)0 = p = .78 2 Y = E[Y – E(Y)]2 = p(1 – p) = .78(1–.78) = 0.1716
22
大数定律:
如果估计量落入总体真值区间内的概率当样本容量增大时 趋于 1,则称估计量是一致的
2 < ¥, 则 Y 是 Y 的一致估计 如果 (Y1,…,Yn) i.i.d. 且 Y
量,即, Pr[|Y – Y| < ] 1 as n ¥ 可以写为 Y Y (“Y Y” 意指 “Y 依概率收敛于 Y”). (数学推导: 当 n ¥, var(Y ) = Pr[|Y – Y| < ] 1.)
2
数
(2)总体分布矩: 均值、方差、标准差、协方差、相关系
均值 mean = Y 的期望值(期望)
= E(Y) = BYB = Y 多次重复取值的长期平均值
2P 方差variance = E(Y – BY) P B
2 = Y
= 分布平方散布的度量
标准差standard deviation = 方差 = BYB
min m (Yi m ) 2
i 1 n
p
因此, Y 使 “残差”平方和最小 推导: (参见附录 3.2)
这一框架允许我们能利用从总体中取出的样本进行有关总体 矩的严格统计推断
13
△ 估计 Estimation
Y 是均值的一个自然估计. 但:
(a) Y 的性质怎样? (b) 为什么我们不用其他估计量而用 Y 呢? Y1 B B (第一个观测) 利用不同的权重 – 而不是简单平均 Yn B) Median(YB1,…, B B (中位数) 出发点是 Y 的抽样分布
1 = E Yi Y n i 1
n 2
1 = E (Yi Y ) n i 1
n
2
19
于是
1 var(Y ) = E (Yi Y ) n i 1
n
2
1 n 1 n = E (Yi Y ) (Y j Y ) n j 1 n i 1 1 n n = 2 E (Yi Y )(Y j Y ) n i 1 j 1
14
(a) 的抽样分布 Y
Y 是一个随机变量, 其性质取决于 Y 的抽样分布
样本中的个体是随机抽取的 YBn) 因此 (Y1 B ,…, B B 的取值是随机的 Yn B) (Y1 B ,…, B B 的函数, 如 Y , 也是随机的: 抽到了不同的样本 则得到不同的值 在所有可能的容量为 n 的不同样本上Y 的分布称为Y 的抽 样分布. Y 的均值和方差即为其抽样分布的均值和方差 E(Y ) 和 var(Y ). 抽样分布的概念是整个计量经济学的基础.
Y 的抽样分布依赖于 n. 考虑 n = 2. Y 的抽样分布为, Pr(Y = 0) = .222 = .0484 Pr(Y = ½) = 2.22.78 = .3432 Pr(Y = 1) = .782 = .6084
Hale Waihona Puke 16当Y 服从Bernoulli分布(p = .78)时 Y 的抽样分布:
10
条件均值(续)
均值之差为两个条件分布均值的差:
= E(Test scores|STR < 20) – E(Test scores|STR ≥ 20) 条件均值的其他例题: 所有女职工的工资 (Y = 工资, X = 性别) 若 E(X|Z) =常数, 则 corr(X,Z) = 0 (但反之不一定成立)
总体(Population)
感兴趣的所有可能个体的集合 (学区) 我们将总体视为无限大 (∞近似于“非常大”)
随机变量(Random variable) Y
一个随机结果的数值概括 (地区平均测试成绩、学生教师比)
Y 的总体分布
Y 离散时:总体中出现的不同Y取值的概率,如Pr[Y = 650] Y 连续时:这些取值集合的概率,如Pr[640≤Y ≤660]
23