第九章 第3节定性因变量的建模20091215
第9章 经典单方程计量经济学模型专门问题PPT课件
一个以性别为虚拟变量考察企业职工薪 金的模型:
Y i01 X i2 D ii
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
7/17/2020
假定3>2,其几何意义:
保 健 支 出
大 学 教 育 高 中 教 育
低 于 中 学 教 育
收 入
7/17/2020
第9章 经典单方程计量经济学模型:
13
专门问题
• 还可将多个虚拟变量引入模型中以考察多种 “定性”因素的影响。
如在上述职工薪金的例中,再引入代表学 历的虚拟变量D2:
1 本科及以上学历
• 高中以下: E ( Y i|X i,D 1 0 ,D 2 0 ) 0 1 X i
7/17/2020
第9章 经典单方程计量经济学模型:
12
专门问题
• 高中: E ( Y i|X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i
• 大学及其以上: E ( Y i|X i , D 1 0 , D 2 1 ) ( 0 3 ) 1 X i
7/17/2020
第9章 经典单方程计量经济学模型:
9
专门问题
• 可以通过传统的回归检验,对2的统计显著性 进行检验,以判断企业男女职工的平均薪金 水平是否有显著差异。
年 薪 Y
男 职 工
女 职 工
2
0
工 龄 X
7/17/2020
第9章 经典单方程计量经济学模型:
10
专门问题
又例:在横截面数据基础上,考虑个人保 健支出对个人收入和教育水平的回归。
计量经济学第九章 时间序列结构模型课件
第九章结构型时间序列模型时间序列回归模型分类:1.不含外生变量的非结构型模型,包括单方程模型(如ARMA模型)和多方程模型(如向量自回归模型,V AR)2.传统的结构模型,包括含有外生变量的单方程回归模型(如确定性趋势或季节模型、静态模型、分布滞后模型、自回归分布滞后模型等)和联立方程模型3.协整和误差修正模型等现代时间序列模型第二、三类模型反统称为结构型时间序列模型。
本章将对最基本的几种结构型时间序列模型进行简要介绍。
第一节确定性趋势与季节模型确定性趋势与季节模型将经济变量看作是时间的某种函数,用于描述时间序列观测值的长期趋势特征和周期性变动特征。
其中的自变量是确定性的时间变量t或反映季节的虚拟变量。
由于自变量是非随机变量,自然是严格外生的,所以不涉及诸如非平稳性、高度持久等问题,一般可以如同横截面数据一样,直接使用经典线性模型的回归分析方法。
一、确定性趋势模型(一)种类按照因变量y与时间t的关系不同,常用的确定性趋势模型主要有以下三类:1.线性趋势模型01t t y t u ββ=++ (9.1)当时间序列的逐期增长量(即一阶一次差分1t t t y y y -∆=-)大体相同时,可以考虑拟合直线趋势方程。
2. 曲线趋势模型2012k t k t y t t t u ββββ=+++⋅⋅⋅++ (9.2)若逐期增长量的逐期增长量(二阶一次差分21t t t y y y -∆=∆-∆)大致相同,可拟合二次曲线2012t t y t t u βββ=+++。
类似地,如果事物发展趋势有两个拐点,可以拟合三次曲线230123t t y t t t u ββββ=++++。
其他更高次的曲线趋势比较少用。
3. 指数曲线模型01t u t t y e ββ= (9.3)或01ln()ln (ln )t t y t u ββ=++指数曲线的特点是各期的环比增长速度大体相同(即自然对数的一阶一次差分11/ln ln t t t t y y y y --∆≈-基本为常数),时间序列的逐期观测值大致按一定的百分比递增或衰减。
现代统计分析方法与应用第9章:定性数据的建模分析
收入情况
满意
不满意Biblioteka 合计高53
38
91
中
434
108
542
低
111
48
159
合计
598
194
792
首先要准备数据,上面的交叉列连表的数据要输入到spss的表格里去,具 体应当是如下:
频数 53 434 111 38 108 48
收入情况 1 2 3 1 2 3
满意情况 1 1 1 2 2 2
按上面的形式输入数据后,还不能马上进行对数线性模型分析,必须先激 活频数,即让频数有效。具体步骤是:
这样,本章仅介绍定性数据建模的对数线性模型和Logistic回归方法。
第1节 对数线性模型基本理论和方法
本节将利用2×2维的交叉列联表来说明对数线性模型的基本理论和方法, 同时利用SPSS软件对真实的经济定性数据作分析。
从下面的2×2维交叉列联表及其概率表,介绍对数线性模型的基本理论和 方法。
在对数线性模型分析中,要先将概率取对数,再分解处理,用公式表示
Logistic回归没有类似的假设,而且这些假设不满足时,结果非常稳定。 其次,即使满足假定,许多研究者仍偏好Logistic回归,因为它类似于回归 分析。两者都有直接的统计检验,都能包含非线性效果和大范围的诊断。因 为这些和更多技术原因,Logistic回归等同于两组的判别分析,在很多情况 下更加适用。再者,Logistic回归对于自变量没有要求,度量变量或者非度 量变量都可以进行回归,
如下:
ij
ln
pij
ln pi p j
pij pi p j
ln
pi ln
p j
ln
pij pi p j
计量经济学(内蒙古大学)第九章 联立方程模型(1)
• 为什么?
经世致用 管人悟道
内蒙古大学经济管理学院
2). 损失变量信息问题
C t 0 1Yt 1t I t 0 1Yt 2Yt 1 2 t Y C I G t t t t
• 如果用单方程模型的方法估计某一个方程, 将损失变量信息。 • 为什么?
经世致用 管人悟道
内蒙古大学经济管理学院
3). 损失方程之间的相关性信息问题
C t 0 1Yt 1t I t 0 1Yt 2Yt 1 2 t Y C I G t t t t
经世致用 管人悟道
内蒙古大学经济管理学院
3).先决变量(Predetermined Variables) • 外生变量与滞后内生变量(Lagged Endogenous
Variables)统称为先决变量。
• 滞后内生变量是联立方程计量经济学模型中重要 的不可缺少的一部分变量,用以反映经济系统的 动态性与连续性。 • 先决变量只能作为解释变量。
内蒙古大学经济管理学院
第九章 联立方程计量经济 模型理论方法(1)
经世致用 管人悟道
内蒙古大学经济管理学院
一、 问题的提出
1、经济研究中的联立方程计量经济学问题
2、计量经济学方法中的联立方程问题
经世致用 管人悟道
内蒙古大学经济管理学院
1、经济研究中的联立方程计量经济学问题
1). 研究对象
• 经济系统,而不是单个经济活动
经世致用 管人悟道
内蒙古大学经济管理学院
• 一般情况下,内生变量与随机项相关,即
Cov(Yt , t ) E((Yt E(Yt ))(t E(t )))
数据、模型与决策第九章到十章
追求至善 凭技术 开拓市 场,凭 管理增 创效益 ,凭服 务树立 形象。2 020年1 1月4日 星期三 下午5 时33分5 7秒17: 33:572 0.11.4
专业精神 和专业 素养, 进一步 提升离 退休工 作的质 量和水 平。202 0年11 月下午5 时33分 20.11. 417:33 Novemb er 4, 2020
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第四节 工序能力分析
工序能力指数是产品质量规定的变化范围与产品质量实际变化范围相比较 的结果。通常,我们就是依据Cp判断工序实际能力
第三节 控制图的制作与识别
控制图是质量过程监测的重要工具,统计过程控制实质上 是指运用控制图对产品生产过程中发生的质量波动实施实 时观察,并在这个基础上决定是否需要对生产过程进行调 整。控制图是贝尔实验室工程师休哈特博士发明滴,故又 称为哈特控制图,它是运用统计方法确定管理界限,并用 于管理监控的一种图表
3 控制图制作与识别
4 工序能力分析
第一节 质量因素与质量数据
质量管理是指确定质量方针、质量目标和质量职责,并在 质量体系中贯彻质量策划、质量控制、质量保证和质量改 进,从而使全部管理职能能得到有效实施的各种活动。
第一节 质量因素与质量数据
第一节 质量因素与质量数据
第二节 质量分析的一般方法
人生不是 自发的 自我发 展,而 是一长 串机缘 。事件 和决定 ,这些 机缘、 事件和 决定在 它们实 现的当 时是取 决于我 们的意 志的。2 020年1 1月4日 星期三 5时33 分57秒W ednesd ay, No vember 04, 2 020
计量经济学(内蒙古大学)第九章,联立方程模型(2)
2、从定义出发识别模型
例题1
Ct 0 1Yt 1t I t 0 1Yt 2 t Y C I t t t
Yt Ct 0 1Yt 2t
Ct 0 (1 1 )Yt 2t
• 第2与第3个方程的线性组合得到的新方程具有与消费方 程相同的统计形式,所以消费方程是不可识别的。同样 第1与第3个方程的线性组合得到的新方程具有与投资方 程相同的统计形式,所以投资方程也是不可识别的。于 是,该模型系统不可识别。
经世致用 管人悟道
内蒙古大学经济管理学院
Ct 0 1Yt 1t Ct 0 (1 1 )Yt 2t
• 如果利用C、Y的样本观测值并进行参数估计 后,很难判断得到的是消费方程的参数估计 量还是新组合方程的参数估计量。 • 只能认为原模型中的消费方程是不可估计的。 • 这种情况被称为不可识别。 • 只有可以识别的方程才是可以估计的。
经世致用 管人悟道
内蒙古大学经济管理学院
简化式模型
参数的关系体系
Ct 11 v1t I t 21 v2t Yt 31 v3t
0 0 1 1 0 11 ( 1 ) 1 1 1 0 1 0 0 1 21 (2) 1 1 1 0 0 31 (3) 1 1 1
方程(1)+(2),等式右边与(3)的右边相同, 与(3)矛盾。去掉一个矛盾方程后,有两个方程, 四个未知数,无法解出结构参数的估计量。也证明 消费方程与投资方程都是不可识别的。
经世致用 管人悟道
内蒙古大学经济管理学院
例题2
Ct 0 1Yt 1t I t 0 1Yt 2Yt 1 2t Yt Ct I t
第九讲定类或定序因变量回归分析课件
n
L
1
( xi )2
e 2 2
i1 2
ln L n ( xi ) 0
2
i 1
ln L n [ 1 (xi )2 ] 0
i1
3
n
xi
ˆ i 1
x
n
n
2
( xi x)
ˆ 2 i1
n
例3、估计logistic回归模型中的参数 由于logistic模型是二项分布,其似然函数为:
P = a + ∑βiXi + ε
对二项分布线性概率模型的结果解释:
在其他变量不变的情形下,x每增加一个单位,事件发生概率的
期望将变动β个单位。
例如,林楠和谢文(1988)曾用线性概率模型估测入党(政治
资本)的概率,模型为:
P = -0.39 +0.01A +0.04E +0.03U 其中:P—党员概率, A—年龄, E—受教育年限, U—单位身份
n
L=
i1
p yi i
(1
p )(1 yi ) i
n
ln( L)
ln[ i 1
p yi i
(1
pi )(1 yi ) ]
n
[ yi ln( pi ) (1 yi ) ln(1 pi )] i 1
n i 1
[
yi
ln( pi 1 pi
)
ln(1
pi )]
n
[ yi ( xi ) ln(1 e xi )] i 1
2 x2
e e1x1 e2x2 ek xk
k xk )
预测概率
将系数估计和自变量值代入logistic函数,便可得到
浙大宁波理工学院计量经济学第九章 联立方程模型和识别.答案
投资支出由外生决定的情况下,简单的凯恩斯收入决 定模型包括以下两个方程:
消费函数:Ct b0 b1Yt ut 收入恒等式:Yt C t I t 行为方程(技术方程) 平衡方程(定义方程)
其中,t是时间下标,u是随机误差项,并且, t
I St。
第九章 联立方程模型和识别 9.1 联立方程模型的概念
前定内生变量(滞后内生变量)
指内生变量的滞后值。
在联立模型中,前定变量都是解释变量。
12
第九章 联立方程模型和识别 9.1 联立方程模型的概念
问题思考:下列模型中,内生变量、外生变量、滞后变量
分别是哪些?哪些方程属于定义方程或平衡方程?
Ct 0 1 Pt 2 Pt 1 3 (Wt Wt ) 1t
第九章 联立方程模型和识别
学习内容与要求 本章主要介绍概念、类型以及识别 问题,重点内容是识别的方法。 要求通过本章学习,掌握联立方程 的基本含义,了解联立方程的类型,掌 握联立方程的识别方法。
1
第九章 联立方程模型和识别 内容安排
9.1 联立方程模型的概念
2 联立方程模型的类型 9.3 联立方程模型的识别问题
Qt D 11 12 P t 13Yt 1t Qt S 21 22 P t 23Tt 2t
(1) (2)
(1) (2)整理可得: Pt
Qt D QtS Qt
(3)
13 23 2t 11 21 Yt Tt 1t 22 12 22 12 22 12 22 12 将 22乘以(1)式减去12乘以(2)式可得: 12 2 t Qt 22 11 12 21 22 13 Yt 12 23 Tt 22 1t 22 12 22 12 22 12 22 12
定性因变量回归模型
10
Logit模型的特点
• 1、L的变化范围是正负无穷大之间,但P的范围在[0 ,1]
• 2、L是X的线性函数,P是X的非线性函数 • 3、Logit模型可以是多元的 • 4、当机会比率由1减到0时,L会变成负数,且在幅
度上越来越大,当机会比率由1升到无穷大时,L为 正且越来越大 • 5、beta系数表示x变化1单位时,机会比率的对数变 化的数量 • 6、利用机会比率对数的预测值,可以计算概率值 • 7、Logit模型假设机会比率的对数与X是线性关系
• (4)x增加1单位导致p的变化,方程两边对x求导
dp / dx 0.075* p *(1 p)
2021/3/10
13
.019
.018
.017
.016
CHP
.015
.014
.013
.012
.011 5 10 15 20 25 30 35 40 45
2021/3/10
X
14
15.8 非群组数据Logit模型估计
17
说明
• 1、估计方法是极大似然估计法,标准误为渐进标 准误(大样本有效)
• 2、检验统计量为Z统计量(正态分布) • 3、R-2无意义,报告McFadden R-2 • 4、全部系数的显著性检验用LR统计量 • 5、各系数的含义为对应变量变化1单位时,p/(1-p)
变化的比率
• 6、eviews中的预测为p的预测 • 7、预测成功率,yf>0.5,则yff=1,否则yff=0,比较
yff与y,两者对应位置相同计成功次数增加1
2021/3/10
18
第15章 定性因变量回归模型
2021/3/10
1
15.1 定性(离散)因变量模型的性质
第9章-定性数据的建模分析(含SPSS)
可得到Logistic回归方程为:
1 P
❖
e 0 1x1 2 x2 ... k xk
(9.4)
❖
P 1 e 0 1x1 2 x2 ...k xk
❖ 其中 0 、1 为常数和解释变量的系数, e 为自然数,其
曲线为s 型。
❖ 某一事件不发生地概率为: ❖ Prob(no event)=1- Prob(event) (9.5) ❖ 二元Logistic模型对数据要求为: ❖ (1)被解释变量应具二分特点。 ❖ (2)解释变量数据最好为多元正态分布。
❖ (3)Step卡方值是在建立模型的过程中,当前与下一步
❖ - 2ll 之间的差值。 ❖ SPSS将自动计算似然比卡方的观测值和相伴概率 p 值。
如果相伴概率值小于给定的显著水平 ,则应拒绝零假设; 反之,如果相伴概率值大于给定的显著水平,则不应拒绝零 假设。
❖ 2、回归系数的显著性检验
❖ Logit回归系数显著性检验的目的是逐个检验模型 中各解释变量是否与Logit有显著的线性关系,对解 释Logit是否有重要贡献。其原假设是,即某回归系 数与零无显著差异,相应的解释变量与Logit之间的 线性关系不显著。
第九章 定性数据的建模分析
本章内容
❖ 第一节 解释变量中含有定性变量的回归模型 ❖ 第二节 二项Logistic回归模型 ❖ 第三节 判别分析
第一节 解释变量中含有定性变量的回归模型
❖ 在回归分析中,我们对一些解释变量是定性变量 的情形先给予数理化,处理方法是引进只取0和1两 个值的虚拟变量。当某一属性出现时,虚拟变量取 值为1,否则为0。
❖ (三)二项Logistic回归模型中回归系数的含义 ❖ 在应用中人们通常更关心的是解释变量给发生比
(完整word版)应用回归分析,第9章课后习题参考答案
第9章 含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0—1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。
出现这种情况的原因是什么?答:假如这个含有季节定性自变量的回归模型为:t t t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。
对春夏秋冬四个季节引入4个0—1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然,(X ,D)中的第1列可表示成后4列的线性组合,从而(X ,D)不满秩,参数无法唯一求出。
这就是所谓的“虚拟变量陷井",应避免。
当某自变量x j 对其余p —1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型.称Tol j =1—2j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0。
0001。
也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。
⎪⎪⎪⎪⎪⎭⎫⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα9。
2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例9.1说明。
一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
第八、九章 答案
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i(4) 来自发达地区的城市男生,未得到奖学金时的月消费支出:E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
9 计量经济学模型若干专题
Econometrics第九章计量经济学模型若干专题(教材第七、十二章)第九章计量经济学模型若干专题9.1 模型选择9.2 分布滞后模型9.3 格兰杰因果关系检验9.4 非平稳时间序列计量建模技术初步9.5 虚拟被解释变量学习要点初步了解9.1 模型选择好的模型的性质f符合经济理论f简洁f可识别f拟合优度f预测能力模型设定偏误的类型f遗漏相关变量f包含不相关变量f不正确的函数形式f度量误差遗漏相关变量f 由于人们认识上的偏差、理论分析的缺陷,或者是统计数据的限制,可能有意或无意地忽略了某些重要变量。
f 假定一个正确的模型为:f 如果遗漏了解释变量X 3而把模型设定为:这种错误就称为遗漏相关变量造成的模型设定偏误。
f 遗漏相关变量的后果?12233i i i iY B B X B X u =+++122i i iY A A X u =++9.1 模型选择遗漏相关变量f 由于遗漏了解释变量9.1 模型选择遗漏相关变量f 后果(1)是有偏的,也是不一致的。
(2)如果遗漏的X 3和X 2不相关,b 32为零,是无偏的也是一致的,但是仍然有偏。
(3)根据遗漏变量模型得到误差方法是真实误差方差的有偏估计量;(4)从而估计量的标准差也是有偏的(5)最终置信区间和假设检验过程不再可靠。
2a 12a a 和1a 2σ2a 9.1 模型选择包含不相关变量f 在建立模型时,也有可能包括了无关解释变量。
f 假定一个正确的模型为:f 但研究者多加了与Y 关系并不密切的解释变量X 3:这种错误就称为包含不相关变量造成的模型设定偏误。
f 包含不相关变量的后果?12233i i i iY B B X B X u =+++122i i iY A A X u =++9.1 模型选择包含不相关变量f 与遗漏相关变量比较f 引入不相干变量的唯一代价是估计不有效简言之,OLS 估计量是ULE ,但不是BLUE 。
包含不相关变量:无偏且一致估计随机扰动项方差估计正确假设检验仍有效容易检测并可剔除不相干变量遗漏相关变量:有偏、不一致估计随机扰动项方差估计错误假设检验无效不容易发现9.1 模型选择包含不相关变量f 似乎“遗漏相关变量不如包含不相关变量”f 这种观点不值得推崇,因为增加不必要的变量,会导致(1)损失估计量的有效性,即更大的标准差;(2)引发多重共线性;(3)估计时自由度的损失。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、模型的解释
发生比的相对变化率
oddsX1 1 odds 100% e 0.0446 1 100% odds
1、模型的解释
自变量为定量变量的解释
回归系数的指数表示在其他因素不变情 况下,相应自变量增加1个单位,发生比 变化的幅度与方向,即发生比率。
价格上升1单位,发生比率为0.9564,即需求 超过100的发生比下降,变化率为-4.36%
1、模型的解释
自变量为定量变量的解释 需要了解自变量发生一个离散的变化, 如价格下降100元时,发生比的变化。
100%
oddsX 1 100 odds
e
odds e110.2 e 0.0446 X 1 100 e 0.00004 X 2 e 4.0563 X 3 e110.2 e 0.0446 X 1 e 0.00004 X 2 e 4.0563 X 3 100% 4.0563 X 3 0.0446 X 1 0.00004 X 2 110.2 e e e e e 0.0446 100 1 100%
1、模型的解释
自变量为虚拟变量的解释
p p ln ln 4.0563 1 p 1 p X 3 1 X 3 0 p 1 p X 3 1 p 1 p X 3 0
2
2
函数设定不当
线性概率模型是线性的,而实际是非线 性关系
0 / 1 X i 1 0 / 1:截距为 0 且斜率为 1; X i 1 0 / 1:截距为 1且斜率为0。
X i 0 / 1:截距为0且斜率为0;
函数设定不当
2、模型的数据与估计
进入模型的数据分为两类:
微观数据 分组数据
2、模型的数据与估计
微观数据
价格
2350 3000 2600 2550 2350 235 2400
促销
1000 25000 30000 0 30000 25000 20000
广告
20000 10000 0 0 30000 30000 30000
(二)Logit模型
pi ln 1 p 有三个好处: i pi 具有经济含义:事件的 发生比 1 pi pi 的取值范围: 0到 ,取对数后为 到 1 pi pi ln 1 p i 大再减缓再快速增大的 过程 随着pi的增大,呈现先快速增
Y 1
0 / 1
0
1 0 / 1
X
易出现无法解释的结果
由于函数形式设定不当,预测时很难避 免出现得到的Y值大于1或小于0的情况, 为结果的解释带来困难。
(二)Logit模型
又称Logistic模型,该模型克服了线性概 率模型的取值范围的弱点。
P Y 1X
exp 0 1 X 1 k X k 1 exp 0 1 X 1 k X k
e
4.0563
1、模型的解释
自变量为虚拟变量的解释: 回归系数的指数表示在其他因素不变情况 下,两种属性在发生比上的差异。
高等级与低等级,发生比率为57.76,即高等级 产品需求大于100的发生比为低等级的57.76倍
Tobit模型 适用于截取样本(Censored sample), 例如 在正值区间为连续变量,但总体中 有相当部分取值为0的情况
等级
0 0 0 0 0 0 0
需求
1 0 0 0 1 1 1
2、模型的数据与估计
分组数据
等级 0 0 1 总计 18 3 21 需求 1 23 36 59 总计 41 39 80
2、模型的数据与估计
对于微观数据,最小二乘法是无用武之 地的。
p ln 1 p 无法计算
2、模型的数据与估计
对于分组数据,为避免异方差,可以使 用加权最小二乘
关键在于同一分组有几个数据,可以计 算概率
2、模型的数据与估计
对于微观数据,一般采用极大似然估计 (Maximum Likelihood Estimation,MLE) 基本思想
假定一枚硬币,其抛掷后为正面的真实概率有 两种可能取值:0.1和0.01,如果做一次试验, 结果为正面,则应估计概率为0.1。
i 1 n
2、模型的数据与估计
exp 0 1 X i lnL n Yi 0 0 1 exp 0 1 X i i 1
exp 0 1 X i lnL n Yi X i 0 1 1 exp 0 1 X i i 1
线性概率模型的解释
ˆ 表示X 增加1个单位, i i ˆ Y取值为 1的概率增加 i ˆ 或者说Y的发生概率增加 i
(一)线性概率模型
线性概率模型的问题 1、异方差 2、常规检验失效 3、函数设定不当 4、易出现无法解释的结果
异方差
Yi 0 1 X i u i PYi 1 X i 0 1 X i
PYi pi 1 pi
Yi
n Y
1Yi
L pi i 1 pi
i 1
n
1Yi
exp 0 1 X i L 1 exp X i 1 0 1 i
Yi
exp 0 1 X i 1 1 exp X 0 1 i
PYi 0 X i 1 0 1 X i varu i E u i2 0 1 X i 1 0 1 X i 1 0 1 X i 0 1 X i 0 1 X i 1 0 1 X i
X
1 100%
1、模型的解释
自变量为虚拟变量的解释
p ln 1 p 110.2 0.0446X 1 0.00004X 2 4.0563X 3
X3 0 p ln 110.2 0.0446X 1 0.00004X 2 1 p X 3 0 X3 1 p ln 110.2 0.0446X 1 0.00004X 2 4.0563 1 p X 3 1
1、模型的解释
发生比和发生比率(Odds and Odd Ratio)
事件发生概率 odds 事件不发生概率 两个发生比之比即为发 生比率
发生比率是为了比较发生比而提出的指标
1、模型的解释
自变量为定量变量的解释
p ln 1 p 110.2 0.0446X 1 0.00004X 2 4.0563X 3 p odds exp110.2 0.0446X 1 0.00004X 2 4.0563X 3 1 p e110.2 e 0.0446 X 1 e 0.00004 X 2 e 4.0563 X 3 oddsX 1 1 oddsX 1 1 odds p 4.0563 X 3 0.0446 X 1 1 0.00004 X 2 110.2 e e e e 1 p X1 1 e 0.0446
2、模型的数据与估计
Hale Waihona Puke 极大似然估计主要适用于大样本(100以 上基本可以) 当大样本情况下,MLE将具有一致性、渐 近有效性和渐近正态性等优良性质。
2、模型的数据与估计
分组数据:加权最小二乘法 用根据样本获得的频率来代替概率,获 得对数发生比,进行计算。
E f i pi fi ln 1 f i f i pi u i pi u i ln 1 p u i i
(二)Logit模型
6 4 2 0 0 -2 -4 -6 0.2 0.4 0.6 0.8 1
(二)Logit模型
1、模型的解释 2、模型的数据与估计 3、模型的检验
1、模型的解释
p ln 1 p 110.2 0.0446X 1 0.00004X 2 4.0563X 3 p为需求量大于等于 100 的概率 X 1为价格; X 2为推广费用; X 3为等级。
虚拟被解释变量(因变量为定性 变量)
线性概率模型(LPM) Logit模型
(一)线性概率模型
Linear Probability Model Y 0 1 X 1 2 X 2 k X k u E Y X 0 1 X 1 2 X 2 k X k
1 1 exp 0 1 X 1 k X k
(二)Logit模型
记PYi 1 X i 为pi,为描述方便,假定只 有一个自变量。 pi
1
1 e 0 1 X1
1
0 Z
(二)Logit模型
e 0 1 X 1 发生事件的概率: pi 1 e 0 1 X 1 e 0 1 X 1 1 不发生事件的概率: 1 pi 1 0 1 X 1 1 e 1 e 0 1 X 1 pi e 0 1 X 1 1 pi pi ln 1 p i 0 1 X
n
ln1 pi
exp 0 1 X i Yi 0 1 X i ln1 1 exp X i 1 0 1 i Yi 0 1 X i ln1 exp 0 1 X i