多元选择模型概述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
组成的方程组。 打OK后,EVIEWS计算出每个观察值落入任一类别的可 能性,并将其储存在与因变量同名但附加上类别识别码 和模拟方案(Scenario)码的变量下。
17
举例:有序因变量模型估计
某政策出台后对居民收入有影响,由此对市民的政策支 持情况进行调查。通过调查取得了市民收入 (X) 、支持与否 (Y)的数据,其中如果选民支持则 Yi 取0,中立取1,不支持 取2。获得了24组数据,进行排序选择模型估计分析。
0 Yi* 1 * Y 1 Y 待估计的三元选择模型: i 1 i 2 * 2 Y i 2 待源自计的潜回归模型:1.模型的估计
Y * X u
待估计参数:
1 2
18
收入 X
550 600 650 700 750 800 900 1000
4
二、无序多元选择模型
无序的Probit计算复杂,故考虑有三种选择的Logit模型
P log 2 21 21 X P 1 P log 3 31 31 X P 1 P log 3 32 32 X P2
这意味着以下限制条件:
32 31 21 32 31 21
即只需要估计系统中的两个方程便可以得到所有参 数。
7
无序多元选择模型
如果样本属于重复试验,那么可以计算出与每 个组相联系的概率 rij/ni,然后计算出机会比的对 数,与X做回归。 式中 rij 表示组 i 中选择 j 的次数占该组观察对象 总数ni的比例 如果没有足够多的重复,则需要利用最大似然 法进行估计。
22
23
4、预测
因为排序选择模型的因变量代表种类或等级数据,所以 不能从估计排序模型中直接预测。 选择Procs/ Make Model,打开一个包含方程系统的没有标 题的模型窗口,单击模型窗口方程栏的Solve按钮。例中因变 量y*的拟合线性指标,拟和值落在第一类中的拟合概率被命 名为Y_0_0的序列,落在第二类中的拟合概率命名为Y_1_0的 序列中,落在第三类中的拟合概率命名为 Y_2_0 的序列中, 等等。注意对每一个观察值,落在每个种类中的拟合概率相 加值为 1 。 Y_0_0 , Y_1_0 , Y_2_0 分别是支持、中立、不支 持的概率,Y,INC是实际样本。
与二元选择模型类似,执行命令:
Proc/make equation/, 在Equation Specification对话框中选 择估计方法ORDERED,然后选择Normal,Logit,Extreme Value三种误差分布中的一种,单击OK按钮即可。
注意:
(1)估计式中列出或者不列出无常数项是等价的。 (2)EViews要求因变量Y是整数,否则将会出现错误信息, 并且估计将会停止。然而,由于我们能够在表达式中使用 @round、@floor 或 @ceil函数自动将一个非整数序列转化成 整数序列,因此这并不是一个很严格的限制。
在有序因变量模型中,因变量的值仅仅反映排序, 因而对其数值及间隔并无特殊要求。
例:序列(1,2,3,4)等同于序列(1,10,30,100)
因变量必须是整数,可以利用EVIEWS的函数功能 做转换(@Round, @Floor, @Ceil)
假设残差项u服从标准正态分布或logit分布,则可得 排序选择模型的概率形式。每个Y的概率为:
24
Procs
“ Make MODEL”
按“solve”
可得潜回归模型为:
11
二、有序因变量模型
同二元选择模型一样,我们可以考虑隐变量 y*的值取决于一组 * 自变量X,即: Yi X i ui 观察到的Y由Y*决定,即如果连续性随机变量Y*超过某个临界 值 ,则对应Y的一个确定性选择。两者的关系是:
0 1 Yi 2 M 如果Yi * 1 如果 1 Yi * 2 如果 2 Yi * 3 如果 M Yi *
第十章 多元选择模型
(Multiple-choice models)
1
本章内容
一、无序多元选择模型 二、有序因变量模型(Ordered data) 三、计数模型(Count data)
2
一、基本概念
对于多元选择模型,可以根据因变量的性质分为有序选择模 型和无序选择模型两种类型。
(一)无序模型:因变量Y表示观察对象的类型归属。
Log(P2/P3) 系数 标准差 -0.913 0.26 -2.569 0.51 0.453 0.32 -0.716 0.42 -0.689 0.29 0.174 0.33 0.531 0.34 0.260 0.33 0.136 0.31 -0.193 0.29
10
计算出的选择三种方式的可能性% 100% 80% 60% 40% 20% 0% 河北 吉林 江苏 广东 四川 甘肃 风险型 福利风险型 福利型
ˆ Y
收入 X
1250 1350 1450 1500 1550 1600 1650 1700
态 度 Y
2 2 2 2 2 2 2 2
ˆ Y
10.93937 11,81452 12.68967 13.12725 13.56482 14.00240 14.43997 14.87754
7.438772 8.313922 9.189072 9.626647 10.06422 10.50180 11.37695 12.25210
8
举例
用多元Logit模型分析农户合作医疗方式选择 数据:6个省的2505个农户的问卷调查,有951户做 出了选择。分析只利用此子样本。 合作医疗方式分为三类
福利型:每人年交5-10元,减免挂号、诊断、注射、处
理费; 福利风险型:每人年交20-100元,报销大病和小病的部 分医疗费用; 风险型:每人年交20-50元,报销大病的部分医疗费用。
Pr(Yi 0 X i , i , ) Pr(Yi 1 ) Pr(X u 1 ) F ( 1 X i ) Pr(Yi 1 X i , i , ) Pr( 1 Yi 2 ) Pr( 1 X u 2 ) F ( 2 X i ) F ( 1 X i ) Pr(Yi M X i , i , ) Pr(Y M ) Pr(X u M ) 1 F ( M X i )
14
有序Probit模型的概率
f (u )
0.4
0.3
0.2 0.1 Y=1 Y=2 Y=3 Y=4 Y=0 2 X X 1 X 3 X
0
u
15
估计该方程时的步骤为:
选择Quick→Estimate equation 在随后出现的对话窗口中,先选择模型设定窗口, 给出Y和X(不需要截距项: 选择一种估计方法(Probit, Logit, Extreme value) 确定估计模型所使用的样本区间 按OK后EVIEWS利用迭代求解法得出估计结果,包括 各自变量的参数及相应的统计值,各临界点和其统计 值,其他统计检验指标等。 若模型收敛,那么报告的内容具有意义。
例1:交通问题(走路、骑自行车、乘公共汽车、打出租
车、开私家车) 例2:就业问题:农民工就业行业选择;农村劳动力转移 (小城镇、县级市、地级市、 省级城市、大城、…) 例3:农户借贷(国有银行、信用社、民间借贷) 例4:超市购物选择 例5:农户土地流转(转包、出租、互换、转让、股份合 作)
态 度 Y
0 0 0 0 0 0 0 0
ˆ Y
4.813323 5.250898 5.688473 6.126048 6.563623 7.001198 7.876347 8.751497
收入 态 X 度 Y
850 950 1050 1100 1150 1200 1300 1400 1 1 1 1 1 1 1 1
排序模型的输入对话框
21
2、估计结果
估计收敛后,EViews将会在方程窗口显示估计结果。 表头包含通常的标题信息,包括假定的误差分布、估计样 本、迭代和收敛信息、Y的排序选择值的个数和计算系数 协方差矩阵的方法。在标题信息之下是系数估计和渐近的 标准误差、相应的z-统计量及概率值。然后,还给出了临 界值 LIMIT_1:C(2) , LIMIT_2:C(3) 的估计及相应的统计量。
ij ij ij
如果消费者选择了j,那么我们假定消费者由这一选 择获得的效用高于其他选择。 考虑效用比较的概率函数
Pr U ij U ik 所有的k j
就误差分布形式做出假定后得到可以估计的选择行 为模型。
6
无序多元选择模型
产生系数限制的原因:
P3 P3 P P3 P2 1 log P log P log P log P log P 2 1 2 1 1 31 31 X 21 21 X 31 21 31 21 X
3
(二)有序模型:观察到的因变量Y表示出按数值大 小(ordered)或重要性 (ranked)排序的分类结果:
例1:个人达到的教育水平分文盲、小学、初中、高中、
大学、研究生等 例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级; 例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等 例4:住房选择:租房、小户型、大户型、别墅 例5:银行信誉等级
式中F为残差项的累积分布函数。
有序因变量模型
参数估计:分类临界值和参数β 估计方法:极大似然法 极大似然函数:
L , Log Pr Yi j | X i , , I Yi j
i 1 j 0 N M
式中函数I(.)是一个指标函数,当括号中的逻辑关系 为真时等于1,反之等于0。 为了保证概率为正值,所有的必须满足 0 < 1< 2<…< M 。
需要注意的是,反映类型差异的数字是任意的,但必须保证当 有序因变量模型也有probit、logit 、extreme value三种形式可 12 供选择,用极大似然法(ML)进行参数估计。 事先也不确定,需要与β一起作为参数进行估计。
Yi* Y j* 时有 Yi Y j
有序因变量模型
即每个方程都假定,任两个选择的机会比对数是特征X的线 性函数。 由于所有概率之和等于1,因而机会比相互依赖,上述限制 使需要估计的参数由6个减少到4个。
5
对于无序选择模型,其行为选择假定出于优化一个 随机效用函数。 考虑第i个消费者面临着k种选择,假定选择j的效用 为: U z e
需要注意的问题有:
由于EVIEWS有估计参数数量限制,因而因变量的取值
不能太多(使用大样本时需要特别注意)。 若某一类别中的观察值过少,此时会造成识别困难。 在可能的情况下,应考虑将其合并到其他类别。
有序因变量模型不能用于预测因变量数值的大小, 但可以用于预测属于每个类别的可能性;
选择Procs/Make model EVIEWS打开一个文件,其中包括由每个类别的概率函数
9
因变量 河北 江苏 广东 四川 甘肃 最低收入组 低收入组 中收入组 高收入组 常数项
Log(P1/P3) 系数 标准差 -1.307 0.23 -0.859 0.26 -0.323 0.29 0.236 0.31 -1.617 0.29 -0.474 0.28 0.235 0.28 -0.315 0.28 -0.303 0.27 0.937 0.24