多元离散选择模型(课堂PPT)
合集下载
多元选择模型
❖ 如果没有足够多的重复,则需要利用最大似然 法进行估计。
多元选择模型
8
举例
❖ 用多元Logit模型分析农户合作医疗方式选择 ❖ 数据:6个省的2505个农户的问卷调查,有951户做
出了选择。分析只利用此子样本。 ❖ 合作医疗方式分为三类
福利型:每人年交5-10元,减免挂号、诊断、注射、处 理费;
❖ 这意味着以下限制条件:
3 23 1213 23 121
❖ 即只需要估计系统中的两个方程便可以得到所有参 数。
多元选择模型
7
无序多元选择模型
❖ 如果样本属于重复试验,那么可以计算出与每 个组相联系的概率rij/ni,然后计算出机会比的对 数,与X做回归。 式 中 rij 表 示 组 i中选择j的次数占该组观察对象 总数ni的比例
作)
多元选择模型
3
(二)有序模型:观察到的因变量Y表示出按数值大 小(ordered)或重要性 (ranked)排序的分类结果:
例1:个人达到的教育水平分文盲、小学、初中、高中、 大学、研究生等
例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级;
例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等
例:序列(1,2,3,4)等同于序列(1,10,30,100)
因变量必须是整数,可以利用EVIEWS的函数功能 做转换(@Round, @Floor, @Ceil)
❖ 假设残差项u服从标准正态分布或logit分布,则可得 排序选择模型的概率形式。每个Y的概率为:
PY ri (0Xi,i,)PY ri(1)PX r(u1)F(1Xi) PY ri (1Xi,i,)Pr1 (Yi2)Pr1 (Xu2)F(2Xi)F(1Xi)
多元选择模型
8
举例
❖ 用多元Logit模型分析农户合作医疗方式选择 ❖ 数据:6个省的2505个农户的问卷调查,有951户做
出了选择。分析只利用此子样本。 ❖ 合作医疗方式分为三类
福利型:每人年交5-10元,减免挂号、诊断、注射、处 理费;
❖ 这意味着以下限制条件:
3 23 1213 23 121
❖ 即只需要估计系统中的两个方程便可以得到所有参 数。
多元选择模型
7
无序多元选择模型
❖ 如果样本属于重复试验,那么可以计算出与每 个组相联系的概率rij/ni,然后计算出机会比的对 数,与X做回归。 式 中 rij 表 示 组 i中选择j的次数占该组观察对象 总数ni的比例
作)
多元选择模型
3
(二)有序模型:观察到的因变量Y表示出按数值大 小(ordered)或重要性 (ranked)排序的分类结果:
例1:个人达到的教育水平分文盲、小学、初中、高中、 大学、研究生等
例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级;
例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等
例:序列(1,2,3,4)等同于序列(1,10,30,100)
因变量必须是整数,可以利用EVIEWS的函数功能 做转换(@Round, @Floor, @Ceil)
❖ 假设残差项u服从标准正态分布或logit分布,则可得 排序选择模型的概率形式。每个Y的概率为:
PY ri (0Xi,i,)PY ri(1)PX r(u1)F(1Xi) PY ri (1Xi,i,)Pr1 (Yi2)Pr1 (Xu2)F(2Xi)F(1Xi)
《多元统计分析》课件
数据预处理和清洗
1
数据清洗
解决缺失值、异常值和重复数据问题。
2
标准化处理
对数据进行标准化、归一化和正态化处理。
3
变量选择
学习如何选择影响结果的重要变量。
描述性统计分析
1 中心趋势分析
运用平均值、中位数和众数等指标揭示数据的集中情况。
2 离散程度分析
探索数据的离散程度,如标准差和方差。
3 分布形态分析
识别数据分布的形态,如正态分布和偏态分布。
相关分析
线性相关
学习如何评估变量之间的 线性关系。
非线性相关
探索变量之间的非线性关 系,如曲线和曲面拟合。
相关系数
了解相关系数的计算方法 及其解释。
统计显著性检验
1
假设检验
学习如何根据样本数据推断总体参数。
2
置信区间
了解如何估计总体参数的范围。
3
显著性水平
确定显著性水平及其对推断的影响。
回归分析
线性回归
构建线性回归模型来预测因变量。
回归诊断
评估回归模型用。
多元方差分析
单因素设计
比较多个组之间的差异。
多重比较
确定组之间的具体差异。
二因素设计
考虑两个自变量对因变量的 影响。
《多元统计分析》PPT课件
探索多元统计分析的定义、概念和应用。从数据预处理到分析模型选择,帮 助解决实际问题。了解多元统计软件和未来发展方向。
数据结构和类型
结构
探索多元数据的各种结 构,包括矩阵、向量和 表格。
类型
了解多元数据的分类, 如连续型、离散型、定 类型和定序型。
示例
使用实际案例来展示多 元数据的结构和类型。
数学建模简明教程课件:离散模型
①最高层:这一层次中只有一个元素,一般它是分析问题 的预定目标或理想结果,因此也称为目标层.
5
②中间层:这一层次中包含了为实现目标所涉及的中间环 节,它可以由若干个层次组成,包括所需考虑的准则、子准则 ,因此也称为准则层.
③最低层:这一层次包括了为实现目标可供选择的各种措 施、决策方案等,因此也称为措施层或方案层.
16
⑤若A的最大特征值λmax对应的特征向量为W=(w1,…,
wn)T,则
aij
wi wj
, i, j 1,2,, n ,即
w1 w1
w1
w1 w2
wn
w2 w2
w2
A w1 w2
wn
wn wn
wn
w1 w2
wn
17
定理6.3 n阶正互反矩阵A为一致矩阵当且仅当其最大特
征根λmax=n,且当正互反矩阵A非一致时,必有λmax>n. 根据定理6.3,我们可以由λmax是否等于n来检验判断矩阵A
当CR<0.10时,认为层次总排序结果具有较满意的一致性
并接受该分析结果.
26
6.1.2 层次分析法的应用
在应用层次分析法研究问题时,遇到的主要困难有两个: (1)如何根据实际情况抽象出较为贴切的层次结构; (2)如何将某些定性的量作比较,接近实际以定量化处理. 层次分析法对人们的思维过程进行了加工整理,提出了一 套系统分析问题的方法,为科学管理和决策提供了较有说服力 的依据.但层次分析法也有其局限性,主要表现在: (1)它在很大程度上依赖于人们的经验,主观因素的影响很 大,它至多只能排除思维过程中的严重非一致性,却无法排除 决策者个人可能存在的严重片面性.
3
6.1.1 层次分析法的基本原理与步骤
5
②中间层:这一层次中包含了为实现目标所涉及的中间环 节,它可以由若干个层次组成,包括所需考虑的准则、子准则 ,因此也称为准则层.
③最低层:这一层次包括了为实现目标可供选择的各种措 施、决策方案等,因此也称为措施层或方案层.
16
⑤若A的最大特征值λmax对应的特征向量为W=(w1,…,
wn)T,则
aij
wi wj
, i, j 1,2,, n ,即
w1 w1
w1
w1 w2
wn
w2 w2
w2
A w1 w2
wn
wn wn
wn
w1 w2
wn
17
定理6.3 n阶正互反矩阵A为一致矩阵当且仅当其最大特
征根λmax=n,且当正互反矩阵A非一致时,必有λmax>n. 根据定理6.3,我们可以由λmax是否等于n来检验判断矩阵A
当CR<0.10时,认为层次总排序结果具有较满意的一致性
并接受该分析结果.
26
6.1.2 层次分析法的应用
在应用层次分析法研究问题时,遇到的主要困难有两个: (1)如何根据实际情况抽象出较为贴切的层次结构; (2)如何将某些定性的量作比较,接近实际以定量化处理. 层次分析法对人们的思维过程进行了加工整理,提出了一 套系统分析问题的方法,为科学管理和决策提供了较有说服力 的依据.但层次分析法也有其局限性,主要表现在: (1)它在很大程度上依赖于人们的经验,主观因素的影响很 大,它至多只能排除思维过程中的严重非一致性,却无法排除 决策者个人可能存在的严重片面性.
3
6.1.1 层次分析法的基本原理与步骤
《离散选择模型》课件
极大似然估计法
通过最大化似然函数,估计模型 的参数值。
差分法估计法
通过对变量的差分进行估计,减 少了共线性问题的影响。
一般化估计方程法
通过建立一般化估计方程,对参 数进行估计。
离散选择模型的应用
公共交通出行方式选择
分析人们在选择公共交通出行方式时的决策行为,为政府制定交通政策提供依据。
食品品牌选择
确定性
选择结果是确定的,参与者 不受随机因素的影响。
离散选择模型的数学模型
1Байду номын сангаас
多项式Logit模型
通过对选择概率进行建模,预测参与者选择各个选项的概率。
2
二项式Logit模型
基于二项分布,预测参与者是否选择某个选项。
3
线性概率模型
使用线性回归方法,预测选择某个选项的概率。
离散选择模型的参数估计方法
离散选择模型是一种描述人们在面临离散选择时决策行为的数学模型。
2 离散选择模型的应用领域
离散选择模型被广泛应用于诸多领域,如公共交通、市场营销和行为经济学等。
离散选择模型的基本假设
可比性
各个选择项之间可以进行比 较,存在客观标准用于决策。
独立性
参与者之间的选择行为是独 立的,不受其他参与者的影 响。
《离散选择模型》PPT课 件
离散选择模型是一种用于分析人们在面临离散选择时的决策行为的统计模型。 本课件将介绍离散选择模型的定义、基本假设、数学模型、参数估计方法、 应用、不足及未来发展方向。
什么是离散选择模型
离散选择模型是一种用于研究人们在面临可选项时所作出的离散决策行为的统计模型。
1 离散选择模型的定义
将离散选择模型与其他决策模 型进行结合,以提高模型的准 确性和解释能力。
多元选择模型
无序多元选择模型
❖ 如果样本属于重复试验,那么可以计算出与每 个组相联系的概率rij/ni,然后计算出机会比的对 数,与X做回归。 式中rij表示组i中选择j的次数占该组观察对象 总数ni的比例
❖ 如果没有足够多的重复,则需要利用最大似然 法进行估计。
8
举例
❖ 用多元Logit模型分析农户合作医疗方式选择 ❖ 数据:6个省的2505个农户的问卷调查,有951户做
log
P2 P1
21
21
X
log
P3 P1
31
31
X
log
P3 P2
32
32
X
❖ 即每个方程都假定,任两个选择的机会比对数是特征X的线 性函数。
❖ 由于所有概率之和等于1,因而机会比相互依赖,上述限制 使需要估计的参数由6个减少到4个。
5
❖ 对于无序选择模型,其行为选择假定出于优化一个 随机效用函数。
例1:个人达到的教育水平分文盲、小学、初中、高中、 大学、研究生等
例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级;
例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等
例4:住房选择:租房、小户型、大户型、别墅 例5:银行信誉等级
4
二、无序多元选择模型
❖ 无序的Probit计算复杂,故考虑有三种选择的Logit模型
❖ 产生系数限制的原因:
log
P3 P2
log
P3 P1
log
P1 P2
log
P3 P1
log
P2 P1
31 31X 21 21X 31 21 31 21X
❖ 这意味着以下限制条件:
32 31 21 32 31 21
数学建模离散模型PPT学习教案
1
1
1
1
2
2
2
2
4
(1)
竞赛图的 3种形式
34
34
(2)
34
(3)
3
(4)
• 具有唯一的完全路径,如(1);
• 双向连通图——任一对顶点存在两条 有向路径相互连通,如(4);
• 其他,如(2), (3) 。
竞赛 图的 性质
• 必存在完全路径;
• 若存在唯一的完全路径,则由它确定的
顶点顺序与按得分排列的顺序一致,如
第21页/共31页
层次分析法的优点
• 系统性——将对象视作系统,按照分 解、比 较、判 断、综 合的思 维方式 进行决 策—— 系统分 析(与 机理分 析、测 试分析 并列) ;
• 实用性——定性与定量相结合,能处 理传统 的优化 方法不 能解决 的问题 ;
• 简洁性——计算简便,结果明确,便 于决策 者直接 了解和 掌握。
• 怎样简化计算正互反阵的最大特征根和特征向量?
• 为什么用特征向量作为权向量? • 当层次结构不完全或成对比较阵有空缺时怎样用 层次分析法?
第20页/共31页
1. 正互反阵的最大特征根和特征向量的性质 2. 正互反阵最大特征根和特征向量的简化计算
根法——取列向量的几何平均 幂法——迭代算法 3. 特征向量作为权向量——成对比较的多步累积效应 4.不完全层次结构中组合权向量的计算 5. 残缺成对比较阵的处理 6. 更复杂的层次结构
最大特征根 1
2
…
权n向量
w1(3)
w2(3)
…
wn(3)
第11页/共31页
组合权向量
第 3层 对 第 2层 的计 算结果
离散选择模型ppt课件
PYi 1 / X i
6
例如,我们对一个是否拥有自有住房的案例进行回归,
结果如下: Yi 1.2009 0.1056X i (0.1483 ) (0.0087) R 0.8078
2
回归拟合的很好,经济学意义也非常明确,收入Xi每增加1单位 (1万元人民币),平均拥有住房的概率将增加10.56%:
11
2.解释变量同样为定性变量的情况
ቤተ መጻሕፍቲ ባይዱ
Pi Li ln 1 P 0 1 X i ui i P 1 ˆ Xi=1时: L1 ln 1 P 0 1 (1) 1 P0 ˆ Xi=0时: L0 ln 1 P 0 (2) 0 P 1 1 P 1 如果定义: OR P0 1 P 0 1 ˆ L ˆ 那么就有: lnOR L OR e 1 0 1
15
回归的结果如下:
. logit y x Iteration Iteration Iteration Iteration 0: 1: 2: 3: log log log log likelihood likelihood likelihood likelihood = = = = -253.69187 -242.36572 -242.32729 -242.32729 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 Std. Err. .2910729 .1179409 z 4.50 -2.10 P>|z| 0.000 0.036 = = = = 366 22.73 0.0000 0.0448
这意味着在其他条件都相同的情况下,抽烟人士患食道癌的 可能性是不抽烟人士的3.7倍还要多。
多元离散选择模型
nJ
lnL
dijlnP(yi j)
i1 j0
Ex1. Binary Logistic Model Result
Dependent variable: honcomp
Stata Output
Multinomial Logistic Model Result
Dependent variable: prog
多元离散选择模型
二○一一年十月
本讲内容
多元离散选择模型 定序选择模型
一、多元离散选择模型
与上次讲的有何不同?
问题:农村异地转移劳动力的迁移目的地
被解释变量:迁移目的地,即小城镇、县级市、地级市、 省级城市和超大城市,依次取值1、2、3、4、5。
解释变量:个人特征、家庭特征和目前所在地属性。连续 变量包括受教育程度、家庭规模、家庭内其他劳动力人数、 家庭负担、原有收入、现有收入,目前所在地属性中的所 在地农村人口、国内生产总值、城乡居民储蓄余额、粮食 产量、中学生在校人数、小学生在校人数等。离散变量包 括性别、婚姻状况、收入稳定与否,目前所在地所属级别 与家乡所在地所属级别等。
Multinomial Logistic Model
Multinomial logistic regression involves nominal response variables more than two categories
Multinomial logit models are multi-equation models
小城镇、县级市、地级市、省级城市和超大城市依 次取值1、2、3、4、5。
最终模型的估计结果(部分)
变量 常数项
教育程度
家庭情况
模型序号 系数估计 标准差
离散因变量模型演示文稿
P(
* i
Xi)
1
P(
* i
Xi)
1 F (Xi) F (Xi)
F(t) 1 F(t)
E( yi Xi ) 1 P 0 (1 P) F (Xi)
Y E(Y X )
总体回归模型
样本回归模
Y F ( XB) y型i F ( Xi B) i (i 1, 2......n)
(三) 二元选择模型随机误差项及斜率
E( yi X i ) 1* P( yi 1 Xi ) 0 * P( yi 0 Xi ) 1 pi 0 (1 pi ) pi
yi E( yi Xi ) i pi i Xi B i
x j 对响应概率(p)的偏效应: j
LPM的估计方法:OLS
➢ 线性概率模型存在的问题及适用性
离散因变量模型 演示文稿
(优选)离散因 变量模型
一、 二元选择模型
❖ 二元选择模型的理论模型 ❖ 二元选择模型经济计量的一般模型 ❖ 线性概率模型(LPM) ❖ Logit 模型 ❖ Probit 模型
(一) 二元选择模型的理论模型
选择理论:效用是不可观测的,只能观测到选择行为
U
1 i
Xi 1
0
189
1
19
0
354
(1) Logit 模型的分布函数
如果选择
eZ
1
1
F(Z) 1 eZ 1 1 eZ 1 eZ
1
0.8 0.6 0.4
0.2 0 0
5
10
15
20
25
30
Logistic分布函数
具有以上分布函数的二元选择模型称为Logit模型。
(2) Logit 模型的设定
《选择模型》PPT课件
对数似然函数为
(7.1.11) (7.1.12)
N
ln L {yiln F (x iβ )(1yi)ln 1 [F (x iβ )](} 7.1.13) i 函数的一阶条件为
lβ n LiN 1 yF iifi (1yi)(1 fF ii) xi 0
(7.1.14)
图7.3 精O选pt课io件npsp对t 话框
21
Option对话框有以下几项设置:
① 稳健标准差 (Robust Standard Errors) 对二元因变
量 模 型 而 言 , EViews 允 许 使 用 准 - 极 大 似 然 函 数
(Huber/White)或广义的线性模型(GLM)方法估计标
精选课件ppt
16
在回归结果中还提供几种似然函数: ① log likelihood是对数似然函数的最大值L(b),b是
未知参数 的估计值。
② Avg. log likelihood 是用观察值的个数N去除以对数 似然函数L(b) ,即对数似然函数的平均值。
③ Restr. Log likelihood是除了常数以外所有系数被限 制为0时的极大似然函数L(b) 。
下约束变量的个数的2分布。
⑥ McFadden R-squared是计算似然比率指标,正 像它的名字所表示的,它同线性回归模型中的R2是类似 的。它具有总是介于0和1之间的性质。
精选课件ppt
18
利用式(7.1.10),分布函数采用标准正态分布,即Probit模型, 例7.1计算结果为
y ˆ i * 7 .4 5 1 .6 2 G 2 3 i 5 0 P .0 8 T A 5U i 1 1 .4 7 C P 2 i E (6 S 7.1.153 I )
多元选择模型
• 调查样本,有效样本303份。 • 首先将定义的全部变量放进模型中进行估计,并通过比较 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 • 小城镇、县级市、地级市、省级城市和超大城市依次取值 1、2、3、4、5。
迁移目标 小城镇 县级市 地级市 省级城市 超大城市
ik
k 0
J
exp(X i j Z j )
多元logit(ML)估计
对数似然函数的形式:
ln L( y, X , ) yij ln pij
i 1 j 1 J J yij ( X i j Z j ) ln[ exp(X i k Z k )] i 1 j 1 k 0 n n J
现有收入 -0.00144* -0.00032** -0.00028**
log(2/5) -0.2800*** log(3/5) log(4/5) -0.1136* -0.0856
-0.1578*** -0.00030**
• 从教育程度来看,所有系数都是负值,教育程度越高的农 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 • 从家庭情况来看,所有系数都是负值,也就是说家庭情况 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 • 从现有收入来看,所有系数都是负值,也就是说目前收入 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。
《多元选择模型》课件
感谢您的观看
THANKS
《多元选择模型》ppt课件
目 录
• 多元选择模型概述 • 多元选择模型的原理 • 多元选择模型的应用实例 • 多元选择模型的优缺点 • 多元选择模型与其他模型的比较 • 多元选择模型的前沿研究与展望
01
多元选择模型概述
定义与特点
定义
多元选择模型是一种统计模型, 用于处理分类结果或有序分类结 果,例如选择题或评分等级。
多元选择模型的发展历程
早期发展
多元选择模型起源于20世纪50年代, 最初用于心理学和医学领域的分类问 题。
广泛应用
最新进展
近年来,随着大数据和机器学习技术 的兴起,多元选择模型在处理大规模 数据集和复杂分类问题方面取得了新 的进展。
随着计算机技术的发展,多元选择模 型在20世纪80年代开始广泛应用于社 会科学和市场营销领域。
应用领域
多元选择模型适用于多级选择问 题,如高考成绩影响因素分析; 而Probit模型适用于二元选择问 题,如是否购买某商品。
与神经网络模型的比较
总结词
参数估计方法、假设条件、应用领域
参数估计方法
多元选择模型采用最大似然估计法,而神经网络模型采用 反向传播算法进行参数调整。
假设条件
多元选择模型假设因变量是二元的或多级的,且自变量与 因变量之间的关系是线性的;而神经网络模型不作此假设 ,能够处理复杂的非线性关系。
参数估计方法、假设条件、应 用领域
02 参数估计方法
多元选择模型采用最大似然估 计法,而Probit模型采用最大 似然估计法或最小二乘法。
03
假设条件
04
多元选择模型假设因变量是二元 的或多级的,且自变量与因变量 之间的关系是线性的;而Probit 模型假设因变量是二元且自变量 与因变量之间的关系是线性的。
离散因变量模型(Logit 模型,Probit模型)PPT课件
20
二、 二元选择模型的估计(ML)
样本 i Y
x
样本取值
形式如图: 1 2
…
n
1
x1
0
x2
……
1
xn
Yi 值
1
0
P
F(X
B)
i
1 F(XiB)
(成功)
(失败)
样本每次取值设为 贝努里分布取值。
21
P( yi 1 Xi ) F (Xi)
P( y1 , y2 , , yn ) (1 F( X i )) F( X i )
j
p x j
dp dZ
Z x j
f (Z
) j
eZ (1 eZ )2
j
(z)(1-(z)) j
2、对Logit模型系数的解释:
ln( p )
odds
L x j
1 p x j
ln(odds) x j
odds x j
j
当 xj 增加一个单位时机会比率的增长率为 j 12
例1: 南开大学国际经济研究所1999级研究生考试分 数及录取情况见数据表(N = 95)。
当=0.05时查表可得 z1 1.96 2
因为 Z=2.05>1.96,所以score 变量在0.05的显著水平下 对Y的影响是显著的。
(5) 对参数加以解释: 0.6771 2
说明当考生分数增加一分,被录取的机会比率增长率增加0.6771.
另外,是否应届生对录取与否没有显著影响。
17
3. Probit模型
0
74
0
261
1
25
0
348
1
50
0
303
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小城镇、县级市、地级市、省级城市和超大城市依 次取值1、2、3、4、5。
.
16
最终模型的估计结果(部分)
变量 常数项
教育程度
家庭情况
模型序号 系数估计 标准差
1
1.2137 1.4518
2**
2.7685 1.0998
3**
2.3962 0.9351
虽然作为被解释变量的城市规模本身是有序的,但是对于
农村劳动力来说,选择进入哪一个级别的城市,本身是无 序的,因此对于城市化迁移目标构造多元名义logit离散选 择模型。
.
15
调查样本:有效样本303份。
用统计软件进行估计与分析( SAS 、Stata、SPSS 均可)。
首先将定义的全部变量放进模型中进行估计,并通 过比较各个变量的P值来考虑具体剔除哪些变量以 及对哪些变量考虑将其交互影响的效应放进模型中 去。
.
13
Stata Output
.
14
例2 农村异地转移劳动力的迁移目标研究
被解释变量:迁移目标,即小城镇、县级市、地级市、省 级城市和超大城市,依次取值1、2、3、4、5。
解释变量:个人特征和目前所在地属性。连续变量包括受 教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、 原有收入、现有收入,目前所在地属性中的所在地农村人 口、国内生产总值、城乡居民储蓄余额、粮食产量、中学 生在校人数、小学生在校人数等。离散变量包括性别、婚 姻状况、收入稳定与否,目前所在地所属级别与家乡所在 地所属级别等。
nJ
lnL
dijlnP(yi j)
i1 j0
.
10
Ex1. Binary Logistic Model Result
Dependent variable: honcomp
.
11
Stata Output
.
12
Multinomial Logistic Model Result
Dependent variable: prog
P(yi j) eXij P(yi 0)
The coefficients, β, represent the log odds of being in the target groups relative to the reference group
.
9
参数估计
多元名义 Logit 离散选择模型的参数估计并不复杂。对于第 i 个决策者,如果 选择了第 j 个备选方案,令 dij 1;如果没有选择第 j 个备选方案,令 dij 0 。 同时,对于第 i 个决策者,在(J+1)个备选方案中,只能选择其中之一,即只 能存在 1 个 dij 1。于是,可以写出 yij (i 1,2, , n; j 0,1,2, , J) 的联合概率函 数,由联合概率函数导出似然函数,进而得到对数似然函数为:
.
4
Multinomial Logistic Model
Multinomial logistic regression involves nominal response variables more than two categories
Multinomial logit models are multi-equation models
是不同的。
P(yi j)
e Xi j
J
1 eXik
k1
1 P(yi 0) J
1 eXik
k1
令B0=0,j=1,2,…,J
.
8ห้องสมุดไป่ตู้
Multinomial Logistic Model
Therefore, we can obtain the following probabilities relative to the reference group:
解释变量:个人特征、家庭特征和目前所在地属性。连续 变量包括受教育程度、家庭规模、家庭内其他劳动力人数、 家庭负担、原有收入、现有收入,目前所在地属性中的所 在地农村人口、国内生产总值、城乡居民储蓄余额、粮食 产量、中学生在校人数、小学生在校人数等。离散变量包 括性别、婚姻状况、收入稳定与否,目前所在地所属级别 与家乡所在地所属级别等。
e X ij P(yi j) J
e X ij
j0
.
如果(J+1)个随机误 差项互不相关,并且 服从Ⅰ类极值分布
F(ij)exp(eij )
6
多元离散选择Logit模型
P ij P ro bU ij U ik, k j P ro bV ijij V ikik, k j P ro bikij V ij V ik, k j
A response variable with j+1 categories will generate j equations
Each of these j equations is a binary logistic regression comparing a group with the reference group
F eeik ik
P| e ij ij
eijVijVik
kj
f e e ik eik ik
P ij
eijVijVik
ik eik
e e e dij
kj
.
7
多元离散选择Logit模型
e Xij P(yi j) J
e Xij
j0
X中未包含备选方案所具有的 属性变量,而参数向量B对不 同的选择方案(即不同的方程)
多元离散选择模型
胡枫
hufeng@
北京科技大学经济管理学院
二○一一年十月
本讲内容
多元离散选择模型 定序选择模型
.
2
一、多元离散选择模型
与上次讲的有何不同?
问题:农村异地转移劳动力的迁移目的地
被解释变量:迁移目的地,即小城镇、县级市、地级市、 省级城市和超大城市,依次取值1、2、3、4、5。
Multinomial logistic regression simultaneously estimates the j logits
.
5
多元离散选择Logit模型
如果决策者i在(J+1)项可供选择方案中选择了第j项,那 么其效用模型为:
U ijX ij ijV ijij
选择j的概率
P ( U i j U i k ) k 0 , 1 , 2 , ,Jk j
.
16
最终模型的估计结果(部分)
变量 常数项
教育程度
家庭情况
模型序号 系数估计 标准差
1
1.2137 1.4518
2**
2.7685 1.0998
3**
2.3962 0.9351
虽然作为被解释变量的城市规模本身是有序的,但是对于
农村劳动力来说,选择进入哪一个级别的城市,本身是无 序的,因此对于城市化迁移目标构造多元名义logit离散选 择模型。
.
15
调查样本:有效样本303份。
用统计软件进行估计与分析( SAS 、Stata、SPSS 均可)。
首先将定义的全部变量放进模型中进行估计,并通 过比较各个变量的P值来考虑具体剔除哪些变量以 及对哪些变量考虑将其交互影响的效应放进模型中 去。
.
13
Stata Output
.
14
例2 农村异地转移劳动力的迁移目标研究
被解释变量:迁移目标,即小城镇、县级市、地级市、省 级城市和超大城市,依次取值1、2、3、4、5。
解释变量:个人特征和目前所在地属性。连续变量包括受 教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、 原有收入、现有收入,目前所在地属性中的所在地农村人 口、国内生产总值、城乡居民储蓄余额、粮食产量、中学 生在校人数、小学生在校人数等。离散变量包括性别、婚 姻状况、收入稳定与否,目前所在地所属级别与家乡所在 地所属级别等。
nJ
lnL
dijlnP(yi j)
i1 j0
.
10
Ex1. Binary Logistic Model Result
Dependent variable: honcomp
.
11
Stata Output
.
12
Multinomial Logistic Model Result
Dependent variable: prog
P(yi j) eXij P(yi 0)
The coefficients, β, represent the log odds of being in the target groups relative to the reference group
.
9
参数估计
多元名义 Logit 离散选择模型的参数估计并不复杂。对于第 i 个决策者,如果 选择了第 j 个备选方案,令 dij 1;如果没有选择第 j 个备选方案,令 dij 0 。 同时,对于第 i 个决策者,在(J+1)个备选方案中,只能选择其中之一,即只 能存在 1 个 dij 1。于是,可以写出 yij (i 1,2, , n; j 0,1,2, , J) 的联合概率函 数,由联合概率函数导出似然函数,进而得到对数似然函数为:
.
4
Multinomial Logistic Model
Multinomial logistic regression involves nominal response variables more than two categories
Multinomial logit models are multi-equation models
是不同的。
P(yi j)
e Xi j
J
1 eXik
k1
1 P(yi 0) J
1 eXik
k1
令B0=0,j=1,2,…,J
.
8ห้องสมุดไป่ตู้
Multinomial Logistic Model
Therefore, we can obtain the following probabilities relative to the reference group:
解释变量:个人特征、家庭特征和目前所在地属性。连续 变量包括受教育程度、家庭规模、家庭内其他劳动力人数、 家庭负担、原有收入、现有收入,目前所在地属性中的所 在地农村人口、国内生产总值、城乡居民储蓄余额、粮食 产量、中学生在校人数、小学生在校人数等。离散变量包 括性别、婚姻状况、收入稳定与否,目前所在地所属级别 与家乡所在地所属级别等。
e X ij P(yi j) J
e X ij
j0
.
如果(J+1)个随机误 差项互不相关,并且 服从Ⅰ类极值分布
F(ij)exp(eij )
6
多元离散选择Logit模型
P ij P ro bU ij U ik, k j P ro bV ijij V ikik, k j P ro bikij V ij V ik, k j
A response variable with j+1 categories will generate j equations
Each of these j equations is a binary logistic regression comparing a group with the reference group
F eeik ik
P| e ij ij
eijVijVik
kj
f e e ik eik ik
P ij
eijVijVik
ik eik
e e e dij
kj
.
7
多元离散选择Logit模型
e Xij P(yi j) J
e Xij
j0
X中未包含备选方案所具有的 属性变量,而参数向量B对不 同的选择方案(即不同的方程)
多元离散选择模型
胡枫
hufeng@
北京科技大学经济管理学院
二○一一年十月
本讲内容
多元离散选择模型 定序选择模型
.
2
一、多元离散选择模型
与上次讲的有何不同?
问题:农村异地转移劳动力的迁移目的地
被解释变量:迁移目的地,即小城镇、县级市、地级市、 省级城市和超大城市,依次取值1、2、3、4、5。
Multinomial logistic regression simultaneously estimates the j logits
.
5
多元离散选择Logit模型
如果决策者i在(J+1)项可供选择方案中选择了第j项,那 么其效用模型为:
U ijX ij ijV ijij
选择j的概率
P ( U i j U i k ) k 0 , 1 , 2 , ,Jk j