1-有序因变量模型理论与应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

选择概率 概率) 某个解释变量的偏导数计算公式是 解释变量的偏导数计算 求概率 pm(最后 1 种选择概率)对某个解释变量的偏导数计算公式是
∂P( y m = 1 X i , β ) ∂[1 − Φ (γ m −1 - X ik ′ β )] ∂ (γ m −1 - X ik ′ β ) ∂p m = = ∂ ( X ik ) ∂ ( X ik ) ∂ ( X ik ) ∂ (γ m −1 - X ik ′ β ) = φ (γ - X ′ β )(− β ), k = 1,..., K , i = 1, ..., N
m −1 ik
β
k
注意: 注意: 状态的概率变化 (1)β的符号能预示两个外端状态概率的变化方向。P(yi =1) 状态的概率变化 ) 的符号能预示两个外端状态概率的变化方向。 的符号相反( 增加, 减小) 状态的概率变化 变化与 减小 。 与β的符号相反(即β增加,P(yi =1)减小) 而 P(yi =m) 状态的概率变化与 β的符号相同。 即β增加,P(yi = m) 也增加) 符号相同。 增加, 增加) ( P(yi =1∣Xi, β, γ) = F(γ1- Xi′β) ∣ P(yi =2∣Xi, β, γ) = F(γ2- Xi′β)-F(γ1- Xi′β ) ∣ P(yi =3∣Xi, β, γ) = F(γ3- Xi′β)-F(γ2- Xi′β ) ∣ … P(yi =m∣Xi, β, γ) = 1-F(γm-1- Xi′β) ∣ (2)作为样本观测值,yi 只取 1, 2, …, m,而对于每一个研究对象,当把解释 )作为样本观测值, ,而对于每一个研究对象, 变量的值代入隐变量估计式后 可以计算隐变量的值,以及该研究对象处 隐变量估计式后, 变量的值代入隐变量估计式后,可以计算隐变量的值,以及该研究对象处 选择的相应概率值 哪一个概率值大, 的相应概率值。 哪一个概率值大, 该研究对象最有可能处于那 于 m 种选择的相应概率值。 该研究对象最有可能处于那 状态。 种状态。
上式也可写为 上式也可写为 yi =j,若γj-1< yi*≤ γj, j = 1, 2,…, m, , ≤ … 其中γ0 = -∞, γm = ∞。据上式 ∞ P(yi =j) = P(γj-1< yi*≤ γj) , j = 1, 2,…, m ≤ … 依据( ) 依据(1)式, P(yi =j) = P(γj-1< yi*≤ γj) = P(γj-1< Xi′β + ut ≤ γj) ≤ = P(γj-1- Xi′β < ut ≤ γj - Xi′β) j = 1, 2,…, m = F(γj - Xi′β) - F(γj-1 - Xi′β ) , … 表示式( ) 的累积概率分布函数。有序因变量的条件概率是 其中 F(·)表示式(1)中 ut 的累积概率分布函数。有序因变量的条件概率是 表示式 P(yi =1∣Xi, β, γ) = F(γ1- Xi′β) ∣ P(yi =2∣Xi, β, γ) = F(γ2- Xi′β)-F(γ1- Xi′β ) ∣ P(yi =3∣Xi, β, γ) = F(γ3- Xi′β)-F(γ2- Xi′β ) ∣ … P(yi =m∣Xi, β, γ) = 1-F(γm-1- Xi′β) ∣ 态分布的 表示正态累积概率分布函数。 如果 ut 是正态分布的,则 F(γ2- Xi′β)表示正态累积概率分布函数。如果 ut 是 表示正态累积概率分布函数 logistic 分布的的,则 F(γ2- Xi′β)表示 logistic 累积概率分布函数。 分布的 累积概率分布函数。 表示
家上市公司的净资产收益率 净资产收益率( ) 案例 4:(file:7order_model-1) 分析 736 家上市公司的净资产收益率(Y) : 净资产收益率( ,测量公司绩效的指标) 个等级。 净资产收益率(ner,测量公司绩效的指标)被离散化为 3 个等级。
1, 净资产收益率(ner) 0,亏损 ≤ y = 2, 0 < 净资产收益率(ner) 0.2,中等盈利 ≤ 3, 净资产收益率(ner) 0.2,高盈利 >
模型的 专题 1:有序因变量模型的理论与应用 :有序因变量模型 理论与应用
张晓峒
(2011-11-15) ) 南开大学数量经济研究所所长 研究所所长、 南开大学数量经济研究所所长、博士生导师 中国数量经济学会常务理事 天津市数量经济学会理事长 nkeviews@yahoo.com.cn
有序因变量模型( 有序因变量模型(ordered dependent variable model)由 Aitchisen 模型 ) 提出。 有序因变量模型也是二元离散选择模型的拓展。 模型也是二元离散选择模型的拓展 和 Silvey 1957) ( ) 提出。 有序因变量模型也是二元离散选择模型的拓展。 有序因变量模型 模型中被解释变量 的观测值表示等级分类, 有序因变量模型中被解释变量 yi 的观测值表示等级分类,选项是有顺序 所以称有序因变量。 有序因变量 的,所以称有序因变量。 比如, 文盲、小学毕业、中学毕业、 比如,把受调查对象分为 5 类:文盲、小学毕业、中学毕业、大学 毕业和研究生毕业 毕业, 毕业和研究生毕业,分别用 1、2、3、4、5 表示。把受调查对象分为工 、 、 、 、 表示。把受调查对象分为工 作、半退休和完全退休 3 类分别用 1、2、3 表示。 、 、 表示。
K K m, γ m -1 < y i *
其中γ 称作门限值或阈值 门限值或阈值。 其中γj,j =1, 2,…, m-1 称作门限值或阈值。yi,i =1, 2, …, m 表示被解释 变量分类。 变量分类。 注意:有序因变量 因变量模型的设定应满足如果 注意:有序因变量模型的设定应满足如果 yi < yj,则意味着 yi *< yj* 的序数值小, 的值也一定小) (即如果因变量 yi 的序数值小,则相应隐变量 yi *的值也一定小) 的值也一定小 。 上式也可写为 上式也可写为 yi =j,若γj-1< yi*≤ γj, j = 1, 2,…, m, , ≤ … 其中γ0 = -∞, γm = ∞。 ∞
j ik
j −1
- X ik ′ β ) ∂ (γ j −1 - X ik ′ β ) ∂ ( X ik ) - X ′β )
ik
= [φ (γ j - X ik ′ β ) − φ (γ
j −1
- X ik ′ β )](− β k ),
j = 2, ..., m − 1, k = 1,..., K , i = 1, ..., N
ˆ log L ( β ) −447.7165 = 0.Fra Baidu bibliotek997, (McFadden R2) , ( ~ =1 − − 497.3162 log L( β )
两个阈值分别是 两个阈值分别是 γ1= -1.5156,γ2 = 1.0248。 , 。
家上市公司中的每一家 用736家上市公司中的每一家公司的解释变量数据都可以计算出一个隐变量的值 家上市公司中的每一家公司的解释变量数据都可以计算出一个隐变量的值 ˆ 并同时计算出该公司处于3个盈利等级的概率预测值 而哪一个等级的概率值 个盈利等级的概率预测值。 y i * ,并同时计算出该公司处于 个盈利等级的概率预测值。而哪一个等级的概率值 最大,就是该公司最有可能处于的状态。 个盈利等级的概率预测值用下式计算 个盈利等级的概率预测值用下式计算。 最大,就是该公司最有可能处于的状态。3个盈利等级的概率预测值用下式计算。 ˆ P(yi =1∣Xi, β, γ) = F(γ1- Xi′β ) = F(-1.52 - y i * ) ∣ ˆ ˆ P(yi =2∣Xi, β, γ) = F(γ2- Xi′β )-F(γ1- Xi′β) = F(1.02 - y i * ) - F(-1.52 - y i * ) ∣ ˆ P(yi =3∣Xi, β, γ) = 1 - F(γ2- Xi′β) = 1 - F(1.02 - y i * ) ∣
1 ik
β
k
选择的 解释变量的偏导数计算 求概率 pj, j = 2, ..., m-1(中间选择的概率)对某个解释变量的偏导数计算公式是 (中间选择 概率) 某个解释变量的偏导数计算公式是 ∂p j ∂P( y i = j X i , β )
∂ ( X ik ) = ∂ ( X ik )
j −1
∂Φ (γ j - X ik ′ β ) ∂ (γ j - X ik ′ β ) ∂Φ (γ = − ′β ) ∂ ( X ik ) ∂ (γ - X ∂ (γ
选择概率 概率) 某个解释变量的偏导数计算公式是 解释变量的偏导数计算 求概率 p1(第 1 种选择概率)对某个解释变量的偏导数计算公式是
∂P ( y i = 1 X i , β ) ∂Φ (γ 1 - X ik ′ β ) ∂ (γ 1 - X ik ′ β ) ∂p1 = = ∂ ( X ik ) ∂ ( X ik ) ∂ ( X ik ) ∂ (γ 1 - X ik ′ β ) = φ (γ - X ′ β )(− β ), k = 1,..., K , i = 1, ..., N
∑∑ log ( P( y i = j X i , β , γ )) ⋅ D( y i = j)
i =1 j =1
N
m
是指示函数, j 为真时, D(y 其中 D(yi =j) 是指示函数, yi =j, =1, 2, …, m 为真时, i =j) = 1, yi =j, 当 , , 当 , j =1, 2, …, m 为不真时,D(yi =j)= 0。对于样本中某个 yi 来说,m 个可能值, 为不真时, 样本中 来说, 可能值 。对于样本 只有一个 一个为 只有一个为真。 例如,仍以受调查对象分为 工作” 半工作半退休” 受调查对象分为“ 完全退休” 例如,仍以受调查对象分为“工作”“半工作半退休”和“完全退休”3 、 类为例, 有三种状态。对于某个个体 某个个体, 类为例,分别用 1、2、3 表示。即 yi = 1, 2, 3 有三种状态。对于某个个体,假 、 、 表示。 处于“半工作半退休”状态, 设处于“半工作半退休”状态,则 D(yi =1) =0,D(yi =2) = 1,D(yi =3) = 0 , , 对数似然函数求极大, 取值条件下, 对数似然函数求极大,就是每个个体在其 yi 取值条件下,估计β, γ使对数似然 函数值达到最大。 函数值达到最大。
以 yi 有 3 种分类为例, Xi′β = 0 条件下, i 选择 3 种分类各对应的概率 种分类为例,在 条件下,y 所示。 其中曲线表示累积概率分布曲线。 y 2, 如图 1 所示。 其中曲线表示累积概率分布曲线。 i = 1, , 的概率分别是 p1, , 3 p2- p1,1- p2。 越向左移。 当 Xi′β > 0,且值越大时,分点γj- Xi′β,j =1, 2 越向左移。yi 取标号高的 ,且值越大时, 分类的概率越大。 分类的概率越大。 越向右移。 当 Xi′β < 0,且值越小时,分点γj- Xi′β,j =1, 2 越向右移。yi 取标号高的 ,且值越小时, 分类的概率越小。 分类的概率越小。 对于每一个调查对象而言, 对于每一个调查对象而言,处于 3 种选择的概率和为 1。 。
解释变量 解释变量 rate:基金持股比例 : 解释变量 解释变量 total:总资产 : 模型估计结果如下 估计结果如下: 有序响应 Probit 模型估计结果如下:
yi*= 0.0168 RATEi + 1.17 ×10-11TOTALi + ut, ut ∼IID(0, σ2) (5.3) (2.9) N=736,伪 R2 = 1 − ,
变量列 呈线性关系, 假定有一个隐变量 yi*与解释变量列向量 Xi 呈线性关系, 与解释变量 yi*= Xi′β + ut, ut ∼IID(0, σ2) (1) 里不包括截距项。 种选择, 其中 Xi 里不包括截距项。 如果 yi 存在 m 种选择, 被解释变量 yi 与隐变 则 存在如下关系: 量 yi*存在如下关系: 存在如下关系 1, y i * ≤ γ 1 2, γ < y * ≤ γ 1 i 2 y i = 3, γ 2 < y i * ≤ γ 3
F(γi- Xi′β ) P2
0.6 0.4 1 0.8
p1
0.2 0 -4 -2
γ1
0
γ2
2
4
(γj- Xi′β)
图 1 累积正态概率分布曲线
对于有序因变量模型, 对于有序因变量模型,阈值γ和回归系数β是通过对对数似然函数求极大 模型 同时估计出来的。 同时估计出来的。对数似然函数是 logL(β, γ) =
相关文档
最新文档