离散选择模型logit模型实例stata分析.pptx

合集下载

第八章--离散选择模型――Logist回归

第八章--离散选择模型――Logist回归

第八章离散选择模型—Logistic回归基于logistic回归模型的企业信用评价——以材料和机械制造行业上市公司为例一、引言中国市场经济制度的日益健全与完善以及证券债券等金融市场的逐步建立与发展,信用成为经济交往、债务形成的一个重要的基础,信用风险越来越受到市场交易者的关注。

信用风险是指借款人、证券发行人或交易方由于各种原因不愿或无能力履行商业合同而违约,致使债权人、投资者或交易方遭受损失的可能性。

对于上市公司而言,这种违约行为经常表现为拖欠账款、资不抵债以及以发行证券或债券进行圈钱等失信行为。

对这种违约失信的可能性的度量显得十分重要。

怎样分析公司的信用状况,对信贷管理者如何分析企业的信用,对证券投资者如何衡量投资项目的风险和价值以及企业家如何评价自己管理的公司,都有极大的价值。

自上世纪中期以来,国内外以计算违约率(本文计算守信率,守信率=1-违约率)对信用风险进行评价和度量的方法和模型得到了迅速发展。

对企业的信用评价主要是基于综合财务指标特征计算违约风险并用来划分等级。

以综合财务指标为解释变量,运用计量统计方法建立模型,分析信用在金融和学术界成为主流,并且评价效果显著。

特别对于logistic回归模型效果更好,因为该模型没有关于变量分布的假设,也不要求假设指标存在多元正态分布。

最早有Martin(1977)建立logistic回归模型预测公司的破产以及违约的概率。

Madalla(1983)建立logistic回归模型来区分违约和非违约贷款申请人,并确认0.551为两者的分界线。

比如在我国,张后启等(2002),杨朝军等(2002),应用Logistic模型研究上市公司财务危机,得出有效结论等等。

面对我国在深沪两家证券市场上市的一千多家上市公司,由于公司体制和管理机制缺陷,或者自身利益最大化利益驱使,或者多部分有国企改制而来等各种原因,信用风险程度变的更大。

若能够应用一个较简单的计量模型对他们的信用状况进行评价,对债权人选择贷款对象,投资者投资和交易方的选取都有较大帮助。

离散选择模型完整版

离散选择模型完整版

离散选择模型HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第五章离散选择模型在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。

我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,本章主要介绍这一类模型的估计与应用。

本章主要介绍以下内容:1、为什么会有离散选择模型。

2、二元离散选择模型的表示。

3、线性概率模型估计的缺陷。

4、Logit模型和Probit模型的建立与应用。

第一节模型的基础与对应的现象一、问题的提出在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策问题,是定性的,没有观测数据所对应;或者其观测到的是受某种限制的数据。

1、被解释变量是定性的选择与决策问题,可以用离散数据表示,即取值是不连续的。

例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成5种观点,分别用0、1、2表示。

由离散数据建立的模型称为离散选择模型。

2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类型数据。

例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值时,则购买价格为0。

这种类型的数据成为审查数据。

再例如,在研究居民储蓄时,调查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。

这两种数据所建立的模型称为受限被解释变量模型。

有的时候,人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置,就把高出分数线和低于分数线划分为了两类。

下面是几个离散数据的例子。

例研究家庭是否购买住房。

由于,购买住房行为要受到许多因素的影响,不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即我们希望研究买房的可能性,即概率(1)P Y =的大小。

《离散选择模型》课件

《离散选择模型》课件

极大似然估计法
通过最大化似然函数,估计模型 的参数值。
差分法估计法
通过对变量的差分进行估计,减 少了共线性问题的影响。
一般化估计方程法
通过建立一般化估计方程,对参 数进行估计。
离散选择模型的应用
公共交通出行方式选择
分析人们在选择公共交通出行方式时的决策行为,为政府制定交通政策提供依据。
食品品牌选择
确定性
选择结果是确定的,参与者 不受随机因素的影响。
离散选择模型的数学模型
1Байду номын сангаас
多项式Logit模型
通过对选择概率进行建模,预测参与者选择各个选项的概率。
2
二项式Logit模型
基于二项分布,预测参与者是否选择某个选项。
3
线性概率模型
使用线性回归方法,预测选择某个选项的概率。
离散选择模型的参数估计方法
离散选择模型是一种描述人们在面临离散选择时决策行为的数学模型。
2 离散选择模型的应用领域
离散选择模型被广泛应用于诸多领域,如公共交通、市场营销和行为经济学等。
离散选择模型的基本假设
可比性
各个选择项之间可以进行比 较,存在客观标准用于决策。
独立性
参与者之间的选择行为是独 立的,不受其他参与者的影 响。
《离散选择模型》PPT课 件
离散选择模型是一种用于分析人们在面临离散选择时的决策行为的统计模型。 本课件将介绍离散选择模型的定义、基本假设、数学模型、参数估计方法、 应用、不足及未来发展方向。
什么是离散选择模型
离散选择模型是一种用于研究人们在面临可选项时所作出的离散决策行为的统计模型。
1 离散选择模型的定义
将离散选择模型与其他决策模 型进行结合,以提高模型的准 确性和解释能力。

Discrete Choice Modeling 培训课件

Discrete Choice Modeling 培训课件
例如,可以研究劳动者在选择工作时对工资、工作条件、职业发展前景 等因素的偏好和选择行为,从而为政府和企业提供劳动力市场政策建议 。
产品差异化研究
产品差异化研究是离散选择模型在市场营销领域的应用。
通过离散选择模型,可以分析消费者对不同品牌或型号产品的偏好和选择行为,并探究产品 差异化的影响。
例如,可以研究消费者在购买手机时对品牌、型号、功能、价格等方面的偏好和选择行为, 从而为手机制造商提供产品定位和市场策略建议。
在离散选择模型中,广义最小二 乘法可以用于处理选择概率与模
型参数之间的非线性关系。
该方法通过对误差项的方差进行 调整,以考虑选择概率的非线性 影响,从而更准确地估计参数。
工具变量法
工具变量法是一种用于处理内生性问题 的参数估计方法。
在离散选择模型中,工具变量法可以用 于处理选择误差与模型解释变量之间的
面板数据模型
总结词
面板数据模型是一种利用时间序列和截面数据的离散选择模型,用于分析时间和个体异 质性的影响。
详细描述
面板数据模型利用时间和个体两个维度来扩展离散选择模型。通过利用时间序列数据, 面板数据模型可以估计时间和个体异质性对选择行为的影响。这种模型适用于具有时间 和个体变化特征的数据,例如消费者行为、投资决策等。面板数据模型可以帮助我们更
相关性问题。
该方法通过引入一个或多个与内生解释 变量相关,但与误差项无关的工具变量 来估计参数。工具变量的选择应满足与 内生解释变量相关,但与误差项无关的
条件。
04
离散选择模型的扩展和应用
混合模型
总结词ห้องสมุดไป่ตู้
混合模型是一种将离散选择模型与连续变量相结合的模型,用于同时估计离散 选择和连续变量的影响。

离散选择模型ppt课件

离散选择模型ppt课件

PYi 1 / X i
6
例如,我们对一个是否拥有自有住房的案例进行回归,
结果如下: Yi 1.2009 0.1056X i (0.1483 ) (0.0087) R 0.8078
2
回归拟合的很好,经济学意义也非常明确,收入Xi每增加1单位 (1万元人民币),平均拥有住房的概率将增加10.56%:
11
2.解释变量同样为定性变量的情况
ቤተ መጻሕፍቲ ባይዱ
Pi Li ln 1 P 0 1 X i ui i P 1 ˆ Xi=1时: L1 ln 1 P 0 1 (1) 1 P0 ˆ Xi=0时: L0 ln 1 P 0 (2) 0 P 1 1 P 1 如果定义: OR P0 1 P 0 1 ˆ L ˆ 那么就有: lnOR L OR e 1 0 1
15
回归的结果如下:
. logit y x Iteration Iteration Iteration Iteration 0: 1: 2: 3: log log log log likelihood likelihood likelihood likelihood = = = = -253.69187 -242.36572 -242.32729 -242.32729 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 Std. Err. .2910729 .1179409 z 4.50 -2.10 P>|z| 0.000 0.036 = = = = 366 22.73 0.0000 0.0448
这意味着在其他条件都相同的情况下,抽烟人士患食道癌的 可能性是不抽烟人士的3.7倍还要多。

离散选择模型举例12.2 精品

离散选择模型举例12.2 精品

一.二元离散选择模型1.二元响应模型(Binary response model)我们往往关心响应概率()()()()z G x x G x y x y k k =+++=E ==P βββ...1110,其中x 表示各种影响因素(各种解释变量,包括虚拟变量)。

根据不同的函数形式可以分为下面三类模型:线性概率模型(Linear probability model ,LPM )、对数单位模型(logit )、概率单位模型(probit):三种模型估计的系数大约有以下的关系:LPM probit probit it ββββ5.2,6.1log ==2.偏效应(1)如果解释变量是一个连续型变量,那么他对p(x)=p(y=1|x)的偏效应可以通过求下面的偏导数得出来:()()()()dzz dG z g x g x x p j j =+=∂∂,0βββ,偏效应的符号和该解释变量对应的系数的符号一致;两个解释变量偏效应之比等于它们各自的估计系数之比。

(2)如果解释变量是一个离散性变量,则k x 从k c 变化到k c +1时对概率的影响大小为:()()()k k k k c x G c x G ββββββ+++-++++...1 (110110)上面的其他解释变量的取值往往取其平均值。

3.估计方法与约束检验极大似然估计;三种常见的大样本检验:拉格朗日乘数检验、wald 检验、似然比检验。

4.Stata 程序语法(以Probit 为例)probit depvar [indepvars] [weight] [if exp] [in range] [, level(#) nocoef noconstant robust cluster(varname) score(newvar) asis offset(varname) maximize_options ] predict [type] newvarname [if exp] [in range] [, statistic rules asif nooffset ] where statistic isp predicted probability of a positive outcome; the default xb linear predictionstdp standard error of the prediction二.具体的例子1.数据:美国1988年的CPS 数据2.模型:估计成为工会成员的可能性,模型形式如下:参加工会的概率=F(潜在经验potexp 、经验的平方项potexp2、受教育年限grade 、婚否married 、工会化程度high);解释变量:Potexp=年龄-受教育年限-5; grade=完成的受教育年限; married :1表示婚,0未婚;high :1表示高度工会化的行业,否则为0。

stata logit 模型解读

stata logit 模型解读

一、概述logit 模型是一种经典的统计回归模型,用于解决二分类问题。

它可以帮助我们预测一个变量的可能取值是0还是1,适用于很多实际问题中的预测和决策。

二、logit 模型基本原理1. logit 函数logit 模型使用的是 logit 函数,其数学表达式为:logit(p) = log(p / (1-p))其中 p 是事件发生的概率,logit(p) 是 p 的 logit 值。

logit 函数的作用是将概率转换为一个无限制的实数范围内,方便进行回归分析。

2. logit 模型的建立logit 模型假设因变量 Y 的对数几率是自变量 X 的线性函数,数学表达式为:logit(p) = β0 + β1X1 + ... + βnXn其中β0, β1, ... , βn 是回归系数,X1, ... , Xn 是自变量。

通过最大似然估计等方法,可以求得回归系数的估计值。

三、logit 模型的参数估计1. 最大似然估计logit 模型的参数估计通常使用最大似然估计方法。

最大似然估计是一种常用的参数估计方法,其目标是使得观测到的样本数据出现的概率最大化。

通过最大似然估计,可以求得logit模型中回归系数的估计值。

2. 参数估计的解释logit 模型中的回归系数估计值代表了自变量对因变量的影响程度。

回归系数的正负和大小可以表明自变量对因变量的影响方向和程度,而回归系数的显著性检验可以帮助判断自变量的影响是否显著。

四、logit 模型的应用1. 二分类预测logit 模型最常见的应用是进行二分类预测。

通过建立logit模型,可以预测一个事件发生的概率,并将其转化为一个0-1之间的取值,从而进行分类判断。

2. 风险评估在金融、医疗等领域,logit 模型也被应用于风险评估。

通过logit模型,可以判断个体发生某一事件的概率,从而进行风险评估和决策。

五、logit 模型的优缺点1. 优点logit 模型具有良好的解释性,可以通过回归系数解释自变量对因变量的影响。

chap09 stata与离散被解释变量模型

chap09 stata与离散被解释变量模型

由于logit与probit模型得出的参数估计值不可直接 比较,根据本节开始介绍的原理已了解到两模型 的边际效应可以比较。Stata中probit模型的边际 效应得出方法与logit是相同的。 在Stata命令窗口中输入如下命令计算probit模型 回归后解释变量在样本均值处的边际效应: mfx
本实验中,在Stata命令窗口中输入如下命令进行 异方差模型估计和检验,可以得到图9.12的运行 结果: hetprob work age education married children, het (age education married children) 结果显示LR检验的结果是接受原假设,即模型不 存在异方差问题。所以回归不应使用异方差回归 模型,可以直接应用probit模型进行估计。
本实验中,在Stata命令窗口中输入如下预测命令,可以 得到预测结果图: predict p1, pr 此命令可以获得此模型的个体估计的值并记为新变量p1 list work p1 此命令可以将实际值与估计值对应罗列,对比看到预测值 和实际值的一致程度。
(1)ROC曲线(受试者操控曲线) 此曲线是指图9.3提到的敏感性与(1-特异性)的散点图, 即预测值等于1的准确率与错误率的散点图。Stata中绘画 该ROC曲线命令语句为: lroc [x] [if] [in] [weight] [,options] 其中lroc表示绘图ROC曲线命令,if和in表示对绘制图时 的条件和范围的设定,weight表示对观测值的权重设定, 另外命令中的自变量x不能单独使用,必须与options中 beta(matname)同时使用,而options的内容如下表所示:
三 实验操作指导
1.建立logit模型分析 (1)使用logit模型回归 Stata中使用logit模型回归的命令语句格式如下: logit y x1 x2 … [if] [in] [weight] [,options] 该命令中logit表示使用logit模型进行回归,相应y表示模型的被解释 变量,x表示模型的解释变量,if表示logit的回归条件,in表示回归的 范围,weight表示给观测值的加入权重,options的内容如下表所示:

应用Sata做logistic回归ppt课件

应用Sata做logistic回归ppt课件

4
பைடு நூலகம்
1.Logistic 回归
命令: logit 因变量 [自变量] [,选择项]
在进行logistic 回归时要注意资料的形式。通常, 用于logistic 回归的资料有三种形式: (1) 分水平频数资料,一般自变量较少,且均为分类 变量,常以各变量(包括因变量、自变量)各水平的组 合的频数表形式出现。如例1。拟合时仍用上述命令, 只是命令中增加[fw=频数变量]选择项。
test [1]x1=[2]x1
test [1]x2=[2]x2
精选编辑ppt
31
有序结果的累积比数 logistic回归
用于有序结果的logistic 回归的命令是 ologit。
ologit [因变量 [自变量]] [,table level(#)]
其中选择项table用于指定打印出各类 的概率;level用于指定显著性水平
精选编辑ppt
5
(2) 分组频数资料,一般自变量较少,且均为 分类变量,常以各自变量(不包括因变量)各 水平的组合的频数表形式出现,因变量常表 达为分子与分母。如例2。用下列命令:
blogit 阳性数变量 总观察数变量 [,logit 命 令选择项]
或 glogit 阳性数变量 总观察数变量 [, level(#) or]
35
小结
Logit、 blogit 、 glogit 、 blogit 、 clogit 、 mlogit 、 ologit
精选编辑ppt
36
此课件下载可自行编辑修改,供参考! 感谢您的支持,我们努力做得更好!
精选编辑ppt
37
其中group()是必选项,它是用来区分各配比组 的。level(#)及or 的意义同logit。

第八章离散选择模型Logist回归

第八章离散选择模型Logist回归

第八章离散选择模型—Logistic回归基于logistic回归模型的企业信用评价——以材料和机械制造行业上市公司为例一、引言中国市场经济制度的日益健全与完善以及证券债券等金融市场的逐步建立与发展,信用成为经济交往、债务形成的一个重要的基础,信用风险越来越受到市场交易者的关注。

信用风险是指借款人、证券发行人或交易方由于各种原因不愿或无能力履行商业合同而违约,致使债权人、投资者或交易方遭受损失的可能性。

对于上市公司而言,这种违约行为经常表现为拖欠账款、资不抵债以及以发行证券或债券进行圈钱等失信行为。

对这种违约失信的可能性的度量显得十分重要。

怎样分析公司的信用状况,对信贷管理者如何分析企业的信用,对证券投资者如何衡量投资项目的风险和价值以及企业家如何评价自己管理的公司,都有极大的价值。

自上世纪中期以来,国内外以计算违约率(本文计算守信率,守信率=1-违约率)对信用风险进行评价和度量的方法和模型得到了迅速发展。

对企业的信用评价主要是基于综合财务指标特征计算违约风险并用来划分等级。

以综合财务指标为解释变量,运用计量统计方法建立模型,分析信用在金融和学术界成为主流,并且评价效果显著。

特别对于logistic回归模型效果更好,因为该模型没有关于变量分布的假设,也不要求假设指标存在多元正态分布。

最早有Martin(1977)建立logistic回归模型预测公司的破产以及违约的概率。

Madalla(1983)建立logistic回归模型来区分违约和非违约贷款申请人,并确认0.551为两者的分界线。

比如在我国,张后启等(2002),杨朝军等(2002),应用Logistic模型研究上市公司财务危机,得出有效结论等等。

面对我国在深沪两家证券市场上市的一千多家上市公司,由于公司体制和管理机制缺陷,或者自身利益最大化利益驱使,或者多部分有国企改制而来等各种原因,信用风险程度变的更大。

若能够应用一个较简单的计量模型对他们的信用状况进行评价,对债权人选择贷款对象,投资者投资和交易方的选取都有较大帮助。

使用STATA分析离散因变量模型

使用STATA分析离散因变量模型

使用STATA分析离散因变量模型高级计量经济专题习题课2使用STATA分析离散因变量模型我们主要考察以下三个变量:1) distress:“热动力损坏事故”的数量。

2) temp:“在发射时候的温度”,用华氏表示。

3) date:由1960年1月1日(一个任意的开始时间)以后的日期数量来表示。

日期由mdy来生成。

Generate date=mdy(month, day, year)Label variable date “Date (day since 1/1/60) 这里的变量”distress” 是一个有标记的数值变量。

Tabulate distress在一般的情况下,这个命令将显示出标签,但是我们同样可以使用nolabel来显示数字,以0代表“none”,1代表“1或2”,以及2代表“3以上”。

Tabulate distress, nolabel我们可以使用下列代码创建一个新的虚拟变量any,以0代表没有distress,1代表有一次或多次危险事故。

Generate any=distressReplace any=1 if distress==2Label variable any “Any thermal distress”为了看到这些命令的效果,键入:Tabulate distress anyLogistic回归建立的模型是是一个{0,1}解释变量如何依赖于一个或多个x变量。

Logit命令的格式与regress类似,都是首先列出因变量。

Logit any date, coefLogit 的递归估计过程最大化对数似然函数,这些都在输出内容的开始进行显示。

在第0次递归中,对数似然函数描述了模型只对一个常数项进行回归。

最后的对数似然函数描述了对于最终模型的拟合。

L=-18.13116+.0020907date其中L的含义是:L=ln(P(any=1)/P(any=0))总体的检验的原假设是所有的除了常数项以外的系数都为0,它的定义为:其中的是初始递归(只有常数项的模型)的对数似然函数值,而是最后一次递归的对数似然函数值,这里,-2[-15.394543-(-12.991096)]=4.81 由回归结果可以看到这里的P值为0.0283,所以date变量具有比较显著的效果。

离散选择模型课件

离散选择模型课件

得到的回归模型如下:
GDPt 14529.7 11122.9D3t 1370.1T et
t=(9.43) (6.50)
(17.08)
R2 0.93, DW 0.57, F 178.9
从回归结果看,虚拟变量D3t对应的回归系数为11122.9 与理论预期一致且统计显著,其含义为,在其他条件 不变前提下,平均来说,第4季度比其余季度的GDP高 11122.9亿。
▪ 设定回归模型:
Ct 0 1GDPt 2GDP Dt t
(10.1.4)
▪ 2000年前后,我国消费函数的回归函数为:
E
(Ct E
Dt (Ct
1, Dt
GDPt ) 0 (1 2)GDPt 0,GDPt ) 0 1GDPt
(10.1.5)
▪ 从(10.1.5)式可以看出,2000年以前的边际消费倾 向为β1+ β2 ,2000年以后的边际消费倾向为β1 , 2000年前后消费函数的差异体现在斜率系数上。
1 (第三季度)
D1t 0 (其他季度)D2t 0 (其他季度)
1 (第四季度) D3t 0 (其他季度)
• 设定回归模型为:
GDPt 0 1D1t 2D2t 3D3t 4T t (10.1.3)
▪ 估计结果如下:
GDPt 13049.0 2125.3D1t 2700.3D2t 12747.4D3t 1362.1T et
▪ 1978-1989年和1990-2006年的储蓄函数分别是:
E(St
Dt 1,GDPt ) (0 1) (2 3)GDPt E(St Dt 0,GDPt ) 0 2GDPt
t= (6.83) (1.02) (1.29) (6.05) (16.88)

离散选择模型分析共39页文档

离散选择模型分析共39页文档

46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特
1、不要轻言放弃,否则对不起自己。
2、要冒一次险!整个生命就是一场冒险。走得最远的人,常是愿意 去做,并愿意去冒险的人。“稳妥”之船,从未能从岸边走远。-戴尔.卡耐基。
梦 境
3、人生就像一杯没有加糖的咖啡,喝起来是苦涩的,回味起来却有Байду номын сангаас久久不会退去的余香。
离散选择模型分析4、守业的最好办法就是不断的发展。 5、当爱不能完美,我宁愿选择无悔,不管来生多么美丽,我不愿失 去今生对你的记忆,我不求天长地久的美景,我只要生生世世的轮 回里有你。

Logit模型

Logit模型
逻辑分布(Logistic distribution)公式:
P(Y=1│X=x)=exp(x'β)/(1+exp(x'β))
其中参数β常用极大似然估计。
Logit模型是最早的离散选择模型,也是应用最广的模型。
特点
Logit模型因变量不是常规的连续变量,而是对数发生比率,尽管每个自变量的估计系数含义与一般线性回 归一样,数的经济学含义,较方便的做法是将Logit进行转换后再进行解释,而不是直接解释系数本身,即将回归 模型等式两侧取自然指数。
Logit模型
离散选择法模型之一
01 简介
03 优点
目录
02 特点 04 缺点
Logit模型(Logit model),也译作“评定模型”,“分类评定模型”,又作Logistic regression, “逻辑回归”,是离散选择法模型之一,Logit模型是最早的离散选择模型,也是应用最广的模型。是社会学、 生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。
简介
Logit模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻 辑回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量 经济学、市场营销等统计实证分析的常用方法。
线性回归模型的一个局限性是要求因变量是定量变量(定距变量、定比变量)而不能是定性变量(定序变量、 定类变量)。但是在许多实际问题中,经常出现因变量是定性变量(分类变量)的情况。可用于处理分类因变量的 统计分析方法有:判别分析( Discriminantanalysis)、 Probit分析、 Logistic回归分析和对数线性模型等。 在社会科学中,应用最多的是 Logistic回归分析。 Logistic回归分析根据因变量取值类别不同,又可以分为二 元 Logistic回归分析和多元 Logistic回归分析,二元 Logistic回归模型中因变量只能取两个值1和0(虚拟因 变量),而多元 Logistic回归模型中因变量可以取多个值。

stata上机实验第六讲 离散选择模型(共43张PPT)

stata上机实验第六讲 离散选择模型(共43张PPT)
Stata上机实验(shíyàn)
第一页,共43页。
离散(lísàn)选择模型
1。二项选择模型 主要(zhǔyào)包括: Probit模型〔标准正态分布〕 Logit模型〔逻辑分布〕
第二页,共43页。
Logit 模型(móxíng)
Logit模型假定模型的误差项服从Logistic分布
e x iβ
第十四页,共43页。
排序选择(xuǎnzé)模型
根据GSS的调查数据,不同的家庭母亲与子 女之间的关系也不同。根据调查显示,有的 家庭母子〔女〕关系比较紧张,有的比较融 洽。变量包括:warm=关系融洽度〔0、1、2、 3〕;educ=子女接受教育的程度;age=子女 年龄(niánlíng);male=儿子;prst=职业威望; white=白人;y89=89年调查结果。分析不同 因素对母子〔女〕关系的融洽程度有何影响。
第二十三页,共43页。
nbreg daysabs langarts male 命令结果中将提供一个LR 检验, 原假设:不存在过度分散,应该使用泊松回 归(huíguī)。此时alpha=0。 备那么假设: alpha<>0,不能使用泊松回归 (huíguī)。
第二十四页,共43页。
受限因变量模型(móxíng)
第二十八页,共43页。
tobit y x1 x2 x3,ll(#) 〔变量<#的被左截断(jié duàn)〕
tobit y x1 x2 x3,ul(#)〔变量>#的被右截断(jié duàn)〕
tobit y x1 x2 x3,ll(#) ul(#)〔l同时定义下限和 上限〕
第二十九页,共43页。
利用womenwork.dta的数据进行普通OLS回 归和截取回归。被解释变量(biànliàng)为lwf 〔log of wage if working and 0 if not working〕。解释变量(biànliàng)为age〔年 龄〕, married〔婚否〕, children〔子女数〕, education〔教育年限〕。

离散选择模型分析39页PPT

离散选择模型分析39页PPT

谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
离散选择模型分析

6、黄金时代是在我们的前面,而不在 我们的 后面。

7、心急吃不了热汤圆。

8、你可以很有个性,但某些时候请收 敛。

9、只为成功找方法,不为失败找借口 (蹩脚 的工人 总是说 工具不 好)。

10、只要下定决心克服恐惧,便几乎 能克服 任何恐 惧。因 为,请 记住, 除了在 脑海中 ,恐惧 无处藏 身。-- 戴尔. 卡耐基 。
40、学而不思则罔,思而不学则殆。——孔子
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
MODEL 3-2 2variables (cost/LOS)
MODEL 4-2 2variables (time/LOS)
Data Modification
• We modify row-data to remove unreasonable data set
- Such as the choice of the not-dominant alternative
logcost5
los2
60
0
0.7419ቤተ መጻሕፍቲ ባይዱ7
6
60
1
1.029619
6
100
0
0.741937
10
60
1
1.029619
6
Modeling Estimated Results(DIST5)
Model distance5
1-1-5
2-1-5
3-1-5
0.2899 0.2884 0.1042
Modeling Estimated Results(DIST6)
Model 1 has 1 unreasonable data sets(in all data sets) Model 2 has 31 unreasonable data sets(in all data sets) Model 3 has 8 unreasonable data sets(in all data sets) Model 4 has 85 unreasonable data sets(in all data sets)
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0 m1-1-5
m2-1-5
m3-1-5
m1-1-6
m2-1-6
m3-1-6
m1-1
m2-1
m3-1
Introduction
• This paper developed a disaggregated logistics demand models using discrete choice analysis method.
• Data used is 2008-SP data from a survey. • Stata was employed for the estimation of logit
Model distance6
1-1-6
2-1-6
3-1-6
0.2588 0.2539 0.0704
Modeling Estimated Results(DIST5&6)
Model Distance5&6
1-2
2-2
3-2
0.2539 0.2521 0.0838
Modeling Comparison
models.
SP Data set information
• Stated pointed: 2007 • Analysis commodity: steel • Analysis range: 30 people(row 600-1500) • Dependent variable: choice • Independent variables: cost [log(#/10^5)]
time [hour] LOS [#/10]
Modeling Scenarios Setting
Modeling scenarios
Market Segment?
MODEL 1-1 - Distance 5/6
3variables (cost/time/LOS)
Y
MODEL 2-1 - Distance 5/6 2variables (cost/time)
离散选择模型logit模型实例 stata分析
Contents
• Introduction • SP Data set information • Modeling scenarios setting • Data modification • Modeling estimated results • Modeling comparison • Conclusion
80 350000
7
60
2
• Data reorganize example
id mode distance
qtype
cost
time
223 rail
5
1
210000
14
223 truck
5
223 rail
5
1
280000
6
10
210000
19
223 truck
5
10
280000
7
los
choice
Model 4 is ignored
Data Modification
• Basic data
rail
truck
id distance question type
cost
time
los
cost
time
los
choice
223
5
1
210000
14
60 280000
6
60
2
223
5
2
260000 14
MODEL 3-1 - Distance 5/6 2variables (cost/LOS)
MODEL 4-1 - Distance 5/6 2variables (time/LOS)
MODEL 1-2 N 3variables (cost/time/LOS)
MODEL 2-2 2variables (cost/time)
相关文档
最新文档