第4讲 暑期数学建模 定性计量分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、虚拟变量模型
定性变量的量化
定性变量一般量化都比较困难,但大多 定性变量都可区分为不同的状态 . 例如 学生可区分为小学生、中学生、大学生、 硕士研究生、博士生;战争可区分为发 生与不发生;季节可区分为春、夏、秋、 冬等等.
一、虚拟变量模型
定性变量的量化
最简单的区分就是将定性变量区分为两 种状态,如发生战争与不发生战争;男 与女;学生与非学生等等.
例如反映文程度的虚拟变量可取为:
D=
1, 本科
0, 非本科
一般地,在虚拟变量的设置中,基础类 型,肯定类型取值为 1 ;比较类型,否 定类型取值为0.
一、虚拟变量模型
虚拟变量模型(dummy variables model)
含有解释变量为虚拟变量的模型称为虚 拟变量模型. 虚拟变量模型实质上是把虚拟变量引入 回归函数,引入的方式有加法、乘法、 加法和乘法同时.
一、虚拟变量模型
虚拟变量模型(dummy variables model) 我们分别用“ 0”或“ 1”来表示定性变 量的“是”和“非”两种状态,通过这 种“量化”而得到的变量称为虚拟变量 (dummy variables),记为D.
一、虚拟变量模型
虚拟变量模型(dummy variables model)
根据 F 的不同,常用的二元选择模型有: Probit模型、Logit模型、Extreme Value 模型。
二、二元选择模型
二元选择模型
m*对应的分布 分布函数F
标准正态分布 二元选择模型 Probit模型
F(x)
ex/(1+ex)
Logistic分布 Ⅰ型极值分布
Logit模型
1-exp(-ex) Extreme Value模型
虚拟变量引入的原则 虚拟变量个数比定性变量的类别数少1 例 如已知冷饮的销售量Y受春、夏、秋、 冬四季变化的影响,要考察该四季的影 响,只需引入三个虚拟变量即可:
1 夏季 1 秋季 1 春季 D2t D3t D1t 0 其他 0 其他 0 其他
一、虚拟变量模型
例题
(2)乘法方式
加法方式引入虚拟变量,主要考察截距 的不同.许多情况下,往往是斜率有变 化,或斜率、截距同时发生变化. 只考虑斜率的变化可通过以乘法的方式 引入虚拟变量来测度.
一、虚拟变量模型
虚拟变量模型(dummy variables model)
例 根据消费理论,消费水平 C 主要取 决于收入水平 Y ,但在一个较长的时期, 人们的消费倾向会发生变化,尤其是在 自然灾害、战争等反常年份,消费倾向 往往出现变化.
F(g1-XiTb) F(g2-XiTb)-F(g1-XiTb) F(g3-XiTb)-F(g2-XiTb) …
1-F(gM-XiTb)
gM<yi*
三、排序选择模型
排序选择模型
根据F的不同,常用的排序选择模型有
m*对应的分布 分布函数F 标准正态分布 F(x)
Logistic分布 Ⅰ型极值分布 ex/(1+ex) 排序选择模型
四、计数模型
计数模型
计数模型中被解释变量为计数变量,即 事件发生的数目。计数模型适用于被解 释变量是离散的正整数且具有数值小、 取零的个数较多而且解释变量多是表示 属性的虚拟变量的情况。
四、计数模型
计数模型
计数模型表示为:
lnE(yi)=XiTbi ; i=1,2,…,n
其中,yi为事件发生的次数,E(yi)表示yi 的期望, Xi 为表示属性的定性变量(即 虚拟变量).
为确定指标值yi*,我们考虑以下概率模 型:
P( yi 1 xi ; b ) P( yi* 0)
P(mi* X iT b )
1 F ( X iT b )
其中F是假设的参差项mi的分布函数.
二、二元选择模型
二元选择模型及其估计
由概率知识有
T F ( X P( yi 0 xi ; b ) i b)
三、排序选择模型
排序选择模型 为解决这一问题,可采用如下定义:假 设有一个与 Xi有关的指标变量 yi*,用yi* 是否在某一临界范围内来确定 yi 的值, 即建立模型:
yi* X iT b mi*
三、排序选择模型
排序选择模型
yi取值 yi*的临界范围 yi的概率
0 1 2 … M
yi*≤ g1 g1<yi*≤g2 g2<yi*≤g3 …
Probit模型
Logit模型
1-exp(-ex) Extreme Value模型
三、排序选择模型
实例
为研究选民态度与收入的关系,在调查 执政者的支持率的民意测验中得到如下 数 据 : y=0 表 示 支 持 , y=1 表 示 中 立 , y=2表示不支持。
EViews操作:估计方法选择ORDERED
四、计数模型
例题
不同轮船发生事故次数模型 ----y 表示平 均每月发生事故次数。 EViews操作:和一般多元回归一样,但 这里选择COUNT估计方法。
四、计数模型
实例5.3
二、二元选择模型
二元选择模型 为解决这一问题,可采用如下定义:假 设有一个与 X 有关的指标变量 yi* ,用 yi* 是否超过一个临界值决定 yi 取 0 或 1 (如 yi*>0,则y=1,yi*<0,则y=0),即建立模型:
yi* X iT b mi*
二、二元选择模型
二元选择模型及其估计
一、虚拟变量模型
虚拟变量模型(dummy variables model)
这种消费倾向的变化可通过在收入的系 数中引入虚拟变量来考察.
1 ,正常年份 如设 D 0 ,反常年份
消费模型可建立如下:
Ct b0 b1 X t b 2 Dt X t mt
一、虚拟变量模型
虚拟变量模型(dummy variables model)
第4讲 Βιβλιοθήκη Baidu性计量分析
一、虚拟变量模型
二、二元选择模型 三、排队选择模型 四、计数模型
一、虚拟变量模型
定性变量的量化
古典线性回归模型中的经济变量都是定 量的变量,但是在经济中也存在许多定 性的变量,如职业、性别、战争、自然 灾害、季节等,它们对某些经济变量也 有显著影响,那么如何将这些定性变量 引入模型呢?
为研究采取某项保险革新措施的速度 y 与保险公司的规模 x1 和保险公司类型的 关系,选取下列数据: y 一个保险公司 提出该项革新直到革新被采纳间隔的月 数, x1 公司资产(单位:百万美元), x2=1 表示股份公司,x2=0 表示互助公司。
二、二元选择模型
二元选择模型 二元选择模型为:
yi X iT b mi
(3)加法方式和乘法方式同时用
既考虑截距的变化,又考虑斜率的变化, 可同时通过加法方式和乘法的方式引入 虚拟变量来测度.如
Ct 0 1Dt b1 X t b 2 Dt X t mt
或
Ct ( 0 1Dt ) (b1 b 2 Dt ) X t mt
一、虚拟变量模型
三、排序选择模型
排序选择模型
排序选择模型如下:
yi X iT b mi
其中 yi 为因变量,取值为 0 、 1 、…、 M 等 M+1 数中的某个; Xi 为影响选择的因 素变量,b为参数向量.
三、排序选择模型
排序选择模型
同样对排序选择模型进行简单的回归是 不行的,因为一方面模型的残差项有一 些假定条件不能满足,另一方面 Y 的拟 合值也不可能只取0、1、2、…、M.
二、二元选择模型
例题 临床数据表明:心肌梗塞和人体内的两 项指标值密切相关,即 HDL (高密度脂 蛋白)和 Fib (纤维蛋白原),为了研 究它们对心肌梗塞是否有影响,收集了 53 个临床数据。 Y=1 表示有心肌梗塞, y=0表示没有心肌梗塞。
二、二元选择模型
例题 二元选择模型的参数不具有边际分离效 应,只能从参数估计值的符号上判断解 释变量的增加引起被解释变量增加或减 少的概率的大小。 EViews操作:估计方法选择BINARY
设 yi 表示被解释变量——备择对象,其 取值为0或1.Xi=(1,x2i ,x3i ,…,xki)T 表示 解释变量, b(b1,b2,…,bk)T, 于是两项 选择模型就可表示成:
二、二元选择模型
二元选择模型
对二元选择模型进行简单的回归是不行 的,因为一方面模型的残差项有一些假 定条件不能满足,另一方面 yi 的拟合值 也不可能只取0或1.
三、排序选择模型
排序选择模型
排序选择是常见的一类现象,如购物者 根据商品的价格、商品的性能、购物者 的收入、购物者的偏好等对所购买的某 类商品进行优先选择的排序,用 0 、 1 、 2、3表示.
三、排序选择模型
排序选择模型
又如,不同消费者根据商品的价格、商 品的性能、购物者的收入、购物者的偏 好等对同种商品形成的不同偏好,如十 分喜欢、喜欢、无所谓、厌恶、十分厌 恶,用0、1、2、3、4、5表示.
一、虚拟变量模型
虚拟变量模型(dummy variables model)
(1)加法方式
例 一个以性别为虚拟变量考察企业职 工薪金的模型: Yi=b0+b1Xi+b2Di+mi 其中, Yi 为企业职工的薪金, Xi 为工龄, 若是男则 Di=1,若是女性则Di=0.
一、虚拟变量模型
虚拟变量模型(dummy variables model)