离散选择模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 4、模型运算 • glm1=glm(plan~sex+province+limit+cost+p remium,family=binomial(link=logit),data=c c) • > summary(glm1)
23
• 5、模型整体检验 • >glm0=glm(plan~1,family=binomial(link=lo git),data=cc) • > summary(glm0) • anova(glm0, glm1) • 1-pchisq(16.795,5)
离散选择模型
主讲教师 陈锟
学习资料
• http://elsa.berkeley.edu/~train/
Kenneth Train
2
学习资料
3
学习资料
R 统计软件
4
为何要采用离散选择模型
• Discrete Choice Model • 当被解释变量Y,是一个分类变量,而非连 续变量时,我们应当选用DCM来构建因果 关系。而不能选用LRM(Linear Regression Model)。
21
• 3、描述性统计 • >boxplot(sex~plan,data=cc,main="sex") • > boxplot(province~plan,data=cc,main="prov ince") • >boxplot(limit~plan,data=cc,main="limit") • >boxplot(cost~plan,data=cc,main="cost") • boxplot(premium~plan,data=cc,main="pre mium") 22
17ቤተ መጻሕፍቲ ባይዱ
R操作
1、直接输入数据 >p<-c(95,92,103,115,77,79,105,94,85,101,106,120,118,75,99) >mean(p) >sd(p) >s<-c(98,94,110,125,82,84,112,99,93,107,114,132,129,79,105) >mean(s) >sd(s) >plot(p,s) >lm.sol<-lm(s~p) >summary(lm.sol)
• It is up to you whether to choose SPSS or R. But I would highly recommend R for advanced users. It is worth of the investment and you are gonna fall in love with it. 12
26
27
19
回归分析完成了吗?
• 模型诊断。《应用商务统计》p12-p14。
– 异方差 – 正态性 – 多重共线性(数据矩阵是否满秩) – 外生性
• par(mfrow=c(2,2)) • plot(lm.sol,which=c(1:4))
20
二元logit
• • • • • • 1、将excel数据转化为txt文本文件 2、读入数据 cc=read.table("C:/cc.txt",header=T) cc str(cc) cc[1:5,]
Who is using R?
• Top statisticians • 西南交通大学周庭锐教授 • 北京大学光华管理学院
Where to get R?
• http://cran.r-project.org/
13
R related books
14
What R can do for us?
• 矩阵计算 • 描述性统计 • 常有的统计模型:方差分析、回归、logit、 聚类分析、判别分析、因子分析、生存分析 等等。 • 前沿的统计模型:现代贝叶斯方法、MCMC • Graphics
10
Why not SPSS?
• 盗版 • 模型滞后 • “傻瓜”软件
11
Why R?
• • • • It is free Tiny and powerful Updated packages Build your own model: Bayesian statistics and marketing
5
为何要采用离散选择模型
• LRM处理分类结果变量时,会出现什么问 题? • 离散选择模型的分类
– 根据随机误差项的分布假定,分为Logit和 Probit模型 – 根据Y的取值水平,分为二元模型和多元模型 – 拓展模型:Nested Logit; Mixed Logit
6
二元Logit模型的推导
• 选用Logistic分布的理由? • IIA与红蓝汽车问题
7
离散选择模型的作用
• 识别关键影响因素 • 衡量关键影响因素的作用 • 预测选择的概率
8
离散选择模型的应用
9
我们已经学会了什么?
• 我们可以用SPSS进行描述性统计、均值比 较。 • 我们可以用SPSS进行二元logit模型分析, 研究影响消费者选择的因素。 • But SPSS is not good enough, we need another weapons.
24
• 6、模型预测 • 某个未知choice的消费者的购买概率是多 少? • plan等于多少? • plan预测对了吗?
25
• • • • •
p=predict(glm1,cc) p=exp(p)/(1+exp(p)) cc[1:5,] cc$pred=1*(p>0.5) table(cc[,c(4,8)])
15
初识R
• example(lm) • demo(persp) • demo(graphics)
16
描述性统计与回归分析
省编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 相对促销费用 95 92 103 115 77 79 105 94 85 101 106 120 118 75 99 相对销售额 98 94 110 125 82 84 112 99 93 107 114 132 129 79 105
18
2、从文本文件中读入数据 将工作目录指定到ex1.txt存放的位置或者在 read.table函数中添加路径。
>ex1<-read.table("C:\\ex1.txt",head=TRUE) >names(ex1) >ex1 >ex1[1:5,] >attach(ex1) >plot(s~p) >lm.sol<-lm(s~p) >summary(lm.sol) >abline(lm(s~p))