logistic回归分析数据
excellogistic回归模型
excellogistic回归模型Excel中的logistic回归模型在数据分析中,logistic回归是一种常用的统计建模方法,用于预测二元变量的概率。
它可以被看作是线性回归模型的扩展,其中因变量是二元的(成功/失败,是/否等),而不是连续的。
这篇文章将带你逐步了解如何在Excel中使用logistic回归模型来分析数据。
一、准备数据首先,需要准备一组包含因变量和自变量的数据。
假设我们想预测一个人是否会购买某种产品,因变量可以是“购买”(1)或“不购买”(0),自变量可以是各种影响购买行为的因素,比如年龄、性别、收入等等。
将这些数据整理为一个Excel表格,确保每一列代表一个变量,每一行代表一个样本。
二、打开Excel的数据分析工具在Excel中,要使用logistic回归模型,首先需要打开数据分析工具。
在菜单栏中,点击“数据”选项卡,然后在“分析”组中找到“数据分析”按钮。
点击该按钮后,会弹出一个对话框,其中列出了各种可用的分析工具。
三、选择logistic回归模型在数据分析对话框中,滚动并找到“回归”选项,然后点击“回归”按钮。
在下一个对话框中,选择“logistic回归”模型,并点击“确定”按钮。
四、设置回归分析的输入范围在下一个对话框中,需要设置回归分析的输入范围。
第一个输入范围应该是因变量的数据列,也就是购买行为的数据。
点击“输入范围”文本框右侧的选择按钮,在表格中选择包含因变量的列。
接下来,选择自变量的数据范围,也就是影响购买行为的各种因素的数据。
同样地,点击“输入范围”文本框的选择按钮,并在表格中选择这些自变量的列。
五、设置其他选项在设置输入范围后,还可以选择一些其他的选项来控制回归分析的输出。
比如,可以选择是否计算拟合的残差,是否将结果显示在新的工作表中等。
根据需要勾选或取消这些选项。
六、点击“确定”按钮进行回归分析完成上述设置后,点击“确定”按钮来执行回归分析。
Excel会在选定的输出位置中生成结果。
SPSS—二元Logistic回归结果分析报告
SPSS—二元Logistic回归结果分析2011-12-02 16:48身心疲惫,睡意连连,头不断往下掉,拿出耳机,听下歌曲,缓解我这严重的睡意吧!今天来分析二元Logistic回归的结果分析结果如下:1:在“案例处理汇总”中可以看出:选定的案例489个,未选定的案例361个,这个结果是根据设定的validate = 1得到的,在“因变量编码”中可以看出“违约”的两种结果“是”或者“否” 分别用值“1“和“0”代替,在“分类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为 1,未选中的为0,如果四个都未被选中,那么就是”研究生“ 频率分别代表了处在某个教育水平的个数,总和应该为489个1:在“分类表”中可以看出:预测有360个是“否”(未违约)有129个是“是”(违约)2:在“方程中的变量”表中可以看出:最初是对“常数项”记性赋值,B为-1.026,标准误差为:0.103那么wald =( B/S.E)²=(-1.026/0.103)² = 99.2248, 跟表中的“100.029几乎接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,B和Exp(B) 是对数关系,将B进行对数抓换后,可以得到:Exp(B) = e^-1.026 = 0.358, 其中自由度为1, sig为0.000,非常显著1:从“不在方程中的变量”可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型表中分别给出了,得分,df , Sig三个值, 而其中得分(Score)计算公式如下:(公式中(Xi- X¯) 少了一个平方)下面来举例说明这个计算过程:(“年龄”自变量的得分为例)从“分类表”中可以看出:有129人违约,违约记为“1”则违约总和为 129,选定案例总和为489那么: y¯ = 129/489 = 0.16x¯ = 16951 / 489 = 34.2所以:∑(Xi-x¯)² = 30074.9979y¯(1-y¯)=0.16 *(1-0.16 )=0.216则:y¯(1-y¯)* ∑(Xi-x¯)² =0.216 * 30074.9979 = 5 840.9044060372 则:[∑Xi(yi - y¯)]^2 = 43570.8所以:=43570.8 / 5 840.9044060372 = 7.76 = 7.46 (四舍五入)计算过程采用的是在 EXCEL 里面计算出来的,截图如下所示:从“不在方程的变量中”可以看出,年龄的“得分”为7.46,刚好跟计算结果吻合!!答案得到验证~!!!!1:从“块1” 中可以看出:采用的是:向前步进的方法,在“模型系数的综合检验”表中可以看出:所有的SIG 几乎都为“0”而且随着模型的逐渐步进,卡方值越来越大,说明模型越来越显著,在第4步后,终止,根据设定的显著性值和自由度,可以算出卡方临界值,公式为:=CHIINV(显著性值,自由度) ,放入excel就可以得到结果2:在“模型汇总“中可以看出:Cox&SnellR方和 Nagelkerke R方拟合效果都不太理想,最终理想模型也才:0.305 和 0.446,最大似然平方的对数值都比较大,明显是显著的似然数对数计算公式为:计算过程太费时间了,我就不举例说明计算过程了Cox&SnellR方的计算值是根据:1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0 (指只包含“常数项”的检验)2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InLB (包含自变量的检验)再根据公式:即可算出:Cox&SnellR 方的值!提示:将Hosmer 和 Lemeshow 检验和“随机性表” 结合一起来分析1:从Hosmer 和 Lemeshow 检验表中,可以看出:经过4次迭代后,最终的卡方统计量为:11.919,而临界值为:CHINV(0.05,8) = 15.507卡方统计量< 临界值,从SIG 角度来看: 0.155 > 0.05 , 说明模型能够很好的拟合整体,不存在显著的差异。
logistic回归分析
0
1X1
2X2
mXm
10
若 Z 0 1X1 2 X 2 m X m 则 P 1 1 eZ
1P
00..55
0
Z
-4 -3 -2 -1 0 1 2 3 4
图16-1 logistic函数的图形
11
2.模型参数的意义
ln P 1 P
0
1X1
2X2
mXm
logitP
常数项β0表示暴露剂量为0时个体发病与
20
二、logistic回归模型的参数估计
数据格式: 同多元线性回归分析的数据格式 参数估计:
最大似然估计(maximum likelihood
estimate,MLE)法 可利用统计软件实现。
21
优势比估计: 某一因素两个不同水平优势比的估计值为
OR j exp bj C1 C0
Xj只有两个水平时ORj的1-α可信区间为:
研究二分类或多分类观察结果与一些影响
因素之间关系的一种多变量分析方法。
7
一、基本概念
二分类变量
连续变量
因变量Y=
1 0
阳性率P:(0,1)
ln
P 1-P
:
(,
)
Logit变换
8
ln P 1 P
0
1X1
2X2
mXm
P
1
1 exp[(0 1 X1 2 X 2 L m X m )]
32
33
34
Variables in the Equation
S1ta ep
x6 Constant
S2tb ep
x5 x6
Constant
B 2.826 -.523 1.828 3.059
logistic回归分析
三、Logistic回归模型参数的估计
1、假设变量 y 取值1和0,表示患和未患胃病。变量 x 也取 值1 和0,表示吸烟和不吸烟。调查数据的频数列在表A。
表A 频数 分布
表B 概率 分布
2、如果p=p(y=1|x)满足模型
那么,
3、根据最大似然法,该问题的最大似然函数是:
根据极值原理可以得到参数的估计值是: 4、拟和的logistic回归模型(fitted model):
其中,α和β是未知参数或待估计的回归系数。 该模型描述了y取某个值(这里y=1)的概率p与 自变量x之间的关系。
2、 多元logistic回归模型
令y是1,0变量,x1,x2,…,xk是k个危险因素; p=p(y=1|x1,x2,…,xk),那么,变量y关于变 量x1,x2,…,xk的k元logistic回归模型是:
Logistic回归系数的意义
分析因素xi为多分类变量时,为方便起见, 常用1,2,…,k分别表示k个不同的类别。 进行Logistic回归分析前需将该变量转换成 k-1个指示变量或哑变量(design/dummy variable),这样指示变量都是一个二分变 量,每一个指示变量均有一个估计系数,即 回归系数,其解释同前。
研究者关心的问题诸如:
哪些因素导致了人群中有的人患胃癌而有 的人不患胃癌?
哪些因素导致了手术后有的人感染,而有 的人不感染?
哪些因素导致了某种治疗方法出现治愈、 显效、好转、无效等不同的效果?
是回归分析问题吗?
“ 这些应该是属于回归分析问题!”
但是这种回归分析问题不能借助于线性回归 模型,因为因变量的假设条件遭到破坏。
Logistic回归系数的意义
• 分析因素xi为等级变量时,如以最小或最大 等级作参考组,并按等级顺序依次取为0,1, 2,…。此时, e(bi) 表示xi增加一个等级时 的优势比, e(k* bi)表示xi增加k个等级时的 优势比。
LOGISTIC回归分析
LOGISTIC回归分析前⾯的博客有介绍过对连续的变量进⾏线性回归分析,从⽽达到对因变量的预测或者解释作⽤。
那么如果因变量是离散变量呢?在做⾏为预测的时候通常只有“做”与“不做的区别”、“0”与“1”的区别,这是我们就要⽤到logistic分析(逻辑回归分析,⾮线性模型)。
参数解释(对变量的评价)发⽣⽐(odds): ODDS=事件发⽣概率/事件不发⽣的概率=P/(1-P)发⽣⽐率(odds ratio):odds ratio=odds B/odds A (组B相对于组A更容易发⽣的⽐率)注:odds ratio⼤于1或者⼩于1都有意义,代表⾃变量的两个分组有差异性,对因变量的发⽣概率有作⽤。
若等于1的话,该组变量对事件发⽣概率没有任何作⽤。
参数估计⽅法线性回归中,主要是采⽤最⼩⼆乘法进⾏参数估计,使其残差平⽅和最⼩。
同时在线性回归中最⼤似然估计和最⼩⼆乘发估计结果是⼀致的,但不同的是极⼤似然法可以⽤于⾮线性模型,⼜因为逻辑回归是⾮线性模型,所以逻辑回归最常⽤的估计⽅法是极⼤似然法。
极⼤似然公式:L(Θ)=P(Y1)P(Y2)...p(Y N) P为事件发⽣概率P I=1/(1+E-(α+βX I))在样本较⼤时,极⼤似然估计满⾜相合性、渐进有效性、渐进正太性。
但是在样本观测少于100时,估计的风险会⽐较⼤,⼤于100可以介绍⼤于500则更加充分。
模型评价这⾥介绍拟合优度的评价的两个标准:AIC准则和SC准则,两统计量越⼩说明模型拟合的越好,越可信。
若事件发⽣的观测有n条,时间不发⽣的观测有M条,则称该数据有n*m个观测数据对,在⼀个观测数据对中,P>1-P,则为和谐对(concordant)。
P<1-P,则为不和谐对(discordant)。
P=1-P,则称为结。
在预测准确性有⼀个统计量C=(NC-0.5ND+0.5T)/T,其中NC为和谐对数,ND为不和谐对数,这⾥我们就可以根据C统计量来表明模型的区分度,例如C=0.68,则表⽰事件发⽣的概率⽐不发⽣的概率⼤的可能性为0.68。
数据分析知识:数据分析中的Logistic回归分析
数据分析知识:数据分析中的Logistic回归分析Logistic回归分析是数据分析中非常重要的一种统计分析方法,它主要用于研究变量之间的关系,并且可以预测某个变量的取值概率。
在实际应用中,Logistic回归分析广泛应用于医学疾病、市场营销、社会科学等领域。
一、Logistic回归分析的原理1、概念Logistic回归分析是一种分类分析方法,可以将一个或多个自变量与一个二分类的因变量进行分析,主要用于分析变量之间的关系,并确定自变量对因变量的影响。
Logistic回归分析使用的是逻辑回归模型,该模型是将自变量与因变量的概率映射到一个范围为0-1之间的变量上,即把一个从负无穷到正无穷的数映射到0-1的范围内。
这样,我们可以用这个数值来表示某个事件发生的概率。
当这个数值大于0.5时,我们就可以判定事件发生的概率比较高,而当这个数值小于0.5时,我们就可以判定事件发生的概率比较小。
2、方法Logistic回归分析的方法有两种:一是全局最优化方法,二是局部最优化方法。
其中全局最优化方法是使用最大似然估计方法,而局部最优化方法则是使用牛顿法或梯度下降算法。
在进行Logistic回归分析之前,我们首先要对数据进行预处理,将数据进行清洗、变量选择和变量转换等操作,以便进行回归分析。
在进行回归分析时,我们需要先建立逻辑回归模型,然后进行参数估计和模型拟合,最后进行模型评估和预测。
在进行参数估计时,我们通常使用最大似然估计方法,即在估计参数时,选择最能解释样本观测数据的参数值。
在进行模型拟合时,我们需要选取一个合适的评价指标,如准确率、召回率、F1得分等。
3、评价指标在Logistic回归分析中,评价指标包括拟合度、准确性、鲁棒性、可解释性等。
其中最常用的指标是拟合度,即模型对已知数据的拟合程度,通常使用准确率、召回率、F1得分等指标进行评价。
此外,还可以使用ROC曲线、AUC值等指标评估模型的性能。
二、Logistic回归分析的应用1、医学疾病预测在医学疾病预测中,Logistic回归分析可以用来预测患某种疾病的概率,如心脏病、肺癌等。
logistic回归分析
Logistic回归分析 3.OR值的计算和意义 影响因素由X▲ 变化到X* 时,有 ln OR=∑ βj(xj*-xj▲) (1)对多指标的共同效应进行评价: ) 若OR>1,则不利因素占主导地位; 若OR<1,则保护因素占主导地位; 若OR=1,则处于平衡状态。
Logistic回归分析
(2)对单因素进行评价: )对单因素进行评价:
二、基本原理
1.结果问题 : 对于第i个个体而言,其理论结果为pi , 而实际结果是δi 。 2.一致问题: 对于第i个个体而言, δi =1 pi δi =0 qi
Logistic回归分析 pi δ i qi 1- δ i 对于全部n个研究对象而言, 对于全部 个研究对象而言,其一致 个研究对象而言 性为: 性为: L=∏ pi δ i qi 1- δ i 使得L最大的α及βj即为所求。函数法
四、参数解释
1. 偏回归系数βj 的意义 与指标的计量单位有关,从而无实际 的解释意义。
Logistic回归分析 2.标准化偏回归系数βj 的意义
1
(1)符号:取 “+”,则xj 促进阳性结果的
发生,为不利因素; 取 “-”,则xj 抑制阳性结果的 发生,为保护因素。 1 (2)大小 :∣ βj ∣越大,则xj 对结果的 影响也就越大。
▲
Logistic回归分析 4.筛选危险因素
常用方法有(1)前进法; (2)后退法; (3)逐步法:有进有出, 双向筛选。 筛选危险因素的统计量是: 似然比统计量 G=2(lnL k+1-lnL k) 它服从自由度为1的卡方分布。
Logistic回归分析
数学模型: 数学模型:
p =
e
1+
α + β1X 1 + β 2 X
logistic回归模型分析和总结
含有名义数据的logit
含有名义数据的logit
• 例:某地25岁及以上人中各类婚姻状况居民的死
亡情况见表,试建立死亡率关于年龄和婚姻状况
的logit模型。
ln p 1 p
A 1M1
2M 2
3M3
• 其中,A表示年龄(取中值),M1、M2、M3表示婚 姻状况
• 于是,估计的logit方程为:
多项logit模型
【例】研究三个学校、两个课程计划对学生偏好何 种学习方式的影响。调查数据见表:
• 其中,三个学校对应两个哑变量x1和x2,两个课 程计划为常规(x3=1)和附加(x3=0),学习方式分 为:自修(y=1)、小组(y=2)、上课(y=3)
• 从题目可以看出,响应变量是学习方式有三类, 属于多项逻辑斯蒂回归问题。于是,建模为:
ln ln
p1 p3 p2 p3
10 11x1 12 x2 13 x3 20 21x1 22 x2 23x3
多项logit模型
多项logit模型
• 应用统计软件可以得到模型的参数估计和回归方程:
ln
p1 p3
0.5931.134 x1 0.618 x3
ln
p2 p3
0.603 0.635 x3
ln p A E
1 p
• 其中A为年龄,E为文化程度
含有有序数据的logit
含有有序数据的logit
• 于是,估计的logit方程为:
ln p 11.637 0.124A 0.164E 1 p
• 其中,年龄的系数0.124,说明年龄越大死亡率会 越高;
• 文化程度的系数-0.164,说明文化程度与死亡率 呈负相关,文化程度越高,死亡率越低。
7-多元Logistic-回归分析解析
什么是哑变量?
一个含有g个类的分类型变量可以构造g个哑变量。
29
如何用SAS程序构造哑变量? data d2; set d1; array a{3} student teacher worker; do i=1 to 3; a{i}=( x 1= i ) ; end; run;
data d2; set d1;
INTERCPT 1 3.7180 0.6387 33.8853
0.0001
.
.
BIRTHWT 1 -0.00397 0.000588 45.6092
0.0001 -0.702480 206.996
1、因变量bpd对自变量birthwt 的logistic回归模型是:
2、自变量birthwt 的回归系数在统计意义上不等于0 (p=0.0001),因此,OR=0.996在统计意义上不等于1。 OR=0.996 说明新生儿出生体重每增加一个单位(g),患 BPD病的机会就会减少大约0.4% 。即患bpd病的概率 随新生儿出生体重的增加而下降。
• 按因变量取值个数:
• 二值logistic回归分析
• 多值logistic回归分析
• 按自变量个数:
• 一元logistic回归分析
• 多元logistic回归分析
9
第二节 Logistic 回归分析的数学模型
(1) 二值一元logistic回归模型: 令y是1,0变量,x是任
意变量,p=p(y=1|x) ,那么,二值变量y关于 变量x的一元logistic 回归 模型是:
Analysis of Maximum Likelihood Estimates
Parameter Standard Wald
Logistic回归分析
Logistic 回归分析Logistic 回归分析是与线性回归分析方法非常相似的一种多元统计方法。
适用于因变量的取值仅有两个(即二分类变量,一般用1和0表示)的情况,如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,对于这类数据如果采用线性回归方法则效果很不理想,此时用Logistic 回归分析则可以很好的解决问题。
一、Logistic 回归模型设Y 是一个二分类变量,取值只可能为1和0,另外有影响Y 取值的n 个自变量12,,...,n X X X ,记12(1|,,...,)n P P Y X X X ==表示在n 个自变量的作用下Y 取值为1的概率,则Logistic 回归模型为:[]0112211exp (...)n n P X X X ββββ=+-++++它可以化成如下的线性形式:01122ln ...1n n P X X X P ββββ⎛⎫=++++ ⎪-⎝⎭通常用最大似然估计法估计模型中的参数。
二、Logistic 回归模型的检验与变量筛选根据R Square 的值评价模型的拟合效果。
变量筛选的原理与普通的回归分析方法是一样的,不再重复。
三、Logistic 回归的应用(1)可以进行危险因素分析计算结果各关于各变量系数的Wald 统计量和Sig 水平就直接反映了因素i X 对因变量Y 的危险性或重要性的大小。
(2)预测与判别Logistic回归是一个概率模型,可以利用它预测某事件发生的概率。
当然也可以进行判别分析,而且可以给出概率,并且对数据的要求不是很高。
四、SPSS操作方法1.选择菜单2.概率预测值和分类预测结果作为变量保存其它使用默认选项即可。
例:试对临床422名病人的资料进行分析,研究急性肾衰竭患者死亡的危险因素和统计规律。
Logistic回归分析.sav解:在SPSS中采用Logistic回归全变量方式分析得到:(1)模型的拟合优度为0.755。
SPSS—二元Logistic回归结果分析
SPSS—二元Logistic回归结果分析2011-12-02 16:48身心疲惫,睡意连连,头不断往下掉,拿出耳机,听下歌曲,缓解我这严重的睡意吧!今天来分析二元Logistic回归的结果分析结果如下:1:在“案例处理汇总”中可以看出:选定的案例489个,未选定的案例361个,这个结果是根据设定的validate = 1得到的,在“因变量编码”中可以看出“违约”的两种结果“是”或者“否” 分别用值“1“和“0”代替,在“分类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为 1,未选中的为0,如果四个都未被选中,那么就是”研究生“ 频率分别代表了处在某个教育水平的个数,总和应该为489个1:在“分类表”中可以看出:预测有360个是“否”(未违约)有129个是“是”(违约)2:在“方程中的变量”表中可以看出:最初是对“常数项”记性赋值,B为-1.026,标准误差为:0.103那么wald =( B/S.E)²=(-1.026/0.103)² = 99.2248, 跟表中的“100.029几乎接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,B和Exp(B) 是对数关系,将B进行对数抓换后,可以得到:Exp(B) = e^-1.026 = 0.358, 其中自由度为1, sig为0.000,非常显著1:从“不在方程中的变量”可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型内表中分别给出了,得分,df , Sig三个值, 而其中得分(Score)计算公式如下:(公式中(Xi- X¯) 少了一个平方)下面来举例说明这个计算过程:(“年龄”自变量的得分为例)从“分类表”中可以看出:有129人违约,违约记为“1”则违约总和为 129,选定案例总和为489那么: y¯ = 129/489 = 0.2638036809816x¯ = 16951 / 489 = 34.664621676892所以:∑(Xi-x¯)² = 30074.9979y¯(1-y¯)=0.2638036809816 *(1-0.2638036809816 )=0.19421129888216则:y¯(1-y¯)* ∑(Xi-x¯)² =0.19421129888216 * 30074.9979 = 5 840.9044060372则:[∑Xi(yi - y¯)]^2 = 43570.8所以:=43570.8 / 5 840.9044060372 = 7.4595982010876 = 7.46 (四舍五入)计算过程采用的是在 EXCEL 里面计算出来的,截图如下所示:从“不在方程的变量中”可以看出,年龄的“得分”为7.46,刚好跟计算结果吻合!!答案得到验证~1:从“块1” 中可以看出:采用的是:向前步进的方法,在“模型系数的综合检验”表中可以看出:所有的SIG 几乎都为“0”而且随着模型的逐渐步进,卡方值越来越大,说明模型越来越显著,在第4步后,终止,根据设定的显著性值和自由度,可以算出卡方临界值,公式为:=CHIINV(显著性值,自由度) ,放入excel就可以得到结果2:在“模型汇总“中可以看出:Cox&SnellR方和 Nagelkerke R方拟合效果都不太理想,最终理想模型也才:0.305 和 0.446,最大似然平方的对数值都比较大,明显是显著的似然数对数计算公式为:计算过程太费时间了,我就不举例说明计算过程了Cox&SnellR方的计算值是根据:1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0 (指只包含“常数项”的检验)2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InLB (包含自变量的检验)再根据公式:即可算出:Cox&SnellR 方的值!提示:将Hosmer 和 Lemeshow 检验和“随机性表” 结合一起来分析1:从Hosmer 和 Lemeshow 检验表中,可以看出:经过4次迭代后,最终的卡方统计量为:11.919,而临界值为:CHINV(0.05,8) = 15.507卡方统计量< 临界值,从SIG 角度来看: 0.155 > 0.05 , 说明模型能够很好的拟合整体,不存在显著的差异。
logistic回归分析(2)
8
非条件logistic回归
logit 因变量 自变量,[选择项]
sw logit 因变量 自变量,[选择项]
选择项: or 指定结果中给出OR值,缺失时输出回归系数 pr(#)是剔除变量的P值 pe(#)是选入变量的P值
9
例1(成组病例对照研究) 某单位研究胸膜间皮瘤与接触石 棉的关系,资料见下表。试对其进行分析。
begin with full model
p = 0.7439 >= 0.1100 removing ht
p = 0.1314 >= 0.1100 removing drug
Conditional (fixed-effects) logistic regression Number of obs = 315
4
参数估计与假设检验
参数的估计:极大似然(MLE) 假设检验:
似然比检验: G=-2lnL-(-2lnL’)
Wald检验: z 检验
2 i
(
ˆi SE(ˆi
)
)
2
5
回归系数的解释
回归系数 表示当其它自变量固定不变时, X每改变一个单位,优势对数的改变量(优 势比的对数)。
6
回归系数的解释
7
回归系数的解释
多分类变量:哑变量(dummy variable)
x=1时: x1=1, x2=0, x3=0, x4=0 表示A型血 x=2时: x1=0, x2=1, x3=0, x4=0 表示B型血 x=3时: x1=0, x2=0, x3=1, x4=0 表示AB型血 x=4时: x1=0, x2=0, x3=0, x4=1 表示O型血
➢ 回归系数β:表示病例与对照变量值之差与患病 优势的关系,即exp(β)表示病例与对照暴露水平 相差一个单位时患病的优势比。
Logistic回归分析报告结果解读分析
Logistic回归分析报告结果解读分析Logistic回归常用于分析二分类因变量(如存活和死亡、患病和未患病等)与多个自变量的关系。
比较常用的情形是分析危险因素与是否发生某疾病相关联。
例如,若探讨胃癌的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群有不同的临床表现和生活方式等,因变量就为有或无胃癌,即“是”或“否”,为二分类变量,自变量包括年龄、性别、饮食习惯、是否幽门螺杆菌感染等。
自变量既可以是连续变量,也可以为分类变量。
通过Logistic回归分析,就可以大致了解胃癌的危险因素。
Logistic回归与多元线性回归有很多相同之处,但最大的区别就在于他们的因变量不同。
多元线性回归的因变量为连续变量;Logistic回归的因变量为二分类变量或多分类变量,但二分类变量更常用,也更加容易解释。
1.Logistic回归的用法一般而言,Logistic回归有两大用途,首先是寻找危险因素,如上文的例子,找出与胃癌相关的危险因素;其次是用于预测,我们可以根据建立的Logistic回归模型,预测在不同的自变量情况下,发生某病或某种情况的概率(包括风险评分的建立)。
2.用Logistic回归估计危险度所谓相对危险度(risk ratio,RR)是用来描述某一因素不同状态发生疾病(或其它结局)危险程度的比值。
Logistic回归给出的OR(odds ratio)值与相对危险度类似,常用来表示相对于某一人群,另一人群发生终点事件的风险超出或减少的程度。
如不同性别的胃癌发生危险不同,通过Logistic回归可以求出危险度的具体数值,例如1.7,这样就表示,男性发生胃癌的风险是女性的1.7倍。
这里要注意估计的方向问题,以女性作为参照,男性患胃癌的OR是1.7。
如果以男性作为参照,算出的OR将会是0.588(1/1.7),表示女性发生胃癌的风险是男性的0.588倍,或者说,是男性的58.8%。
撇开了参照组,相对危险度就没有意义了。
Logistic回归分析(共53张PPT)
• 优势比
• 常把出现某种结果的概率与不出现的概率 之比称为比值(odds),即odds=p/1-p。两个
比值之比称为比值比(Odds Ratio),简称 OR。
• Logistic回归中的常数项(b0)表示,在不
接触任何潜在危险/保护因素条件下,效 应指标发生与不发生事件的概率之比的对 数值。
Forward: LR ( 向前逐步法:似然比 法 likelihood ratio,LR)→ 再击下 方的 Save 钮,将 Predicted values 、 Influence 与 Residuls 窗口中的 预选项全勾选 → Continue → 再击 下方的 Options 钮,将 Statistics and Plot 小窗口中的选项全勾选 → Continue → OK 。
三、参数检验
• 似然比检验(likehood ratio test)
通过比较包含与不包含某一个或几 个待检验观察因素的两个模型的对数似 然函数变化来进行,其统计量为G (又 称Deviance)。
G=-2(ln Lp-ln Lk) 样本量较大时, G近似服从自由度
为待检验因素个数的2分布。
• 比分检验(score test)
, Logistic回归系数的解释变得更为复杂 ,应特别小心。
根据Wald检验,可知Logistic回归系
数bi服从u分布。因此其可信区间为
病例与对照匹配---条件logistic回归 其中, 为常数项, 为偏回归系数。 应变量水平数大于2,且水平之间不存在等级递减或递增的关系时,对这种多分类变量通过拟合一种广义Logit模型方法。
u= bi s bi
u服从正态分布,即为标准正态离差。
logistic回归分析
表13-7 例13-2的logistic回归模型自变量筛选结果
模型
因素 X
第1步 常数项
回归系数 标准误
b
Sb
-2.528 0.238
Wald χ2 P值 112.433 <0.001
OR值
OR值95%可信区间 下限 上限
0.080
治疗11周
2.149 0.289 55.267 <0.001 8.578 4.867 15.117
因素 X 常数项
回归系数 标准误
Waldχ2 P值 OR值
b
Sb
-0.910 0.136 44.870 0.000 0.403
OR值95%可信区间
下限
上限
吸烟
0.886 0.150 34.862 0.000 2.424 1.807
3.253
饮酒
0.526 0.157 11.207 0.001 1.692 1.244
logistic回归分析
Logistic regression analysis
• 医学研究中应变量有时是二分类结果,如发病与不 发病、死亡与生存、有效与无效、复发与未复发等, 当需要研究二分类应变量的影响因素时,适合采用 logistic回归分析。
logistic回归属于概率型非线性回归,它是研究二 分类(可以扩展到多分类)反应变量与多个影响 因素之间关系的一种多变量分析方法。logistic回 归模型参数具有明确的实际意义。
OR值的可信区间:
exp(bj - zα/2 Sbj ) ORj exp(bj zα/2 Sb j )
• 例13-1 研究吸烟(X1)、饮酒(X2)与食道癌 (Y)关系的病例-对照资料,试作logistic回归 分析。
调查数据分析二元Logistic回归
回归建模——二元Logistic回归模型
回归建模——二元Logistic回归模型 Logit(P) P
回归建模——二元Logistic回归模型
建立logit(p)与X的多元线性回归模型:
(取值范围-∞~+∞)
优势比(odds) 机会比(odds)
logistic回归模型
Logistic回归模型:
模型拟合优度信息指标有:-2lnL、AIC、SC。这3个指标越小表示模型拟合的越好。
1
2
3
拟合优度检验
类R2是预测准确性的粗略近似,在自变量与因变量完全无关时,类R2值趋近于0;当和模型能够完美预测时,类R2趋近于1.
Logistic回归模型的预测准确性
2 Logistic回归模型的预测准确性
01
Logistic回归模型
回归建模——二元Logistic回归模型
当虚拟变量作为因变量,虚拟变量有两个取值,可使用二元Logistic回归。
例:在一次有关公共交通的调查中,一个调查项目为“是乘坐公交车上下班,还是骑自行车上下班”。因变量有两个取值,当取值为1,乘坐公交车上下班;取值为0,骑自行车上下班。
Logistic回归模型估计:极大似然估计
多元回归采用最小二乘估计,使因变量的
Logistic变换的非线性特征使得在估计模型的
真实值和预测值差异值的平方和最小化;
时候采用极大似然估计的迭代方法,找到
系数的“最可能”的估计,在计算整个模型
拟合度时,采用似然值。
Logistic回归模型估计:极大似然估计
Logistic回归模型估计:极大似然估计
分别对参数求偏导,然后令它等于0:
求得 的估计值 ,从而得到 (pi的极
Logistic回归模型分析
Logistic回归模型一、Logistic分布的概率密度函数及图形:f(x)=exp(-x)/(1+exp(-x))^2;(选取的x值是-14至14)二、Logistic分布的分布函数及图形:F(x)=exp(x)/(1+exp(x));(选取的x值是-14至14)三、在clementine中建立logistic回归模型及输出结果分析:选取80%的数据,在clementine中,以工作状况,家庭住址,教育程度,所在地区,退休与否,婚姻状况,性别,年龄和收入9个变量为自变量,以电信客户流失状况为因变量,建立logistic模型。
以下为输出的结果分析。
1、变量重要性分析:如下图所示,9个变量对客户流失的影响作用不一样,其中工作状况是影响最大的变量,其比重为0.376。
另外,教育程度(比重为0.225)和家庭地址(比重为0.223)的影响也比较明显。
而年龄几乎不是影响因素。
2、单个变量显著性及系数经济意义分析:下图中,B为自变量的回归系数,若B为负则代表该自变量与因变量呈反向变动的关系。
S.E.是标准差;Wald指的是Wald统计量;df是指自由度;sig.指的是显著性(其值越小说明自变量对因变量的影响越显著);Exp(B)代表着各自变量的回归系数的经济意义,即在保持其他条件不变时,特定自变量变动1单位时,所影响到发生率的变化率为B单位。
从图中可以看出,工作状况对因变量的影响是完全显著,其系数为-0.064,说明了工作状况与客户流失之间的反向变动关系,且当其他自变量保持不变的条件下,消费者的工作状态每变动1单位,所带来的客户流失的发生率的变化率为0.064个单位。
这与实际情况相符合。
其次,教育程度,家庭住址和婚姻状况对因变量的影响也较显著,这可能与电信的宣传策略和信号覆盖以及状况相关。
然而,其他变量的显著性水平就比较低。
其中收入的显著性最差,可能是因为各个通信公司的服务价格与质量区别不大,收入水平对客户流失情况影响很小。
logistic回归结果描述
logistic回归结果描述Logistic回归是一种广泛应用于分类问题的统计模型。
它用于预测二元(二分类)或多元(多分类)离散变量的概率。
通过使用Logistic函数(或称为Sigmoid 函数),Logistic回归可以将连续的输入变量映射到[0, 1]之间的输出范围,从而进行概率估计和分类预测。
在本次研究中,我们使用Logistic回归来分析某个特定影响因素对疾病发病风险的影响。
首先,我们收集了一组与该疾病有关的各种变量数据,如年龄、性别、家族史和生活习惯等。
然后,我们将这些自变量作为输入特征,将被调查对象是否发病作为输出变量。
通过对数据进行Logistic回归分析,我们得到了一组结果。
首先,我们获得了回归系数,它们代表了每个自变量对目标变量的影响程度。
这些系数告诉我们,对于每个单位的自变量变化,目标变量的对数几率会如何改变。
此外,我们还计算了每个自变量的标准误差和置信区间,用于评估回归系数的稳定性和显著性。
标准误差较大的系数可能表示模型对此特征的预测能力较弱。
通过解释回归系数,我们可以理解每个变量对疾病风险的影响。
例如,年龄系数为0.05,意味着每增加一岁,患病风险的对数几率将增加0.05。
类似地,如果性别系数为-0.2,代表女性的患病风险较男性低0.2倍。
这些结果有助于我们了解各个因素的相对重要性和贡献。
此外,我们还对模型的性能进行了评估。
我们使用交叉验证或留出法来评估模型的准确性、召回率和精确度。
这些指标帮助我们确定模型的预测能力,并进行模型的优化和改进。
总之,通过Logistic回归分析,我们可以得到一组关于疾病发病风险的结论。
这些结论将有助于我们进一步了解该疾病的潜在影响因素,并为日后的预防和干预提供指导。
logistic_回归分析1
74
55
104663
212555
选择0和1使似然函数L达到最大,即最 大似然估计。
17
STATA命令
Expand f Logit y x Logit, or 或直接logisitc y x
18
expand f (317343 observations created)
OR e
0.4117232
1.509417
21
OR的95%可信区间为(1.06,2.14)
应用Logistic模型校正混杂作用
实例2:上例没有考虑吸烟情况,故将吸烟作 为分层加入,资料如下:
吸烟 不吸烟 饮酒 不饮酒 饮酒 不饮酒 患病 33 21 22 53 未患病 22331 14210 82332 198345 合计 22364 14231 82354 198398
. logistic y x Logistic regression Log likelihood = -1133.5955 Number of obs = 317347 LR chi2(1) = 5.20 (模型检验) Prob > chi2 = 0.0225 Pseudo R2 = 0.0023
----------------------------------------------------------------------------- y | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] -------------+--------------------------------------------------------------- x1 | .999979 .1877859 -0.00 1.000 .6920603 1.4449 x2 | 5.530467 1.0412 9.08 0.000 3.823925 7.998605 ------------------------------------------------------------------------------
统计学-logistic回归分析
研究问题可否用多元线性回归方法?
ˆ y a b x b x b x 1 1 2 2 m m 1.多元线性回归方法要求 Y 的取值为计量
的连续性随机变量。 2.多元线性回归方程要求Y与X间关系为线 性关系。 ˆ 不能回答“发生与 3.多元线性回归结果 Y 否” logistic回归方法补充多元线性回归的不足
第十六章 logistic回归分析
logistic回归为概率型非线性回归 模型,是研究分类观察结果(y)与 一些影响因素(x)之间关系的一种 多变量分析方法
问题提出:
医学研究中常研究某因素存在条件下某结果是否 发生?以及之间的关系如何? 因素(X) 疾病结果(Y) x1,x2,x3…XK 发生 Y=1 不发生 Y=0 例:暴露因素 冠心病结果 高血压史(x1):有 或无 有 或 无 高血脂史(x2): 有 或 无 吸烟(x3): 有或无
lnllnplnlikehoodratiotest通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进行其统计量为近似服从自由度为待检验因素个数的scoretest以未包含某个或几个变量的模型为基础保留模型中参数的估计值并假设新增加的参数为零计算似然函数的一价偏导数又称有效比分及信息距阵两者相乘便得比分检验的统计量分布
• 分析因素xi为等级变量时,如果每个等级的 作用相同,可按计量资料处理:如以最小或 最大等级作参考组,并按等级顺序依次取为 0,1,2,…。此时, e(bi) 表示xi增加一个等 级时的优势比, e(k* bi)表示xi增加k个等级时 的优势比。如果每个等级的作用不相同,则 应按多分类资料处理。 • 分析因素xi为连续性变量时, e(bi)表示xi增加 一个计量单位时的优势比。
Y 发病=1 不发病=0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
序号提交答卷时间所用时间来自IP12014/6/30 15:48:3975秒113.247.238.165(湖南-长沙)22014/6/30 15:53:21188秒222.240.152.229(湖南-长沙)32014/6/30 15:55:05124秒222.240.152.232(湖南-长沙)42014/6/30 15:57:17106秒61.50.138.155(北京-北京)52014/6/30 15:57:57152秒223.104.21.184(湖南-长沙)62014/6/30 15:58:46197秒220.202.153.15(湖南-长沙)72014/6/30 15:58:51181秒113.247.238.166(湖南-长沙)82014/6/30 16:04:38101秒106.37.19.111(北京-北京)92014/6/30 16:06:51133秒113.240.233.13(湖南-长沙)102014/6/30 16:07:50166秒117.136.8.9(上海-上海)112014/6/30 16:08:17156秒61.157.136.155(四川-绵阳)122014/6/30 16:09:02161秒123.124.147.5(北京-北京)132014/6/30 16:10:04131秒117.136.0.90(北京-北京)142014/6/30 16:10:10191秒220.202.152.101(湖南-长沙)152014/6/30 16:11:17185秒117.136.24.142(湖南-长沙)162014/6/30 16:14:50183秒36.16.145.162(浙江-杭州)172014/6/30 16:15:01401秒117.136.24.140(湖南-长沙)182014/6/30 16:24:12164秒61.187.50.52(湖南-长沙)192014/6/30 16:25:1155秒114.253.113.234(北京-北京)202014/6/30 16:25:58100秒111.192.206.241(北京-北京)212014/6/30 16:28:18169秒117.136.24.142(湖南-长沙)222014/6/30 16:28:19191秒222.240.152.234(湖南-长沙)232014/6/30 16:28:35213秒113.240.233.2(湖南-长沙)242014/6/30 16:31:49124秒113.240.233.251(湖南-长沙)252014/6/30 16:32:07303秒222.246.191.219(湖南-长沙)262014/6/30 16:35:2649秒113.247.238.165(湖南-长沙)272014/6/30 16:35:41136秒113.247.238.165(湖南-长沙)282014/6/30 16:42:57158秒221.238.197.149(山东-济南)292014/6/30 16:44:16189秒114.253.118.229(北京-北京)302014/6/30 16:52:01169秒113.240.233.4(湖南-长沙)312014/6/30 16:52:51179秒222.240.105.3(湖南-长沙)322014/6/30 16:53:05107秒220.202.153.22(湖南-长沙)332014/6/30 16:53:40129秒123.5.54.195(河南-平顶山)342014/6/30 16:53:48300秒113.247.238.162(湖南-长沙)352014/6/30 16:54:01135秒117.136.24.133(湖南-长沙)362014/6/30 16:54:02136秒117.136.24.133(湖南-长沙)372014/6/30 16:55:17159秒101.4.32.242(北京-北京)382014/6/30 16:55:18178秒220.180.126.218(安徽-亳州)392014/6/30 16:55:58121秒114.255.122.178(北京-北京)402014/6/30 16:57:25294秒221.179.140.148(北京-北京)412014/6/30 17:01:38148秒113.240.233.4(湖南-长沙)422014/6/30 17:01:58120秒58.142.230.102(Seoul-tukpyolsi-Seoul) 432014/6/30 17:02:052705秒111.8.2.137(湖南-湖南)442014/6/30 17:05:14693秒222.240.152.195(湖南-长沙)452014/6/30 17:05:25112秒113.240.233.8(湖南-长沙)462014/6/30 17:10:39107秒113.247.238.162(湖南-长沙)472014/6/30 17:12:341523秒222.240.152.198(湖南-长沙)482014/6/30 17:14:42157秒113.220.108.11(湖南-长沙)492014/6/30 17:18:57129秒223.104.21.203(湖南-长沙)502014/6/30 17:20:4272秒223.104.21.133(湖南-长沙)512014/6/30 17:22:08146秒220.202.153.83(湖南-长沙) 522014/6/30 17:30:06259秒61.148.244.231(北京-北京) 532014/6/30 17:34:31191秒114.248.198.251(北京-北京) 542014/6/30 17:37:4590秒106.38.250.207(北京-北京) 552014/6/30 17:38:2296秒220.202.152.42(湖南-长沙) 562014/6/30 17:47:26177秒221.220.102.177(北京-北京) 572014/6/30 17:50:37128秒119.197.0.233(未知-未知)582014/6/30 17:57:46201秒221.223.111.181(北京-北京) 592014/6/30 17:58:54208秒113.240.233.6(湖南-长沙)602014/6/30 17:58:58120秒113.247.238.165(湖南-长沙) 612014/6/30 18:02:18189秒222.240.152.196(湖南-长沙) 622014/6/30 18:08:15127秒202.108.128.162(北京-北京) 632014/6/30 18:10:0688秒101.226.89.14(上海-上海)642014/6/30 18:10:13164秒117.136.24.200(湖南-长沙) 652014/6/30 18:10:20152秒61.148.243.161(北京-北京) 662014/6/30 18:23:41203秒114.242.250.196(北京-北京) 672014/6/30 18:28:191243秒221.11.61.56(陕西-西安)682014/6/30 18:43:16189秒113.247.238.165(湖南-长沙) 692014/6/30 18:46:32177秒119.39.233.75(浙江-杭州)702014/6/30 18:47:19214秒113.247.238.165(湖南-长沙) 712014/6/30 18:48:07121秒113.240.233.11(湖南-长沙) 722014/6/30 18:49:51174秒61.48.186.247(北京-北京)732014/6/30 18:57:2898秒222.244.75.19(湖南-长沙)742014/6/30 19:06:12191秒113.240.233.13(湖南-长沙) 752014/6/30 19:20:29117秒220.202.153.83(湖南-长沙) 762014/6/30 19:50:23105秒222.240.152.233(湖南-长沙) 772014/6/30 19:58:33192秒113.240.233.244(湖南-长沙) 782014/6/30 19:58:57138秒58.20.96.110(湖南-长沙)792014/6/30 20:03:3880秒175.0.17.100(湖南-长沙)802014/6/30 20:07:18227秒223.104.21.177(湖南-长沙) 812014/6/30 20:17:13240秒222.247.49.35(湖南-长沙)822014/6/30 20:18:13174秒117.136.24.194(湖南-长沙) 832014/6/30 20:22:12158秒222.247.49.35(湖南-长沙)842014/6/30 20:33:45130秒222.240.152.198(湖南-长沙) 852014/6/30 20:46:59133秒222.240.152.198(湖南-长沙) 862014/6/30 20:48:11270秒61.48.198.82(北京-北京)872014/6/30 20:48:1168秒113.240.233.246(湖南-长沙) 882014/6/30 21:26:01184秒106.49.82.37(北京-北京)892014/6/30 21:26:37169秒220.202.153.126(湖南-长沙) 902014/6/30 21:31:06161秒218.27.171.35(吉林-吉林)912014/6/30 21:59:35245秒117.136.24.205(湖南-长沙) 922014/6/30 22:07:25150秒210.47.0.236(吉林-长春)932014/6/30 22:20:23201秒113.240.233.12(湖南-长沙) 942014/6/30 22:21:31130秒61.48.197.62(北京-北京)952014/6/30 22:26:2842秒113.247.238.165(湖南-长沙) 962014/6/30 22:29:12142秒222.246.191.69(湖南-长沙) 972014/6/30 22:35:17304秒113.247.238.165(湖南-长沙) 982014/6/30 22:37:39139秒113.247.238.165(湖南-长沙) 992014/6/30 22:40:30120秒117.136.38.178(北京-北京) 1002014/6/30 22:59:58124秒198.228.200.20(康涅狄格州-Bristol) 1012014/6/30 23:46:14151秒113.247.238.163(湖南-长沙)1022014/7/1 0:35:06108秒222.240.152.230(湖南-长沙) 1032014/7/1 10:18:28143秒222.246.191.69(湖南-长沙) 1042014/7/1 11:01:54137秒223.104.21.189(湖南-长沙) 1052014/7/1 11:23:53127秒39.65.188.155(山东-青岛) 1062014/7/1 12:08:46131秒114.242.248.167(北京-北京) 1072014/7/1 13:50:57199秒175.9.150.119(湖南-长沙) 1082014/7/1 21:01:37115秒113.247.238.166(湖南-长沙)3.您的兼职月收入为?第4题(旅游/购物娱乐)来源渠道 1.你的性别是2.您一般一个月的出行次数是手机提交(直接访问)22(空)1链接(直接访问)22(空)1手机提交(直接访问)22(空)1手机提交(直接访问)2291手机提交(直接访问)21(空)1手机提交(直接访问)22(空)1链接(直接访问)1101手机提交(直接访问)21(空)1手机提交(直接访问)12(空)1手机提交(直接访问)14(空)1手机提交(直接访问)1140001手机提交(直接访问)21(空)1手机提交(直接访问)2210001手机提交(直接访问)112001手机提交(直接访问)14(空)1手机提交(直接访问)24(空)1手机提交(直接访问)21(空)1链接(直接访问)1100链接(直接访问)2301手机提交(直接访问)12(空)0手机提交(直接访问)13(空)1链接(直接访问)22(空)1链接(直接访问)11(空)0链接(直接访问)12(空)0手机提交(直接访问)22(空)1链接(直接访问)22(空)1手机提交(直接访问)12(空)1手机提交(直接访问)12(空)0手机提交(直接访问)11(空)1手机提交(直接访问)14(空)1手机提交(直接访问)22(空)1手机提交(直接访问)22(空)1手机提交(直接访问)12(空)1手机提交(直接访问)22(空)1手机提交(直接访问)21(空)1手机提交(直接访问)21(空)1手机提交(直接访问)14(空)1手机提交(直接访问)11(空)1手机提交(直接访问)2401手机提交(直接访问)23(空)1手机提交(直接访问)12(空)1手机提交(直接访问)23(空)1手机提交(直接访问)1230001手机提交(直接访问)112000链接(直接访问)122001手机提交(直接访问)11(空)1手机提交(直接访问)11(空)0手机提交(直接访问)11(空)1手机提交(直接访问)1201手机提交(直接访问)23(空)1手机提交(直接访问)21(空)1手机提交(直接访问)11(空)1手机提交(直接访问)12(空)1手机提交(直接访问)21(空)1手机提交(直接访问)21(空)1手机提交(直接访问)14(空)1手机提交(直接访问)2230000手机提交(直接访问)2130001链接(直接访问)224001手机提交(直接访问)11(空)1链接(直接访问)11(空)1手机提交(直接访问)22(空)1手机提交(直接访问)11(空)1手机提交(直接访问)11(空)0手机提交(直接访问)1430001手机提交(直接访问)13(空)1手机提交(直接访问)118001手机提交(直接访问)21(空)1手机提交(直接访问)11(空)0手机提交(直接访问)22(空)1链接(直接访问)22(空)1链接(/)11(空)1手机提交(直接访问)12(空)1手机提交(直接访问)215001手机提交(直接访问)14(空)1手机提交(直接访问)13(空)1手机提交(直接访问)12(空)1手机提交(直接访问)213001手机提交(直接访问)21(空)1手机提交(直接访问)24(空)1链接(直接访问)121200-18001手机提交(直接访问)11(空)1链接(直接访问)13(空)1链接(直接访问)1101链接(直接访问)12(空)1手机提交(直接访问)23(空)1手机提交(直接访问)22(空)1手机提交(直接访问)11(空)1手机提交(直接访问)128001手机提交(直接访问)21(空)1手机提交(直接访问)11(空)1链接(直接访问)14(空)1链接(直接访问)12(空)1手机提交(直接访问)2110001手机提交(直接访问)21(空)0手机提交(直接访问)12(空)1手机提交(直接访问)212000手机提交(直接访问)23(空)1手机提交(直接访问)23(空)1手机提交(直接访问)144000美金1手机提交(直接访问)24(空)1手机提交(直接访问)11(空)0手机提交(直接访问)12(空)1手机提交(直接访问)22(空)1手机提交(直接访问)22无1手机提交(直接访问)11(空)1手机提交(直接访问)22(空)1手机提交(直接访问)14(空)1第4题(探访亲友/返家)第4题(公事外出)第4题(兼职/学习)第4题(会友)第4题(其它)5.对当今公共交通的满意程度100003000102100003100003001102000103001002100003000113000103000102100103001103001112101103000113100003000113000102100102000013001013100101100103000013100003000102100103000012101003100013000112100103100112001002001002101103101101010103100003001003000101001102011002101103001003000112100003000102100103010003 101103 001002 001003 100113 001103 111002 100101 000103 100003 000113 100003 100102 100113 001101 100003 010003 001103 010013 100001 000101 000103 000112 100003 001111 000103 001102 101003 001003 010112 110003 100002 100003 110002 000113 101103 100102 011101 100003 001103 001103 100102 001102 000103 100102 000113 111013 100103 100101 001102 001011100113 000012 100002 100002 100003 101003 0001036.最讨厌那种出行方式第7题(用时长)第7题(价格贵)第7题(不方便)第7题(不安全)第7题(整洁度有限,拥挤等) 410111210001210001200001210011210011201110500111210001100111110101501000210001210001210001310110210000210100210101411000210100501000200001410000210000410111200001100000200001210001501000210101200100210000210101210101200100300001210001210001410001210000210101200001210001200100210101200001200001210001200100 501000 100100 210100 210001 410000 400100 511001 210001 310100 210101 210101 210101 400101 310010 100100 410000 200101 500001 100001 210101 210001 210001 300100 300100 501100 210101 501000 200001 210111 210000 210101 200101 410001 101100 200001 210101 500110 210101 410001 210001 210000 200001 210101 210000 210101 210001 410100 210001 400000 501000401110 210000 210100 410001 400101 210100 4000019.长途旅行,您一般会选择何种旅行方式第7题(服务态度)第7题(其他)8.短途旅行,您一般会选择何种交通方式104500121031003500351015005110620011001200450141004201611161001500210032004500450042003100310021012100451012012100420032004200310022001200120012002500250025002500440015006200310011006100321031003200120011 0061 0166 0025 0032 0055 0042 1025 0031 0045 0031 0025 0025 0131 0062 0062 0025 0031 1015 0022 0031 0025 0022 0022 0045 0142 0132 0031 0025 1022 0111 0035 1042 0065 0111 0115 0031 0022 0022 0031 0131 0011 1011 0025 0133 0031 0131 0034 0042 1055 00661032 0032 0012 0055 0045 0112 0025第11题(排在第1位)第11题(排在第2位)第11题(排在第3位)第11题(排在第4位) 10.你觉得交通工具对于个人形象的重要性31243356143542-22123422314426141324-2321433231441245225143231432465412464516-2234123241332315445314231431234315243253-246315345123234132536326142134-23432-2412433123442354323144235-24235-2332451324-232413341353234-23512-2241261124-231352321562213-231523224313241335126 43456 1243-2 3432-2 22143 33425 3213-2 45324 32341 34532 31426 21253 33425 33562 3243-2 22531 43456 4215-2 2256-2 32341 45231 22341 31234 1421-2 21234 33156 44536 4153-2 3325-2 32134 22145 2431-2 32451 4635-2 32451 33124 45231 42453 35341 42561 32134 4351-2 1214-2 4542-2 31234 32134 42134 3435-2 33246 3453-2 4621-242143 2361-2 21326 13561 4243-2 41532 3134-2第11题(排在第5位)第11题(排在第6位)12.你将来有购车的打算吗?并说明原因-2-2有的。