logistic回归分析85883

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假如职业分类为工、农、商、学、兵5 类,则可定义比分类数少1个,即4个哑变 量。编码方法如下:
logistic回归分析85883
logistic回归分析85883
yi=b0+b1x1i+b2x2i+…+bnxni
➢ 应变量(dependent variable) ➢ 自变量( independent variable) ➢ 偏回归系数 pertial regression coefficient ➢ 常数项b0 ➢ 决定系数 determination coefficient,R square
注法S料P:是的SS完相语无全通句法可的一进以。样行用,条于任件单何L因统o8g素计0is软分tic年件析回均,代归有从局这,,限一就一性点像。也s个a可s没以有看专出门统(计针精计借算对神学配助器的可对科)方嘉资学,
Logistic回归即
使用计算机,计
算的时间也以天
计。
logistic回归分析85883
个数的增加而增加,所以需要校正】
校正决定系数(R2c)越大,方程越优。 Cp选择法:选择Cp最接近p或p+1的方程
多变量的控制或调整法就是同时记录可 能有影响的因素,把他们与可能的危险 因素一起作分析
单因素分析有统计学意义,多因素分析 没有意义的解释,举例
logistic回归分析85883
In univariate analysis, the family histories of SAH and ICH were positively associated with each of the subtypes of stroke. whereas after adjustment for potential risk factors,
这样,一个回归方程就建立了,回归方 程的建立就是如此easy。
logistic回归分析85883
有线性关系拟合优度不一定很好
上述F和t检验有统计学意义,只是说明 自变量 与y有线性关系,但未能表示“关系有多大”
举例:上述方程的R2很小,但因为样本量大, F值很大
R2的意义:可以由BMI,age和膳食口味解释 SBP的4.3%变化
logistic回归分析85883
(1)自变量为连续型变量 :必要时作变换 (2)自变量为有序变量:依次赋值,如疗 效好中差,可分别赋值3、2、1 (3)自变量为二分类:如令男=1,女=0
(4)自变量为名义分类:需要采用哑变量 (dummy variables)进行编码
logistic回归分析85883
Is family history an independent risk factor for stroke?
J Neurol Neurosurg Psychiatry. 1997 Jan;62(1):66-70.
logistic回归分析85883
指标多,难以理解。在 计算自动化时代,这是 回归的难点,我们不懂 如何判断我们的模型的
我认为,因素分析可以只考虑线性关系的有无。 特别是在控制模式中。
logistic回归分析85883
全局择优法:
求出所有可能的回归模型(共有2m-1个)对应的准则值;
求出所有 按R2,Cp准则,AIC准则等统计量选择最优模型。 可能的回归模型(共有2m-1个)对应的 准则值;按上述准则选择最优模型
family history of ICH no longer showed
a significant association wБайду номын сангаасth haematoma.
Family history of intracerebral haematoma was not an independent risk factor for haematoma, but it might be a good predictor, which indirectly influences the pathogenesis of intracerebral haematoma via certain hereditary components such as hypertension, and even lifestyle factors such as alcohol consumption.
缺点:
如果自变量个数为4,则所有的回归有24-1= 15个; 当自变量数个数为10时,所有可能的回归为 210-1= 1023个;……;当自变量数个数为50时,所有可能的 回归为250-1≈1015个。
logistic回归分析85883
决定系数(R2)和校正决定系数(R2c),可以 用来评价回归方程的优劣。【 R2随着自变量
好坏
logistic回归分析85883
在影响因素分析中
一种是探索模式,在回归模型中探索所有
可能的自变量与应变量的关系
一种是控制模式,即控制混杂因素的影响 ✓ 后者对回归模型的要求要小的多,不出现异常
情况,可仅对模型拟合稍作考虑。
logistic回归分析85883
analyze-regression-linear
logistic回归分析85883
• SPSS建立方程 • 检验方程总体和各自变量的统计学意义 • 自变量的筛选 • Case的剔除(强影响点) • 共线性诊断
logistic回归分析85883建立方程的 计算量很大,
线性回归
一般需软件 完成。前人
Logistic 回归
手工计算这 两种回归
❖ ❖
➢ 共线性 collinearity:自变量间存在着线性关系
各自变量的假设检验与评价,检
关验lo系各g,i自sPt变<ic量回(可和归放应宽分变)量说析是明8否有5有8线8线性3性关
P将 检<就 矩 S0回验P.是阵S0归他系S5求的,的方们,说解各实程于同明b种现中 应0样所和计:的 变t拟b算值i所 量的合(不有 之过的弱求说自 间程方,解明变 是程线线量 否具性性作 具有方关为 有统程系一线计)的个性学强整关意体系义来,, analyz但e-并reg不re说ssi明on模-li型ne拟ar 合的好坏
相关文档
最新文档