运用SPSS做多元回归分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结果二:方差分析表
• 表中显著度(Sig)<0.001,表明整个方程是显著的,也 就是说自变量与因变量之间具有显著的线性关系。 • 但这并不意味着每个自变量与因变量都具有显著的线性关 系,具体的结论还需要看后面对每个自变量的回归系数的 检验结果。
结果三:回归系数表
• 表中B栏的非标准化回归系数表明:
x2、…、xm,并建立用x1、x2、…、xm预报 Y 的经验公式:
Y 0 1 X 1 2 X 2 m X m
从而用以进行预测或控制,达到指导生产活动的目的。
多元线性回归方程模型
假定因变量Y与自变量 X 1 , X 2 , X m 间存在如下关系:
Y 0 1 X 1 2 X 2 m X m
FOR EXAMPLE
一个变量的变化直接与另一组变量的变化有关:
人的体重与身高、胸围 血压值与年龄、性别、劳动强度、饮食习惯、吸烟 状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总 胆固醇、甘油三脂
多元回归分析数据格式
编号 1 2 ┇ i ┇ n
X1
X 11
X2
X 12
┅ ┅ ┅ ┇ ┅ ┇ ┅
• 第一,在控制了其他变量之后,本年固定资产投资 额高约1.491亿元; • 第二,不良贷款低约5.41亿元,贷款项目个数高约 1.294个,各项贷款余额和本年累计应收贷款分别高 约0.467亿元和0.208亿元;
• 由此我们可以得到回归方程式:
y=1.491 - 5.41×不良贷款+ 1.294×贷款
结果五:残差统计表
• 用SAS的检查得知,残差的均值为零(p=1.000),
且服从正态分布。
不良贷款 (亿元) 1.6 1.2
各项贷款余额 (亿元) 95.7 109.6
本年累计应收 贷款(亿元) 3.8 10.3
贷款项目个数 本年固定资产 (个) 投资额(亿元) 10 14 44.5 67.9
Xj
┅ ┅ ┅ ┇ ┅ ┇ ┅
Xm X 1m
Y
X1j
X2j
┇
Y1
X 21
┇
X 22
┇
X 2m
┇
Y2
┇
X i1
┇
X i2
┇
X ij
┇
X im
┇
Yi
┇
X n1
X n2
Xn j
X nm
Yn
注:患者编号为 i (i 1,2,, n) ;变量个数为 j ( j 1,2,, m)
在现实生活中,客观事物常受多种因素影响,我们记录下 相应数据并加以分析,目的是为了找出对我们所关心的指标 (因变量)Y 有影响的因素(也称自变量或回归变量)x1、
0.175×本年累计应收贷款+ 1.2935×贷款项目个数 y=1.87 - 5.415×1.2+ 0.47×109.6+ 0.175×10.3 + 1.2935×14 =66.83
THANKS !
FOR EXAMPLE
将不良贷款、各项贷款余额、本
年累计应收贷款和贷款项目个数作为
自变量,通过多元线性回归,分析其 对本年固定资产投资额的影响。
结果一告诉我们什么?
• R方表示了因变量 y 的总体变异中被所有自变量所解释的比例。 • 表中的R平方=0.727,表示整个方程能够解释本年固定资产投 资额的72.7%。
0.175×本年累计应收贷款+ 1.2935×贷款项目个数
不良贷款 (亿元) 1.6 1.2
各项贷款余额 (亿元) 95.7 109.6
本年累计应收 贷款(亿元) 3.8 10.3
贷款项目个数 本年固定资产 (个) 投资额(亿元) 10 14 44.5 67.9
y=1.87 - 5.415×不良贷款+ 0.47×各项贷款余额+
运用 SPSS 做 多元回归分析
吴慧若
概念
多元线性回归分析 也称复线性回归分析,它研究一组自变 量如何直接影响一个因变量。
自变量(independent variable)是指独立自由变量的变量,用向量X 表示;因变量(dependent variable)是指非独立的、受其它变量影响 的变量,用向量Y表示;由于模型仅涉及一个因变量,所以多元线性回 归分析也称单变量线性回归分析(univariate linear regression analysis)
y=1.491 - 5.41×不良贷款+ 0.467×各项贷款余额+ 0.208×本年累计应收贷款+ 1.294×贷款项目个数 y=2.249 - 5.42×不良贷款+ 0.473×各项贷款余额+ 0.142×本年累计应收贷款+ 1.253×贷款项目个数
y=1.87 - 5.415×不良贷款+ 0.47×各项贷款余额+
上式中, 0 是常数项, 1 , 2 , m 称为偏回归系数(partial regression coefficient)。 i i 1,2,m 的含义为在其它 自变量保持不变的条件下,自变量 X i 改变一个单位时因变量 Y 的平均改变量。 为随机误差,又称残差(residual),它 表示 Y 的变化中不能由自变量 X i i 1,2,m 解释的部分。
大的对因变量 y 的影响大,或者说,与因变量 y
的关联性强。
• Sig栏中每个回归系数的显著度水平,表明各自所
对应的那个自变量与因变量之间是否存在显著的
线性相关关系。
由此,我们可以认为不良贷款、各项贷款余额、
本年累计应收贷款和贷款项目个数都会影响本年
固定资产投资额。
结果四:多重共线性
1. 特征值,存在维度为4的值约等于0,说明存在比较严重的共线 性; 2. 条件索引列,第五列大于10,可以说存在比较严重的共线性; 3. 方差比例内存在接近于1的数(0.91),存在比较严重的共线性。
y=1.491 - 5.41×不良贷款+ 0.467×各项贷款余额+
0.208×本年累计应收贷款+ 1.294×贷款项目个数 y=1.491 - 5.41×1.6+ 0.467×95.7+ 0.208×3.8 + 1.294×10 =51.25
• 由此我们可以得到回归方程式:
y=2.249 - 5.42×不良贷款+ 0.473×各项贷款 余额+ 0.142×本年累计应收贷款+ 1.253×贷 款项目个数
多元回归模型必须满足的假定条件
1. 2.
因变量是连续随机变量; 自变量是固定数值型变量,且相互独立;
3.
4. 5. 6.
每一个自变量与因变量呈线性关系;
每一个自变量与随机误差相互独立; 观察个体的随机误差之间相互独立; 残差是随机变量,均值为零。
不良贷款(亿元)各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数(个) 本年固定资产投资额(亿元) 0.9 67.3 6.8 5 51.9 1.1 111.3 19.8 16 90.9 4.8 173 7.7 17 73.7 3.2 80.8 7.2 10 14.5 7.8 199.7 16.5 19 63.2 12.5 185.4 27.1 18 43.8 1 96.1 1.7 10 55.9 2.6 72.8 9.1 14 64.3 0.3 64.2 2.1 11 42.7 4 132.2 11.2 23 76.7 0.8 58.6 6 14 22.8 3.5 174.6 12.7 26 117.1 10.2 263.5 15.6 34 146.7 0.2 14.8 0.6 2 42.1 0.4 73.5 5.9 11 25.3 1 24.7 5 4 13.4 6.8 139.4 7.2 28 64.3 11.6 368.2 16.8 32 163.9 1.6 95.7 3.8 10 44.5 1.2 109.6 10.3 14 67.9 7.2 196.2 15.8 16 39.7
项目个数+ 0.467×各项贷款余额+
0.208×本年累计应收贷款
• 表中Beta栏的标准化回归系数的绝对值可以用于
比较各个自变量源自文库间对因变量的贡献大小:
各项贷款余额(0.933) > 不良贷款(-0.486) > 贷款
项目个数(0.276) > 本年累计应收贷款(0.033) 同一模型中对参数估计值进行大小比较,绝对值