简单回归分析精品PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(sum of squares about regression)
回归的贡献,回归平方和: (YY)2
(sum of squares due to regression)
Y的总变异分解
Y Y 2 Y ˆ Y 2 Y Y ˆ 2
SS 总S回 SSS 剩 r 2 SS 回
1.方差分析
理解回归中方差分析的基本思想, 需要对应变量Y 的离均差平方和lYY 作分 解(如图所示)。
Y的离均差, 总变异
残差
回归的 变异
Y的总变异分解
未引进回归时的总变异: (YY)2
(sum of squares about the mean of Y)
引进回归以后的变异(剩余): (Y Y)2
目的:研究应变量Y对自变量X的数量依存关系。 定量描述健康健康妇女基础代谢(X)与体重之间 (Y)数据的数量 上的依存关系: 将基础代谢称为自变量(independent variable),用 X 表示; 体重称为应变量(dependent variable),用 Y 表示
表11 14名中年健康妇女基础代谢与体重的测量值
简单、基本——直线回归、直线相关
历史背景:
英国人类学家 F.Galton首次在《自然遗传》 一书中,提出并阐明了“相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和英 国统计学家 Karl Pearson对上千个家庭的身高、 臂长、拃长(伸开大拇指与中指两端的最大长度)
做了测量,发现:
解题步骤
1.由原始数据及散点图观察两变 量间是否有直线趋势
2.计算 X 、Y 的均数 X 、Y ,离均 差平方和 l XX 、 lYY 与离均差积和 l XY 。
3、计算相关系数并对其进行假设
检验.
4、计算回归系数和截距,列出回归 方程
5、在散点图中选用两点P1(X1, Yˆ1 ) P2(X2, Yˆ2 )绘制直线.
回归线上的估计值 Y ˆ 的纵向距离 Y Yˆ 。
➢ 求解a、b实际上就是“合理地”找到一条能 最好地代表数据点分布趋势的直线。
原则:最小二乘法(least sum of squares),即可 保证各实测点至直线的纵向距离的平方和最小
回归参数的估计方法
b lXY lXX
( X X )(Y Y ) (X X )2
n
a Y b X 63 .9 2 6.3 4 12 2 7 2.2 7 9 1 71 .70 86
14
14
Y ˆ11 .70 9 6 6.4 1X 2
模型
系数a
标准系
非标准化系数

标准 误
B
差 试用版 t
Sig.
1 (常量) 1106.78 274.534
4.032 .002
8
体重 61.423 4.881 .964 12.584 .000 (kg)
aYbX
式 中 lX Y 为 X 与 Y 的 离 均 差 乘 积 和 :
lX Y (X X )(Y Y ) X Y ( X n )( Y )
本例:n=14
ΣX=63232.9 ΣY=777.2
ΣX2=290245421.5 ΣXY=3580632.51
XY XY
b
X2来自百度文库
n (X)2
61.4229
第十二章
简单回归分析
Simple linear regression analysis
本章内容
第一节 简单线性回归 第二节 线性回归的应用 第三节 残差分析
第一节 简单线性回归
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关
系:Y ˆ33.730.516X 。
也即高个子父代的子代在成年之后的身高平均来 说不是更高,而是稍矮于其父代水平,而矮个子父代的子 代的平均身高不是更矮,而是稍高于其父代水平。Galton 将这种趋向于种族稳定的现象称之“回归”
线性回归的概念及其统计描述
原点的上方 ➢ a < 0,则交点在原点的下方 ➢ a = 0,则回归直线通过原点
2. b为回归系数,即直线的斜率
b>0直线从左下方走向右上方,Y 随 X 增大而增大; b<0直线从左上方走向右下方,Y 随 X 增大而减小; b=0表示直线与 X 轴平行,X 与Y 无直线关系
b 的统计学意义是:X 每增加(减) 一个单位,Y 平均改变b个单位
不同斜率时回归直线的表现
Y Y ˆY ˆˆ a aa bbX Xb b b 00
Y
X
二、 回归模型的前提假设
线性回归模型的前提条件是:
线性(linear) 独立(independent) 正态(normal) 等方差(equal variance)
三、回归参数的估计-最小二乘原则
➢ 残差(residual)或剩余值,即实测值Y与假定
编号
基础代谢 (X)
体重 (Y)
编号 基础代谢 (X)
体重 (Y)
1 4175.6 50.7 8 3970.6 48.6
2 4435.0 53.7 9 3983.2 44.6
3 3460.2 37.1 10 5050.1 58.6
4 4020.8 51.7 11 5355.5 71.0
5 3987.4 47.8 12 4560.6 59.7
Y ˆ11.70 966.4 1X 2
X2(6.28)Yˆ2(49.61)4
X1(3.71)Yˆ1(33.86)5
四、总体回归系数β的的统计推断
样本回归系数b的标准误
sb
sy.x
n
(Yˆi Yi )2
i 1
n2
s y.x
n
(Xi X )2
i1
回归方程的假设检验
建立样本直线回归方程,只是完成 了统计分析中两变量关系的统计描述, 研究者还须回答它所来自的总体的直线 回归关系是否确实存在,即是否对总体 有 0 ?
6 4970.6 62.8 13 4874.4 62.1
7 5359.7 67.3 14 5029.2 61.5
Yi Yˆi
简单线性回归模型
Yi Xi i
样本线回归方程
Y ˆabX (121)
Y ˆ 为各X处Y的总体均数的估计。
1.a 为回归直线在 Y 轴上的截距 ➢ a > 0,表示直线与纵轴的交点在
相关文档
最新文档