6回归与相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、二者的主要差别
? 回归分析与相关分析在计算上有很多相似
之处,如果在应用时不注意所研究变量的 类型以及两种方法的内在差别,很容易出 现错误。
回归分析与相关分析的主要差别
统计方法 研究对象
相关分析
回归分析
若干变量一起 一个变量与其它变量间的函 变化的程度 数关系
变量关系
变量间的共变 一个因变量及一个或数个自
?
? ?
??? b ?
SP SSx
?
? ?
?
n
( X i ? X )( Yi ? Y )
i?1
n
(Xi ? X )2
i?1
? a ? Y ? bX
? (三)回归直线的图示 ? 资料的散点图 ? 回归直线图
(四)一元线性回归方程建立的基本步骤 (4步)
? 根据资料计算8个一级数据
?Σx , Σx2, x, Σy , Σy2 , ,yΣxy , n
? 一元线性回归的常用数学模型为:
? ? ? y i ?
? xi ? i
? α: 回归截距( Intercept )(又称回归常数) ? β: 回归系数( Coefficient of regression )
二、一元线性回归方程的建立
? (一)原理——最小二乘法 ? 线性回归方程的一般形式为:
y? ? a ? bx
? 仍然沿用上述名称
? 一元线性回归(Linear Regression)
? 如果自变量与因变量都是一个,且 y和x 大体上有线性关系,这种研究两个变量 线性关系的回归称为一元线性回归。
? 多元回归
? 如果自变量x是多个,如 x1,x2,… , xk,而因变量是一个 y,这种研究因变 量y与多个自变量 x之间的定量关系的问 题称为多元回归。
i
1 2 3 4 5 6 7 8 9 10
水中 含量(x) 4.6 5.1 4.8 4.4 5.9 4.7 5.1 5.2 4.9 5.1
鱼体 含量 (y) 17.4 18.6 17.9 18.3
19. 9
18.4
19.1 19.9
18. 7
18.9
解:经计算 x ? 4.98 , SS x ? 1.563 y ? 18.71 , SS y ? 5.669 SP ? 2.382
?
?2
? ?
?Q
? ?? ?b
?
?2
i i
?yi ? a ? bxi ?? 0 ?yi ? a ? bxi ?xi ? 0
整理得到
? 一元线性回归的正规方程组:
? ? ? a n ? b
? ?
? ? ? ?? a i xi
i
?
xi ?
i
b xi 2
i
yi ?
i
xi yi
? (二)一元线性回归的计算
况的比较。
[本章内容]
? 回归与相关的概念 ? 一元线性回归分析 ? 线性相关分析 ? 一元非线形回归(可直线化的曲线回归)
第一节 回归与相关的概念
? 【本节内容】 ? 回归与相关的概念 ? 两者的主要差别
一、回归与相关的概念
? 1、回归分析(Regression Analysis)
? 概念:是研究一个随机变量 y与另一些变 量(主要为固定变量)关系的一种统计方 法。
? 即:将一个变量 y表述为另一些变量的函 数,并通过建立变量间的函数关系,达到 根据一个或一些变量的取值去估计或预测 另一个变量的目的。
? 自变量与因变量
? 在某些问题中,y随x的变化而变化
? x带有“原因”的性质,称为“自变量” ? y带有“结果”的性质,称为“因变量”
? 有时x和y之间并无明显的因果关系
? 残差:
e i ? yi ? y?i
? 最小二乘法:使残差平方和(剩余平方和)
最小的一种确定a 和b 的方法。
使:
? ? Q ? ?yiy? ??i 2 ? ?yi ? a ? bx据微积分学中的极值原理,必须使Q 对a 和b的一阶偏导数为0:
? ?Q
? ?? ?a
第六章 回归与相关分析
Chapter 6 Regression and Correlation Analysis
[本章重点和难点]
? 理解并掌握回归与相关的区别与联系; ? 一元线性回归的基本原理、方法,线性回归的
显著性检验、区间估计和预测;
? 相关系数的定义、性质和显著性检验; ? 常用曲线方程的线性化方法及回归方程拟合情
? 计算3个二级数据:SSx , SSy , SP
? 计算参数的估计值a和b,并写出回归方程
?a ? y ? bx ??b ? SP SSx
y? ? a ? b x
? 作出资料的散点图和回归直线图
【例6.1】
? 为了研究特定条件下鱼类对水中某农药的 富集能力,搜集了10组有关数据如下 (μg/L和μg/kg),试建立二者间的一元线 性回归方程。
关系
变量,前者是后者的函数
变量类型 统计量
因变量:为随机变量
均为随机变量 自变量:为固定变量(为主) 或随机变量
无量纲的相关 系数
有单位的回归系数
第二节 一元线性回归分析
? 【本节内容】
? 一元线性回归的数学模型 ? 一元线性回归方程的建立 ? 线性回归的显著性检验 ? 线性回归的区间估计和预测
一、一元线性回归的数学模型
? 概念: 是研究随机变量之间“相关关系” 的一种统计方法。用于研究两个或数个 变量共同变化的程度,主要通过计算相 关系数来判断这种相关关系的强弱。
? 相关关系:是一种非确定性的关系,即一种随 机关系。按其形成的原因,可分为
? 直接相关(real correlation) ? 间接相关(nonsense correlation)
? 二元相关分析(简单相关分析) ? 研究两个变量间相关关系的方法。 ? 只介绍简单相关。
? 相关分析的研究目的
? 变量之间是否存在某种随机的共变关系 ? 各变量一起变化的程度 ? 相关分析不具备预测性
? 相关分析的变量类型与关系
? 所有变量都必须是随机变量 ? 没有自变量和因变量之分, x和y的地位一样 ? 分析侧重于随机变量之间的相关特征
? 回归分析的研究目的
? 变量之间存在怎样的函数关系 ? 能否通过这种关系,由 x的变化定量地解释或预
测y的变化
? 回归分析的变量类型
? 因变量y —— 随机变量 ? 自变量x —— 固定变量(为主)或随机变量
? 回归分析中x和y的关系
? 地位不平等 ? 关心的是y依x的变化规律
? 2、相关分析( Correlation Analysis)