第9章一元线性回归解读
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
的相关系数相等,即rxy= ryx
• 性质3:r数值大小与x和y原点及尺度无关,即改变x和y的
•
数据原点及计量尺度,并不改变r数值大小
• 性质4:仅仅是x与y之间线性关系的一个度量,它不能用
•
于描述非线性关系。这意为着, r=0只表示两个
•
变量之间不存在线性相关关系,并不说明变量之
•
间没有任何关系
完全正线性相关
正线性相关
2020-11-17
散点图
(scatter diagram)
完全负线性相关
负线性相关
非线性相关
不相关
用散点图描述变量间的关系
(例题分析)
• 【例9-1】为研究销售收入与广告费用支出之间的关系, 某医药管理部门随机抽取20家药品生产企业,得到它 们的年销售收入和广告费用支出(万元)的数据如下。 绘制散点图描述销售收入与广告费用之间的关系
2020-11-17
散点图
(销售收入和广告费用的散点图)
2020-11-17
9.1 变量间的关系 9.1.3 用相关系数度量关系强度
相关系数
(correlation coefficient)
1. 度量变量之间线性关系强度的一个统计量
– 若相关系数是根据总体全部数据计算的,称为总体
相关系数,记为
t r n 2 ~ t(n 2) 1 r2
– 用Excel中的【TDIST】函数得双尾计算P值,并于显 著性水平比较,并作出决策
• 若P<,拒绝H0
2020-11-17
相关系数的显著性检验
(例题分析)
• 【例9-3】检验销售收入与广告费用之间的相关系数
是否显著 (0.05) 1. 提出假设:H0: ;H1: 0
9.1 变量间的关系
9.1.1 变量间是什么样的关系? 9.1.2 用散点图描述相关关系 9.1.3 用相关系数度量关系强度
怎样分析变量间的关系?
建立回归模型时,首先需要弄清楚变量之 间的关系。分析变量之间的关系需要解决 下面的问题
变量之间是否存在关系? 如果存在,它们之间是什么样的关系? 变量之间的关系强度如何? 样本所反映的变量之间的关系能否代表总体
第 9 章 一元线性回归
9.1 变量间关系的度量 9.2 一元线性回归的估计和检验 9.3 利用回归方程进行预测 9.4 用残差检验模型的假定
回归分析研究什么?
假定因变量与自变量之间有某种关系,并把这种关系用 适当的数学模型表达出来,那么,就可以利用这一模型 根据给定的自变量来预测因变量,这就是回归要解决的 问题
收入水平相同的人,他们受教育的程度也不可能不同,而受 教育程度相同的人,他们的收入水平也往往不同。因为收入 水平虽然与受教育程度有关系,但它并不是决定收入的惟一 因素,还有职业、工作年限等诸多因素的影响
农作物的单位面积产量与降雨量之间的关系
在一定条件下,降雨量越多,单位面积产量就越高。但产量 并不是由降雨量一个因素决定的,还有施肥量、温度、管理 水平等其他许多因素的影响
2. 计算检验的统计量
t 0.9306 20 2 10.789 1 0.93062
变量之间的关系?
2020-11-17
9.1 变量间的关系
9.1.1 变量间是什么样的关系?
函数关系
1. 是一一对应的确定关系
2.
设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完
y
全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
– |r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
– r = 0,不存在线性相关关系
– -1r<0,为负相关 – 0<r1,为正相关 – |r|越趋于1表示关系越强;|r|越趋于0表示关
系越弱
2020-11-17
相关系数的性质
• 性质2:r具有对称性。即x与y之间的相关系数和y与x之间
• 性质5:r虽然是两个变量之间线性关系的一个度量,却不
•
一定意味着x与y一定有因果关系
2020-11-17
相关系数的经验解释
1. |r|0.8时,可视为两个变量之间高度相 关
2. 0.5|r|<0.8时,可视为中度相关 3. 0.3|r|<0.5时,视为低度相关 4. |r|<0.3时,说明两个变量之间的相关程度
2020-11-17
Leabharlann Baidu
相关关系
(correlation)
1. 一 个 变 量 的 取 值 不 能
由另一个变量唯一确
定
y
2. 当变量 x 取某个值时, 变量 y 的取值对应着 一个分布
3. 各 观 测 点 分 布 在 直 线 周围
x
2020-11-17
9.1 变量间的关系
9.1.2 用散点图描述相关关系
在回归分析中,只涉及一个自变量时称为一元回归,涉 及多个自变量时则称为多元回归。如果因变量与自变量 之间是线性关系,则称为线性回归(linear regression);如 果因变量与自变量之间是非线性关系则称为非线性回归 (nonlinear regression)
2020-11-17
第 9 章 一元线性回归
极弱,可视为不相关 5. 上述解释必须建立在对相关系数的显著性
进行检验的基础之上
2020-11-17
相关系数的显著性检验
(检验的步骤)
1. 检验两个变量之间是否存在线性相关关系 2. 采用R.A.Fisher提出的 t 检验 3. 检验的步骤为
– 提出假设:H0: ;H1: 0
– 计算检验的统计量
– 若是根据样本数据计算的,则称为样本相关系数, 简称为相关系数,记为 r
也称为Pearson相关系数 (Pearson’s correlation coefficient)
2. 样本相关系数的计算公式
r (x x)( y y) (x x)2 (y y)2
相关系数的性质
• 性质1:r 的取值范围是 [-1,1]
3. 各观测点落在一条线上
x
2020-11-17
相关关系
(几个例子)
子女的身高与其父母身高的关系
从遗传学角度看,父母身高较高时,其子女的身高一般也比 较高。但实际情况并不完全是这样,因为子女的身高并不完 全是由父母身高一个因素所决定的,还有其他许多因素的影 响
一个人的收入水平同他受教育程度的关系