第10章 简单回归与相关分析_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关系数
(计算公式)
样本相关系数的计算公式
r (xx)(yy) (xx)2(yy)2
或化简为 r
n x y xy
n x2 x2 ny2y2
10 - 18
统计学
STATISTICS
相关系数
(取值及其意义)
1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
正相关 负相关
10 - 10
正相关 负相关
统计学
STATISTICS
相关关系的描述与测度
(散点图)
10 - 11
统计学
STATISTICS
完全正线性相关
正线性相关
10 - 12
散点图
(scatter diagram)
完全负线性相关
负线性相关
非线性相关
不相关
统计学
STATISTICS
3. r = 0,不存在线性相关关系
4. -1r<0,为负相关 5. 0<r1,为正相关 6. |r|越趋于1表示关系越密切;|r|越趋于0表示关
统计学
STATISTICS
学习目标
1. 相关系数的分析方法 2. 一元线性回归的基本原理和参数的最小
二乘估计
3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测
10 - 1
统计学
STATISTICS
子代与父代一样吗?
➢ Galton被誉为现代回归和相关技术的创始人。1875年, Galton利用豌豆实验来确定尺寸的遗传规律。他挑选了7组 不同尺寸的豌豆,并说服他在英国不同地区的朋友每一组 种植10粒种子,最后把原始的豌豆种子(父代)与新长的豌 豆种子(子代)进行尺寸比较
相关系数
(correlation coefficient)
1. 对变量之间关系密切程度的度量 2. 对两个变量之间线性相关程度的度量称为
简单相关系数 3. 若相关系数是根据总体全部数据计算的,
称为总体相关系数,记为
4. 若是根据样本数据计算的,则称为样本相 关系数,记为 r
10 - 17
统计学
STATISTICS
统计学
STATISTICS
相关关系
(correlation)
1. 变量间关系不能用函数关
系精确表达(不确定的数 y
量关系)
2. 一个变量的取值不能由另 一个变量唯一确定
3. 当变量 x 取某个值时,变
百度文库
量 y 的取值可能有几个
x
4. 各观测点分布在直线周围
10 - 6
统计学
STATISTICS
➢ 如果把父代和子代看作两个变量,找出这两个变量的关系 ,并根据这种关系建立适当的数学模型,就可以根据父代 的数值预测子代的取值,这就是经典的回归方法要解决的 问题。学完本章的内容你会对回归问题有更深入的理解
10 - 3
统计学
STATISTICS
10 - 4
统计学
STATISTICS
10 - 5
对两个变量之间线性关系的描述与 度量,它要解决的问题包括
▪ 变量之间是否存在关系? ▪ 如果存在关系,它们之间是什么样的关系? ▪ 变量之间的强度如何? ▪ 样本所反映的变量之间的关系能否代表总体
变量之间的关系?
10 - 9
统计学
STATISTICS
相关关系
(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
相关关系
(几个例子)
相关关系的例子
▪ 父亲身高y与子女身高x之间的关系 ▪ 收入水平y与受教育程度x之间的关系 ▪ 粮食亩产量y与施肥量x1 、降雨量x2 、温度
x3之间的关系 ▪ 商品的消费量y与居民收入x之间的关系 ▪ 商品销售额y与广告费支出x之间的关系
10 - 7
统计学
STATISTICS
➢ 当结果被绘制出来之后,他发现并非每一个子代都与父代 一样,不同的是,尺寸小的豌豆会得到更大的子代,而尺 寸大的豌豆却得到较小的子代。Galton把这一现象叫做“ 返祖”(趋向于祖先的某种平均类型),后来又称之为“向平 均回归”。一个总体中在某一时期具有某一极端特征(低于 或高于总体均值)的个体在未来的某一时期将减弱它的极端 性(或者是单个个体或者是整个子代),这一趋势现在被称作 “回归效应”。人们发现它的应用很广,而不仅限于从一 代到下一代豌豆大小问题
10 - 13
统计学
STATISTICS
散点图
(例题分析)
10 - 14
统计学
STATISTICS
散点图
(例题分析)
不良贷款
14
12
10
8
6
4
2
0
0
100
200
300
400
贷款余额 不良贷款与贷款余额的散点图
14 12
不良贷款
10 8 6 4
2
0 0
10 - 15
10
20
30
40
贷款项目个数
不良贷款与贷款项目个数的散点图
散点图
(例题分析)
【例】一家大型商业银行在多个地区设有分行, 其业务主要是进行基础设施建设、国家重点项 目建设、固定资产投资等项目的贷款。近年来 ,该银行的贷款额平稳增长,但不良贷款额也 有较大比例的增长,这给银行业务的发展带来 较大压力。为弄清楚不良贷款形成的原因,希 望利用银行业务的有关数据做些定量分析,以 便找出控制不良贷款的办法。下面是该银行所 属的25家分行2002年的有关业务数据
不良贷款
不 良贷 款
14
12
10
8
6
4
2
0 0
10
20
30
累计应收贷款
不良贷款与累计应收贷款的散点图
14 12 10
8 6 4 2 0
0
50
100
150
200
固定资产投资额
不良贷款与固定资产投资额的散点图
统计学
STATISTICS
相关关系的描述与测度
(相关系数)
10 - 16
统计学
STATISTICS
相关关系
(特点)
▪ 一个变量的取值不能由另一个变量唯一确 定,当变量x取某个值时,变量y的取值可能 有几个。
▪ 无法用函数关系描述变量的不确定关系
▪ 有规律可循,便两间存在一定 客观规律
▪ 相关与回归分析正是描述与探索这类变量 之间关系及其规律的统计方法。
10 - 8
统计学
STATISTICS
相关分析
10 - 2
统计学
STATISTICS
子代与父代一样吗?
➢ 正如Galton进一步发现的那样,平均来说,非常矮小的父 辈倾向于有偏高的子代;而非常高大的父辈则倾向于有偏 矮的子代。在第一次考试中成绩最差的那些学生在第二次 考试中倾向于有更好的成绩(比较接近所有学生的平均成绩) ,而第一次考试中成绩最好的那些学生在第二次考试中则 倾向于有较差的成绩(同样比较接近所有学生的平均成绩)。 同样,平均来说,第一年利润最低的公司第二年不会最差 ,而第一年利润最高的公司第二年则不会是最好的