相关与一元线性回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
65
为负
为正
60
y
55 Ⅲ (x x)( y y) Ⅱ (x x)( y y)
50
为正
为负
体重(Y)
45
40 155
协方差为正值时,表示正线性相关关系。
160
165
170
175
180
14
相关系数——协方差
10名学生的身高与体重散点图
75 70
x
xy
(xi x )( yi y )
系越不密切
22
相关系数(取值及其意义)
完全负相关
无线性相关
完全正相关
协方差接近于零时,表示很 小,没有线性相关关系。
协方差为大的负值时,表 示强的负线性相关关系。
协方差
xy
(xi x )( yi y )
N
18
相关系数——协方差
cm kg
xy
(xi x )( yi y )
N
大
mm kg
于
xy
(xi x )( yi y )
N
基本结论:协方差受计量单位影响,从而不能真实
反映相关的程度。
19
相关系数——协方差
相关系数(correlation coefficient):协方差与 两变量标准差乘积的比值,是没有量纲的、标 准化的协方差。
xy x y
总体相关系数
r Sxy SxSy
样本相关系数
20
相关系数 (计算公式)
样本相关系数的计算公式
r
n xy x y
依赖于x,当变量x 取某个 数值时,y依确定的关系取 相应的值,则称y是 x的函 数,记为y =f(x),其中x称
为自变量,y称为因变量
3. 各观测点落在一条线上
x
3
函数关系(几个例子)
函数关系的例子
▪ 某种商品的销售额(y)与销售量(x)之间的关系 可表示为 y = px (p 为单价)
▪ 圆 的 面 积 (S) 与 半 径 之 间 的 关 系 可 表 示 为
S=R2 ▪ 企业的原材料消耗额(y)与产量(x1)、单位产量
消耗(x2)、原材料价格(x3)之间的关系可表示 为y = x1 x2 x3
4
相关关系(correlation)
1. 变量间关系不能用函数关
系精确表达
2. 一个变量的取值不能由另 一个变量唯一确定
3. 当变量 x 取某个值时,变 量 y 的取值可能有几个
系数,记为
4. 若是根据样本数据计算的,则称为样本相关系数,记为
r
12
相关系数 (计算公式)
样本相关系数的计算公式
r
n xy x y
n x2 x2 n y2 y2
13
相关系数——协方差
10名学生的身高与体重散点图
75
x
xy
(xi x )( yi y )
N
70 Ⅳ (x x)( y y) Ⅰ(x x)( y y)
学习内容
1.相关系数的分析方法
2. 线性回归的基本原理和参数的最小二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测
1
8.1 变量间关系的度量
一. 变量间的关系 二. 相关关系的描述与测度
2
一. 变量间的关系函数关系
1. 是一一对应的确定关系
2. 设有两个变量x和y,变量y y 随变量x一起变化,并完全
6
相关关系(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
正相关 负相关
正相关 负相关
7
散点图(scatter diagram)
完全正线性相关
正线性相关
完全负线性相关
负线性相关
非线性相关
不相关
8
散点图(例题分析)
【例】一家大型商业银行在多个地区设有分行,其业 务主要是进行基础设施建设、国家重点项目建设、固 定资产投资等项目的贷款。近年来,该银行的贷款额 平稳增长,但不良贷款额也有较大比例的增加,这给 银行业务的发展带来较大压力。为弄清楚不良贷款形 成的原因,希望利用银行业务的有关数据做些定量分 析,以便找出控制不良贷款的办法。下面是该银行所 属的25家分行2002年的有关业务数据
n x2 x2 n y2 y2
21
相关系数(取值及其意义)
1. r 的取值范围是 [-1,1] 2. |r|=1,为完全相关
r =1,为完全正相关 r = -1,为完全负相关 3. r = 0,不存在线性相关关系相关 4. -1r<0,为负相关 5. 0<r1,为正相关 6. |r|越趋于1表示关系越密切;|r|越趋于0表示关
贷款余额 不良贷款与贷款余额的散点图
14
12
10
8
6
4
2
0 0
20
40
贷款项目个数
不良贷款与贷款项目个数 的散点图
11
不良贷款
相关系数(correlation coefficient)
1. 对变量之间关系密切程度的度量 2. 对两个变量之间线性相关程度的度量称为简单相关系数 3. 若相关系数是根据总体全部数据计算的,称为总体相关
160
165
170
175
180
成绩(X)
16
相关系数——协方差
协方差(covariance):两个变量与其均值离差乘积 的平均数,是相互关系的一种度量。
总体协方差:
xy
(xi x )( yi y )
N
样本协方差:
Sxy
(xi x)( yi y) n 1
17
相关系数——协方差
协方差为大的正值时,表 示强的正线性相关关系。
y
4. 各观测点分布在直线周围
x
5
相关关系(几个例子)
相关关系的例子
▪ 父亲身高(y)与子女身高(x)之间的关系 ▪ 收入水平(y)与受教育程度(x)之间的关系 ▪ 粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度
(x3)之间的关系 ▪ 商品的消费量(y)与居民收入(x)之间的关系 ▪ 商品销售额(y)与广告费支出(x)之间的关系
9
散点图(例题分析)
10
散点图(例题分析)
不良贷款
14
12
10
8wenku.baidu.com
6
4
2
0
0
50
100
150
200
固定资产投资额
不良贷款与固定资产投资额
的散点图
14
12
10
8
6
4
2
0
0
5
10
15
20
25
30
不良贷款与累计应收贷款 累计应收贷款
的散点图
不良贷款
不良贷款
14
12
10
8
6
4
2
0
0
100
200
300
400
N
疾病暴发率(Y)
65
60
y
55
50
45
协方差为负值时,表示负线性相关关系。
40
155
160
165
170
175
180
支出(X)
15
体重(Y)
75 70 65 60 55 50 45 40
155
相关系数——协方差
x
xy
(xi x )( yi y )
N
y
协方差接近于零时,表示很小,
没有线性相关关系。