第十讲 相关分析与回归分析_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
400 500 600 700 800 900 1000 1100 1200
工资性现金支出(万元)
例2
企业按销售额分组 (万元) 4以下 4~ 8 8 ~ 12
12 ~ 16 16 ~ 20 20 ~ 24 24 ~ 28 28 ~ 32 32 ~ 36
流通费用率 (%) 9.65 7.68 7.25 7.00 6.86 6.73 6.64 6.60 6.58
(yi
y)2
x2
Baidu Nhomakorabea
x n
2
y2
y n
2
i1
i1
n xy x y
n x2 x2 n y2 y2
叫做变量y与x之间的样本相关系数,简称相关系 数,用它来衡量两个变量之间的线性相关程度。
(二)斯皮尔曼等级相关系数
斯皮尔曼等级相关系数
斯皮尔曼等级相关系数
斯皮尔曼等级相关系数
偏相关系数
设有三个变量 x1,x2,x,3 如果在这三个变量中,剔除
年份
1996 1997 1998 1999 2000 2001 2002 2003
工资性 现金支出 (万元)x
500 540 620 730 900 970 1050 1170
城镇储蓄 存款余额 (万元)y
120 140 150 200 280 350 450 510
城镇储蓄存款余额 (万元)
550 500 450 400 350 300 250 200 150 100 50
相关图,也称散布图(或散点图)。
例1 某市1996年 — 2003年的工资性现金支出与城镇储蓄存款余额的资料, 说明简单相关表和相关图的编制方法。 从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显 的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。
序号
1 2 3 4 5 6 7 8
(二)按相关的形式不同可以分为直线 相关和非直线相关
(三)直线相关按其变化的方向不同可 以分为正相关和负相关
(四)按相关的程度可分为完全相关、 不完全相关和不相关
种类1 按变量多少划分
单相关:一个变量对另一个变量的相关关系, 称为单相关。
复相关:当所研究的是一个变量对两个或两个 以上其他变量的相关关系时,称为复相关。如某种 商品的需求与其价格水平及人们收入水平之间的相 关关系就是一种复相关。
流通费用率(%)
10 9.5
9 8.5
8 7.5
7 6.5
6
0 4 8 12 16 20 24 28 32 36
销售额(万元)
相关系数
相关系数是在直线相关条件下,表明两
个现象之间相关关系的方向和密切程度的综 合性指标。一般用符号r表示。
极端值
一般值
注意事项
①r值很小,说明X与Y之间没有线性相 关关系,但并不意味着X与Y之间没有 其它关系,如很强的非线性关系。
种类4
按相关程度划分
完全相关:当一种现象的数量变化完全由 另一个现象的数量变化所确定时,这两种现象 间的关系为完全相关。即函数关系。
不完全相关:两个现象之间的关系介于完 全相关和不相关之间,称为不完全相关。
不相关:当两个现象彼此互不影响,其数 量变化各自独立时,称为不相关。如:股票价 格的高低与气温的高低是不相关的。
i 1
i 1
i1
n
L x yx iy i n x y 7 8 5 4 1 1 0 1 7 2 .5 4 5 .4 2 2 6
i 1
n
Lxx
xi2nx229852510172.52962.5
i1
n
Lyy
yi2ny2206901045.4278.4
i1
再计算r的值:
r lxy 226 0.8227 lxxlyy 962.578.4
相关表和相关图
简 单 相 关 表 — 根 据 总 体 单 位 的 原 始 资 料 汇 编 的 相 关 表 分 组 相 关 表 — 将 原 始 资 料 进 行 分 组 而 编 制 的 相 关 表
单 变 量 分 组 表 — 按 自 变 量 分 组 双 变 量 分 组 表 — 按 自 变 量 和 因 变 量 均 分 组
相关关系
当一个或几个相互联系的变量取一定数 值时,与之相对应的另一变量的值虽然不确 定,但它仍按某种规律在一定的范围内变化, 变量间的这种相互关系,称为具有不确定性 的相关关系。
如:劳动生产率与工资水平的关系、投 资额与国民收入的关系。
相关关系经常用一定的函数形式去近似 地描述。
相关关系的种类
(一)按相关关系涉及因素的多少可以 分为单相关和复相关
②相关关系不等同于因果关系。只是表 明这两者或者多者之间相关或者关于某 种因素相关,并不等同于因果关系。
(一)皮尔逊(pearson) 相关系数
也被称为简单相关系数,是因果统计学家皮尔逊 提出的,对于变量y与x的一组观测值,把
n
(xi x)(yi y)
r
i1
r=
xy
x
n
y
n
=
(xi
x)2
n
1)判断现象之间有无相关关系存在及呈现的形态。(相关
表和相关图)
2)确定相关关系的密切程度。(计算相关系数)
3)对具有相关关系的变量建立数学模型并求解方程参数。
4)进行相关性检验。
例:现有10名20岁男青年身高x与前臂长y的数据如 下表所示:
(1)画出身高x与前臂长y的散点图。 (2)计算相关系数。 (3)对x与y的线性相关性进行显著性检验
( =0.05)。
解:(1)以身高x为 横坐标,前臂长y 为纵坐标,在直角 坐标系中画出成对 观测数据对应的点 (xi , yi)(i=1 , 2,…,10),即可 得到所求的散点图。
(2)
x
1 n
n i1
xi
172.5
y1 n
n i1
yi
45.4
n
n
n
xi22 9 8 5 2 5
yi22 0 6 9 0 xi yi 785411
x x 3的影响,可计算 1 x 2 对 x偏3 相关系数,记作
r12,3,其计算公式为:
r1,3 2
r r r x 1 x2
x3x3 x2x3
1(rx 1 x3)2 1(rx2x3)2
相关分析的步骤
一方面:研究变量之间关系的密 切程度。[相关分析(狭义)]
相关分析(广义)
步骤:
另一方面:研究自变量和因变量 之间的变动关系,用数学方程式 来表达。(称为回归分析)
(3)应检验H0:ρ=0,H1:ρ≠0 由前面计算得:样本相关系数r=0.8227
对给定的 =0.05,自由度 n28
由附表10查得临界值
工资性现金支出(万元)
例2
企业按销售额分组 (万元) 4以下 4~ 8 8 ~ 12
12 ~ 16 16 ~ 20 20 ~ 24 24 ~ 28 28 ~ 32 32 ~ 36
流通费用率 (%) 9.65 7.68 7.25 7.00 6.86 6.73 6.64 6.60 6.58
(yi
y)2
x2
Baidu Nhomakorabea
x n
2
y2
y n
2
i1
i1
n xy x y
n x2 x2 n y2 y2
叫做变量y与x之间的样本相关系数,简称相关系 数,用它来衡量两个变量之间的线性相关程度。
(二)斯皮尔曼等级相关系数
斯皮尔曼等级相关系数
斯皮尔曼等级相关系数
斯皮尔曼等级相关系数
偏相关系数
设有三个变量 x1,x2,x,3 如果在这三个变量中,剔除
年份
1996 1997 1998 1999 2000 2001 2002 2003
工资性 现金支出 (万元)x
500 540 620 730 900 970 1050 1170
城镇储蓄 存款余额 (万元)y
120 140 150 200 280 350 450 510
城镇储蓄存款余额 (万元)
550 500 450 400 350 300 250 200 150 100 50
相关图,也称散布图(或散点图)。
例1 某市1996年 — 2003年的工资性现金支出与城镇储蓄存款余额的资料, 说明简单相关表和相关图的编制方法。 从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显 的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。
序号
1 2 3 4 5 6 7 8
(二)按相关的形式不同可以分为直线 相关和非直线相关
(三)直线相关按其变化的方向不同可 以分为正相关和负相关
(四)按相关的程度可分为完全相关、 不完全相关和不相关
种类1 按变量多少划分
单相关:一个变量对另一个变量的相关关系, 称为单相关。
复相关:当所研究的是一个变量对两个或两个 以上其他变量的相关关系时,称为复相关。如某种 商品的需求与其价格水平及人们收入水平之间的相 关关系就是一种复相关。
流通费用率(%)
10 9.5
9 8.5
8 7.5
7 6.5
6
0 4 8 12 16 20 24 28 32 36
销售额(万元)
相关系数
相关系数是在直线相关条件下,表明两
个现象之间相关关系的方向和密切程度的综 合性指标。一般用符号r表示。
极端值
一般值
注意事项
①r值很小,说明X与Y之间没有线性相 关关系,但并不意味着X与Y之间没有 其它关系,如很强的非线性关系。
种类4
按相关程度划分
完全相关:当一种现象的数量变化完全由 另一个现象的数量变化所确定时,这两种现象 间的关系为完全相关。即函数关系。
不完全相关:两个现象之间的关系介于完 全相关和不相关之间,称为不完全相关。
不相关:当两个现象彼此互不影响,其数 量变化各自独立时,称为不相关。如:股票价 格的高低与气温的高低是不相关的。
i 1
i 1
i1
n
L x yx iy i n x y 7 8 5 4 1 1 0 1 7 2 .5 4 5 .4 2 2 6
i 1
n
Lxx
xi2nx229852510172.52962.5
i1
n
Lyy
yi2ny2206901045.4278.4
i1
再计算r的值:
r lxy 226 0.8227 lxxlyy 962.578.4
相关表和相关图
简 单 相 关 表 — 根 据 总 体 单 位 的 原 始 资 料 汇 编 的 相 关 表 分 组 相 关 表 — 将 原 始 资 料 进 行 分 组 而 编 制 的 相 关 表
单 变 量 分 组 表 — 按 自 变 量 分 组 双 变 量 分 组 表 — 按 自 变 量 和 因 变 量 均 分 组
相关关系
当一个或几个相互联系的变量取一定数 值时,与之相对应的另一变量的值虽然不确 定,但它仍按某种规律在一定的范围内变化, 变量间的这种相互关系,称为具有不确定性 的相关关系。
如:劳动生产率与工资水平的关系、投 资额与国民收入的关系。
相关关系经常用一定的函数形式去近似 地描述。
相关关系的种类
(一)按相关关系涉及因素的多少可以 分为单相关和复相关
②相关关系不等同于因果关系。只是表 明这两者或者多者之间相关或者关于某 种因素相关,并不等同于因果关系。
(一)皮尔逊(pearson) 相关系数
也被称为简单相关系数,是因果统计学家皮尔逊 提出的,对于变量y与x的一组观测值,把
n
(xi x)(yi y)
r
i1
r=
xy
x
n
y
n
=
(xi
x)2
n
1)判断现象之间有无相关关系存在及呈现的形态。(相关
表和相关图)
2)确定相关关系的密切程度。(计算相关系数)
3)对具有相关关系的变量建立数学模型并求解方程参数。
4)进行相关性检验。
例:现有10名20岁男青年身高x与前臂长y的数据如 下表所示:
(1)画出身高x与前臂长y的散点图。 (2)计算相关系数。 (3)对x与y的线性相关性进行显著性检验
( =0.05)。
解:(1)以身高x为 横坐标,前臂长y 为纵坐标,在直角 坐标系中画出成对 观测数据对应的点 (xi , yi)(i=1 , 2,…,10),即可 得到所求的散点图。
(2)
x
1 n
n i1
xi
172.5
y1 n
n i1
yi
45.4
n
n
n
xi22 9 8 5 2 5
yi22 0 6 9 0 xi yi 785411
x x 3的影响,可计算 1 x 2 对 x偏3 相关系数,记作
r12,3,其计算公式为:
r1,3 2
r r r x 1 x2
x3x3 x2x3
1(rx 1 x3)2 1(rx2x3)2
相关分析的步骤
一方面:研究变量之间关系的密 切程度。[相关分析(狭义)]
相关分析(广义)
步骤:
另一方面:研究自变量和因变量 之间的变动关系,用数学方程式 来表达。(称为回归分析)
(3)应检验H0:ρ=0,H1:ρ≠0 由前面计算得:样本相关系数r=0.8227
对给定的 =0.05,自由度 n28
由附表10查得临界值