相关分析与回归分析.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( X i X )2 (Yi Y )2
式中,Cov( X ,Y ) 是变量X与变量Y的协方差。
第一节 相关分析
3. 相关系数及其计算方法
(2) 相关系数的特点 a. r的取值介于-1到1之间; b. 当r=0时,X与Y的样本观测值之间没有线性关系; c. 在大多数情况下,0 r 1 。r>0,说明X与Y正相 关;r<0,说明X与Y负相关。r值越接近1,X与Y的 相关程度越高。 微弱相关: 0 r 0.3 低度相关: 0.3 r 0.5 显著相关: 0.5 r 0.8 高度相关: 0.8 r 1
1.函数关系
即对两个变量X,Y来说,当X值 确定后,Y值按照一定的规律唯一确定, 即形成一种精确的关系。
式中,n 是样本容量,k是剔除了的变量数,r 是偏相关 系数。
第二节 一元线性回归分析
1. 相关分析与回归分析的关系
(1) 相关分析通过计算相关系数来确定两个变量之间的 相关方向和密切程度,回归分析则是选择一个合适的数学 模型,对具有相关关系的两个或多个变量之间的具体数量 关系进行测定,以实现对因变量的估计或预测。
t r n 2 , 服从 t(n 2)分布
1 r2 式子中,n是样本容量,r是简单相关系数(Pearson)。
设定假设: H0: r=0, H1: r≠0 这是一个双尾检验问题。
第一节 相关分析
4. 样本相关系数(Pearson)显著异于0的T检验
【例7-3】根据表7-3资料计算的相关系数,检验该公司广告费 和年销售收入之间的相关系数是否显著(设定显著水平α=0.05)? 解:第一步,提出假设:
2. 相关表和相关图
(2) 相关图 相关图又称散点图,是以直角坐标系的横轴代表变量x,
纵轴代表变量y,将两个变量相对应的成对数据用坐标点的 形式描绘出来,用于反映两变量之间的相关关系的图形。
销 售
35
收 30
入 ( 25
百 20 万 元 15 ) 10
30
40
50
60
70
80
90
100
广告费(万元)
第12章 相关分析与回归分析
第一节:相关分析 第二节:一元线性回归分析 第三节:多元线性回归分析*
第一节 相关分析
1. 相关关系的种类
(1) 按相关程度划分 完全相关: Y的变化完全由X的变化确定; 不相关: Y与X不相互影响,各自独立变化; 不完全相关:Y与X之间有一定程度的相互影响。
(2) 按相关方向划分 正相关: X与Y同时变大或变小; 负相关: X变大,Y变小 或 X变小,Y变大。
(2) 相关分析无需考虑变量作用顺序,回归分析则要考虑; (3)相关分析将变量都视为随机变量,回归分析则只将因 变量视为随机变量,自变量被认为是非随机的。
12.2 回归分析的基本概念
• 1 因变量(Y)与自变量(X)之间的关系
根据因变量与自变量之间的关系不同,可以分为两种类型: 函数关系
统计关系
因变量(Y)与自变量(X)之间的关系
第一节 相关分析
3. 相关系数及其计算方法
(1) 相关系数的定义 变量x与变量y之间的相关关系,可用数量指标来表示。
通常以字母 表示总体的相关系数,以 r 表示样本的相关
系数。定义如下:
Cov( X ,Y ) , r
( X i X )(Yi Y )
Var( X )Var(Y )
(1

r2 xz2
, z1
)
(1

r2 yz2
, z1
)
r , r , r 式中, xy,z1 xz2 ,z1 yz2 ,z1 是固定z1的偏相关系数。
第一节 相关分析
7. 偏相关系数显著异于0的T检验
偏相关系数显著异于0的 t 统计量如下:
t r n k 2 ,服从 t(n k 2) 分布 1 r2
(5) 按相关性质划分 真实相关: 两个变量确实存在内在的相关关系; 虚假相关: 两个变量只是表现为数量上相关,并不 存在内在的联系。
第一节 相关分析
2. 相关表和相关图
(1) 相关表 将某一变量按其数值的大小顺序排列,然后再将与
其相关的另一变量的对应值平行排列,便可得到相关表。
ห้องสมุดไป่ตู้
第一节 相关分析
此时的偏相关系数计算公式为:
rxy,z
rxy rxz ryz
(1

r2 xz
)
(1

r2 yz
)
式中,rxy , rxz , ryz 是普通样本相关系数。
6. 剔除两个变量Z1,Z2的影响后,X、Y的偏相关系数
此时的偏相关系数计算公式为:
r xy,z1z2
r r r xy,z1
xz2 , z1 yz2 , z1
r
1113092 637 202
0.9459
(11 41487 6372 ) (11 4182 2022 )
可见,广告费与销售收入间存在高度的相关关系。
第一节 相关分析
4. 样本相关系数(Pearson)显著异于0的T检验
在二维总体(X,Y)服从正态分布的前提下,Fisher给出了 检验简单相关系数(Pearson)显著异于0的 t 统计量如下:
(3) 按相关形式划分 线性相关: Y与X的关系呈现出线性关系; 非线性相关:Y与X的关系呈现出非线性关系。
第一节 相关分析
1. 相关关系的种类
(4) 按变量多少划分 单相关: 指两个变量间的相关关系; 复相关: 指三个以上变量间的相关关系; 偏相关: 指多个变量情形下,固定其他变量,只考 虑其中两个变量间的相关关系。
H0: 0; H1: 0
第二步,计算检验的统计量
t r n 2 0.945 11 2 8.746
1 r2
1 0.9452
第三步,统计决策。从下式中可以看出,相关系数显著。
t 8.746 t / 2 (n 2) 2.262
第一节 相关分析
5. 剔除了一个变量Z的影响后,X、Y的偏相关系数
第一节 相关分析
3. 相关系数及其计算方法
(3) 相关系数的计算
具体计算相关系数时,通常利用以下公式:
r
n X iYi X i Yi
[n
X2 i
(
X i )2 ][n
Y2 i

(
Yi ) 2 ]
【例7-2】基于表7-1中的数据,求广告费与年销售收入间的
相关系数。
相关文档
最新文档