第七章相关分析与回归分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析所研究的两个变量不是对等关 系,必须根据研究目的确定其中的自变 量和因变量
(2)对于变量x与y来说,相关分析只 能计算出一个反映变量间相关密切程度 的相关系数,计算中改变x与y的地位对 结果无影响;回归分析可以根据研究目
(3)相关分析对资料的要求是,两变 量都是随机的,或者其中一个是随机的 ;
(2)将变量离差标准化,使相关系数 的绝对值不超过1,即|r|≤1
r
n xy x y
Fra Baidu bibliotek
n x2 ( x)2 n y2 ( y)2
表7-4
序号
销售额(万元 )x
利润率(% )y
x2
y2
xy
1
60
12.6 3600 158.76 756
2
50
10.4 2500 108.16 520
3
80
18.5 6400 342.25 1480
合计
500
110.8
2940 1465.0 00
6549
第三节 回归分析与一元线性回 归
(一)回归分析的概念与相关分析的关 系
1.概念
回归分析是在相关分析的基础上,考察 变量之间的数量变化规律,并通过一定 的数学表达式描述它们之间的关系,进 而确定一个或几个变量的变化对另一个 特定变量的影响程度
yˆ a bx
(二)拟合条件
1.两变量间确实存在显著的相关关系:
通过计算两者之间的相关系数值,看是否达到 显著相关要求
2.两变量间确实存在着直线相关关系:
散点图,看是否近似于直线
3.应根据最小平方法(最小二乘法)的原理拟 合一元线性方程:实际值和理论值的离差的代 数和等于零,说明回归直线上所有的理论值是 所有实际值的平均值;实际值和理论值的离差 的平方和最小,说明所拟合的回归直线与各相 关点的距离比任何其他直线与相关点的距离都 小。
1.根据相关关系的方向划分,相关关系 可分为正相关和负相关
2.根据自变量的多少划分,相关关系可 分为单相关和复相关
3.根据相关的形式不同划分,可分为线 性相关和非线性相关
4.根据相关关系的程度划分,可分为不 相关、完全相关和不完全相关
三、相关分析的主要内容
1.确定现象之间有无关系 2.确定相关关系的表现形式 3.测定相关关系的密切程度和
回归分析对资料的要求是,自变量是可 以控制的变量(给定的变量),因变量 的随机变量
2.联系 (1)相关分析是回归分析的基础和前
提 (2)回归分析是相关分析的深入和继

二、一元线性回归模型 (一)概念 一元线性回归模型是根据两个变量的成
对数据,配合直线方程式,再根据自变 量的变动值,来推算因变量的估计值的 一种统计分析方法。
0.5~0.8:显著相关
0.8以上:高度相关
(二)相关系数的计算
r
2 xy
x y
(x x)(y y) / n
(x x)2 / n (y y)2 / n
1.协方差的作用
(1)显示x与y是正相关还是负相关
(2)显示x与y的相关程度大小
2.标准差的作用
(1)协方差是名数,不同现象的变异 情况不同,相关程度不能直接加以比较 。标准化结果使协方差化为不名数,相 关系数可以比较不同现象相关程度的高 低
方向
第二节 相关关系的判断
定性分析:对事物的质的规定性的认识 和分析。
一、表格法
表格法是根据两个相关变量,即自变量 X与因变量Y的对应关系的数值编制而成 的数据表,一般称为相关表。通过相关 表可以初步看出个变量之间的相关关系 ,同时相关表还是绘制相关图和计算相 关系数的基础
(一)简单相关表
设:Q(ˆ0, ˆ1) ei2
min Q min ei2 (Yi ˆ0 ˆ1Xi )2
偏导数为0,极值存在。
20
推导: min Q min ei2 (Yi ˆ0 ˆ1Xi )2
nˆ0 ˆ1 Xi Yi ˆ0 Xi ˆ1 Xi2 XiYi
(三)待定参数的确定方法
样本回归模型:
移项整理:
e Y ˆ ˆ X Y Yˆ i 1,2, Yi ˆ0 ˆ1Xi ei i 1,2, (2.3) i i 0 1i i i
普通最小二乘法确定ˆ0和ˆ1的原则
是使残差平方和 ei2最小。
19
推导:
ei Yi ˆ0 ˆ1Xi Yi Yˆi i 1,2,
第七章 相关分析与回归分析
第一节 相关分析的意义和种 类
一、相关关系的概念和特点
函数关系是指现象间存在的严格依存的 、确定的关系
相关关系是指客观现象之间存在的非确 定的相互依存关系
相关关系的特点:
1.现象之间确实存在着数量上的依存关 系
2.现象之间数量上的关系不是确定的
二、相关关系的种类
4
10
3.0 100 9.00 30
5
40
8.1 1600 65.61 324
6
70
16.3 4900 265.69 1141
7
60
12.3 3600 151.29 738
8
30
6.2 900 38.44 186
9
30
6.6 900 43.56 198
10
70
16.8 4900 282.24 1176
编制方法是:先将自变量的值按照从小 到大的顺序排列出来,然后将因变量的 值对应列上而编排成的表格
(二)分组相关表
1.单变量分组表:依据自变量分组,并 列出其出现的次数和因变量变量值的统 计表。
2.双变量分组表:对两种有关变量都分 组,交叉排列,并列出其各组间的共同 次数。
二、图示法 以横轴表示自变量,纵轴表示因变量
,标出每对变量值的坐标点(散布点) 强正(负)相关 弱正(负)相关 非线性相关 不相关
三、相关系数
(一)意义
相关系数是在直线相关条件下,说明两 个现象之间相关关系密切程度的统计分 析指标。通常用r表示。
-1≤r≤1
|r|在0.3以下:无直线相关
以上:有直线相关
0.3~0.5:低度直线相关
相关分析旨在测度变量之间的密切程度 ,它所使用的测度工具就是相关系数;
而回归分析侧重于考察变量之间的数量 变化规律,其所使用的数学工具就是配 合回归模型。
回归分析可分为 线性回归分析(一元、二元、多元) 非线性回归分析
(二)与相关分析的区别与联系
1.区别
(1)两变量之间的关系
相关分析所研究的两个变量是对等关系 ;
相关文档
最新文档