经济统计学第8章相关与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
3
15
2
3
17
3
5
25
4
6
28
5
6
30
6
7
36
7
8
37
8
9
42
9
9
40
10
10
45
销售额 50
相关图
40
30
20
10
客流量
2 4 6 8 10 12
计算相关系数r=0.9918
利用最小二乘法求解参数a,b
a Y bX 4.081
b n xY xY n x2 ( x)2
现代回归的涵义:
研究一个应变量(因变量,被解释变量) 对一个或多个其它变量(自变量,解释 变量)的依存关系,其目的在于根据已 知的解释变量之值来估计和预测因变量 的总体均值。即已知父亲身高的条件下, 儿子们平均身高是怎样变动的。
家庭收入x和家庭消费支出y的关系
X 300 400 500 600 700 Y
第八章 相关与回归分析
一、相关关系
社会经济现象普遍存在两种变量关系: (一) 函数关系
Y=f(x)→称为函数关系。它反映着现象 之间存在着严格的依存关系,也就是具 有确定性的对应关系,这种关系可用一 个数学表达式反映出来。
(二) 相关关系
相关关系是客观存在的非确定性的数量 对应关系。
分布,(即给定X条件下的平均数为0, 且对于每一个给定Xi,i的条件方差是某 个等于2的正常数)且相互之间独立。
条件3就是要求给定X条件下,变量Y同分 布,且不相互依赖。
支出 回归 直线
300 400 500 600 收入
某地区10个商业企业的客流量和销售额之间的资料 统计如下:
企业序号 客流量(万人)销售额(百万元)
简单线性相关分析的特点
通过对r的计算方法的讨论,可看出二个明显特点: 1. 相关关系中,两个变量不必定出哪个是自变 量,哪个是因变量,因此,相关的两个变量 都是随机变量; 2. 相关关系中只能计算出一个相关系数r。
四、一元直线回归分析
(一)、回归分析的涵义和特点
英国人口学家Galton首先提出了回归的 概念,即一定身高的父母所生的子女的 平均身高,有着朝整个总体平均身高移 动(或回归)的倾向,即回归到中等水 平。
Q a
2 (Y
a
bX)(1)
0
Q b
2 (Y
a
bX)(X)
0
a Y bX
b
n xY xY n x2 ( x)2
基本假设
1)变量X,Y之间存在“真实的” 线性关系。 2)变量X为非随机变量。 3)随机项i(i=1,2….n),服从N(0,2)
销售额 50
相关图
40
30
20
10
客流量
2 4 6 8 10 12
三、直线相关关系的测定
(一)、相关系数
基本公式:
(一)积差法:
r
2 xy
x ቤተ መጻሕፍቲ ባይዱ
y
2 xy
1 n
(x
x)(
y
y)
x
1 n
(
x
x
)2
y
1 n
(
y
y)2
r (x x)( y y) ( x x)2 ( y y)2
支出
A 256 296 346 396 416
400 B 260 300 350 400 420 350
300 C 260 300 350 400 420 260
D 264 304 354 404 424
均 260 300 350 400 420 值
300 400 500 600 700 收入
相关与回归分析
Y=f(x)+ε; ε被称为随机(因素)扰 动项,或残差。
它反映着现象之间的数量上不严格的依存关系,也就 是说两者之间不具有确定性的对应关系,这种关系有二个 明显特点:
1.相关关系是现象之间确实存在数量上的依存关系,即 某一社会经济现象变化要引起另一社会经济现象的变化; 2.现象之间的这种依存关系是不严格的,即无法用数学 公式表示。
相关分析是回归分析的基础和前提。 回归分析是相关分析的深入和继续。
1.相关分析中两个变量是对等关系,回归 分析中两个变量必须根据研究目的,确定 自变量和因变量;
2.相关分析只能反映变量间的相关密切 程度,回归分析可以计算出X、Y的具体相 关数值。
(二)、参数的最小二乘估计
高斯证明了在某些假定的条件下,利用 样本的变量数据,用最小二乘法(要求实 际值与趋势值的离差的平方为最小)得到 的总体回归参数的估计量是最优的。
4.1 5 4 4
相关与回归分析
编号 施肥量(公斤) 亩产量(公斤)
x
y
1
20
300
2
30
300
3
40
420
4
60
510
5
60
650
二、相关关系的种类
(一)按相关变量的多少划分 单相关、复相关 (二)按数学方程性质(形态)划分 直线相关:两个变量之间的变动关系在散点图
上呈直线趋势,可以用直线模型来表示。 y=a0+a1X1+…+apXp+ε 曲线相关:两个变量之间的变动关系在散点图
(二)相关系数简捷计算方法
r
n xy ( x)( y)
n x2 ( x)2 n y2 ( y)2
(二)相关系数的使用:
1、取值范围:|r|≤1, r < 0,负相关;r > 0,正相关。 2、密切程度判断: |r|=0,不相关(或非直线相关); |r|=1完全相关。 |r| < 0.3,弱相关; 0.3 ≤|r| < 0.5,低相关; 0.5≤|r|<0.8,显著相关; 0.8 ≤|r|<1, 高度相关 。
上呈曲线趋势,可以用曲线模型来表示。
(三)按变动方向划分 1、正相关:两种变量的相对应数值同时扩大
或缩小,其变动方向一致。 2、负相关:两种变量相对应的数值,此增彼
减,变动方向相反。 (四)按相关的程度划分 完全相关 不完全相关 无相关
相关关系的判定
一、相关表 二、相关图 三、相关系数
总体一元线 性模型
Y X
样本一元线 性模型
Y a bX e
最小二乘法
用最小二乘法得到的a、b称为、的最 小二乘估计,他们所确定的直线 称为Y对X的线性回归方程。
Yˆi a bXi
求a、b的方法(原理):
(Y Yˆ )2 Qmin (Y a bX)2 Qmin