计量经济学一元线性回归模型1PPT学习教案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学一元线性回归模型1
会计学
1
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、总体回归函数(PRF) 三、随机扰动项(随机干扰项) 四、样本回归函数(SRF)
第1页/共181页
2
一、变量间的关系及回归分析的基本概念
1. 变量间的关系 (1)确定性关系或函数关系:研究
的是确定现象非随机变量间的 (关2)系统计。依赖或相关关系:研究的是非
、温度(x3)之间的关系 ▪ 商品的消费量(y)与居民收入(x)之间的关系 ▪ 商品销售额(y)与广告费支出(x)之间的关系
第7页/共181页
8
相关关系(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
正相关 负相关
正相关 负相关
第8页/共181页
9
10
相关关系的描述与测度
(散点图)
第9页/共181页
确定现象随机变量间的关系。
第2页/共181页
3
函数关系
1. 是一一对应的确定关系
2. 设有两个变量 x 和 y ,
变量 y 随变量 x 一起变
化,并完全依赖于 x , y
当变量 x 取某个数值时,
y 依确定的关系取相应
的值,则称 y 是 x 的函
数,记为 y = f (x),其
中 x 称为自变量,y 称
45.6 154.9
5.0 49.7
26.9 5.7 7.6
9.2
32.4 6.1
X vs. Y 200
150 100
X
50
0
0
20
40
60
80 100
Y 第24页/共181页
25
验证:配第——克拉克法则
随着人均GDP的增加,或者 说随着一个国家经济的发展, 就业结构也会发生相应的变化, 第一产业中就业人数的比例会 下业以均我G降比D国P,例与改而 会第革一开第 上产放二 升业后和 。中某就一第业年三者为产比例例,业的计的相算就关人
17
相关系数(取值及其意义)
完全负相关
无线性相关
完全正相关
-1.0
-0.5
0
+0.5
+1.0
r
负相关程度增加
正相关程度增加
1. r 的取值范围是 [-1,1] 2. r =1,为完全正相关
r =-1,为完全负相关
r = 0,不存在线性相关关系
3. |r|越趋于1表示关系越密切;|r|越趋于0 表示关系越不密切
508
495
66
21
练习1
下表中的数据列出了某市2005年1-8月的月平均气温X和每 户平均啤酒消费量Y。
(1)画出散点图 (2)计算相关系数R
月1 2 3 4 5 6 7 8 份 X 5.5 6.6 8.1 15.8 19.5 22.4 28.3 28.9 Y 2.38 3.85 4.41 5.67 5.44 6.03 8.15 6.87
③相关关系关心两个变量间关系的紧密程度;回归分析感兴趣的 则是试图根据其他变量的设定值来估计或预测某一变量的平均 值。
第32页/共181页
33
回归分析构成计量经济学的方法论基础, 其主要内容包括:
(1)根据样本观察值对经济计 量模型参数进行估计,求得回 归方程;
(2)对回归方程、参数估计值 进行显著性检验;
系数,并解释其意义。(提示:利用不 同的城市的数据)
第25页/共181页
26
27
回归分析
第26页/共181页
相 关
“回归”一次的历 史渊源

献回Fra归nc这is 个Ga术lto语n在是1由9世英纪国末著期名研统究计孩学子家及
他们的父母的身高时提出来的。
孩子的身高会趋向平均发展。
当双亲的身高都很高(矮)时,他们的 孩子身高虽然会高(矮)于一般人,却 往往比父母亲矮(高)。
第5页/共181页
6
对变量间统计依赖关系的考察主要是通 过相关分析(correlation analysis)或回归分 析(regression analysis)来完成的
第6页/共181页
7
相关关系(几个例子)
相关关系的例子
▪ 父亲身高(y)与子女身高(x)之间的关系 ▪ 收入水平(y)与受教育程度(x)之间的关系 ▪ 粮食亩产量(y)与施肥量(x1) 、降雨量(x2)
4273
565
558
8
607
521
513
47
4428
525
521
28
2510
566
550
6
31878
495
511
45
3823
536
538
30
r= 0
3274
507
504
79
725
508
495
66
607
521
513
47
r = 0.6
4428
525
521
28
2510
566
550
6
31878
495
511
45
第11页/共181页
12
散点图(例题分析)
第12页/共181页
13
不良贷款
散点图(例题分析)
14
12
10
8
6
4
2
0
0
50
100
150
200
固定资产投资额
不良贷款与固定资产投资额
的散点图
不良贷款
14
12
10
8
6
4
2
0
0
100
200
300
400
贷款余额 不良贷款与贷款余额的散点图
14
14
12
12
10
第21页/共181页
22
练习
将某年21家企业的广告预算与这些企业产品的观看者每周 保留的印象次数相联系。
以印象数为纵轴、以广告支出为横轴画散点图。 你认为这两个变量之间的关系具有什么样的性质? 看一下你的图,你认为值得作广告吗?
第22页/共181页
23
序 企业 号
1
美乐
2
百事
3 联邦快递
第30页/共181页
31
回归与因果关系
肯德尔(Kendall)和斯图尔特(Stuart)说 “一个统计关系式,不管多强也不管多么 有启发性,却永远不能确立因果方面的联 系;对因果关系的理念,必须来自于统计 学以外,最终来自这种或那种理论。”
虽然回归分析研究一个变量对另一(些) 变量的依赖关系,但它并不一定意味着因 果关系。
第31页/共181页
32
相关关系和回归分析
注意
①相关分析测度两个变量之间的线性关联力度。相关系数就是测 度关联强度的。
②相关分析对称地对待任何(两个)变量,两个变量都被看作是 随机的。回归分析对变量的处理方法存在不对称性,即区分应 变量(被解释变量)和自变量(解释变量):前者是随机变量, 后者是固定的。
29
举例
高尔顿的普遍回归定律。高尔顿的兴趣在于发现 为什么人口的身高分布有一种稳定性。但现代观 点关心的则是给定父辈身高的情形下找出儿辈平 均身高的变化。即关心一旦知道了父辈的身高, 怎样预测儿辈的平均身高。
儿7

辈 身
7
5
高 ,
6
0
英65
0
6 6 7 7 父辈身高,英寸 对应于给定父0亲身高5的儿0子身5高的假想分布
散点图
(scatter diagram)
完全正线性相关
正线性相关
完全负线性相关
负线性相关
第10页/共181页
非线性相关
不相关
11
散点图(例题分析)
【例】一家大型商业银行在多个地区设 有分行,其业务主要是进行基础设施建 设、国家重点项目建设、固定资产投资 等项目的贷款。近年来,该银行的贷款 额平稳增长,但不良贷款额也有较大比 例的提高,这给银行业务的发展带来较 大压力。为弄清楚不良贷款形成的原因, 希望利用银行业务的有关数据做些定量 分析,以便找出控制不良贷款的办法。 下面是该银行所属的25家分行2002年 的有关业务数据
为因变量
x
3. 各观测点落在一条线上
第3页/共181页
4
函数关系
(几个例子)
函数关系的例子
▪ 某种商品的销售额(y)与销售量(x)之间的关 系可表示为 y = px (p 为单价)
▪ 圆 的 面 积 (S) 与 半 径 之 间 的 关 系 可 表 示 为
S= R2 ▪ 企业的原材料消耗额(y)与产量(x1) 、单位产
(3)利用回归方程进行分析、 评价及预测。 第33页/共181页
34
回归模型的类型
回归模型
一元回归
多元回归
线性回归 非线性回归 线性回归 非线性回归
第34页/共181页
35
二、总体回归函数
回归分析关心的是根据解释变量的
已知或给定值,估计或预测被解释变 量的总体均值。 回归分析的原理
26.9 19
20.4 20 166.2 21
第232页7./0共181页
企业
印象 (百万
次)
百威 10.4
贝尔 88.9
CK 12.0
温迪快 29.2 餐
宝丽莱 38.0
Shasta 10.0
Meow 12.3 Mix
卡夫食 23.4 品
佳洁士 71.1
Kibbles’ 4.4 N Bits
支出(百 万美元)
第17页/共181页
18
相关系数的特性
相关系数中,两变量并不区分解释变量或 被解释变量。
相关系数的计算以数值型变量为主,此公 式不适用于类别变量。
相关系数的计算使用标准化值,与各数值 型变量的度量单位无关。
第18页/共181页
19
相关系数(例题分析)
第19页/共181页
20
线性关系的不同强度之r
10
不良贷款
8
8
6
6
4
4
2
2
0
0
0
20
40
0
5
10
15
20
25
30
不良贷款与累计应收贷款累计应收贷款
贷款项目个数 不良贷款与贷款项目个数
的散点图
第13页/共181页
的散点图
不良贷款
14
相关系数
(correlation coefficient)
1. 对变量之间关系密切程度的度量
2. 对两个变量(xi, yi) , i = 1, 2, …, n 之
513
47
2510
566
550
6
4428
525
521
28
31878
495
511
45
2510
566
550
6
3823
536
538
30
31878
495
511
04
79
3823
536
538
30
725
508
495
66
3274
507
504
79
543
489
473 第205页0 /共181页 725
高尔顿的普遍回归定律。(law of universal regression)
第27页/共181页
28
回归的现代释义
回归分析是关于研究一个叫做因 变量的变量对另一个或多个叫做 解释变量的变量的依赖关系,其 用意在于通过后者(在重复抽样 中)的已知或设定值,取估计或 预测前者的(总体)均值。
第28页/共181页
一起变化并完全依赖于某种商品的销售额y与销售量x之间的关系可表示为与半径之间的关系可表示为sr2企业的原材料消耗额y与产量x1单位产量消耗x2原材料价格x3之间的关系可表示为yx1x2x3变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定对变量间统计依赖关系的考察主要是通过相关分析correlationanalysis或回归分析regressionanalysis来完成的父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食亩产量y与施肥量x1降雨量x2温度x3之间的关系商品的消费量y与居民收入x之间的关商品销售额y与广告费支出x之间的关11scatterdiagram完全负线性相关完全正线性相关例一家大型商业银行在多个地区设有分行其业务主要是进行基础设施建设国家重点项目建设固定资产投资等项目的贷款
3823
536
538
30
3274
507
504
79
725
508
495
66
543
489
473
50
607
521
513
47
4428
525
521
28
r = 0.3
2510
566
550
6
31878
495
511
45
3823
536
538
30
3274
507
504
79
725
508
495
66
4273
565
558
8
607
521
量消耗(x2) 、原材料价格(x3)之间的关系可 表示为y = x1 x2 x3
第4页/共181页
5
相关关系
(correlation)
1. 变量间关系不能用函 数关系精确表达
y
2. 3.
一个变量的取值不能 由另一个变量唯一确 定
当变量 x 取某个值时,
变量 y 的取值可能有
x
几个
4. 各观测点分布在直线 周围
513 r = 0.5
47
4428
525
521
28
2510
566
550
6
31878
495
511
45
3823
536
538
30
3274
507
504
79
725
508
495
66
543
489
473
50
607
521
513
47
r = 0.97
4428
525
521
28
4273
565
558
8
607
521
r = 0.8
间线性相关程度及方向的度量称为简单 相关系数 3. 若相关系数是根据总体全部数据计算的,
称为总体相关系数,记为
4. 若是根据样本数据计算的,则称为样本 相关系数,记为 r
第14页/共181页
15
相关系数 (计算公式)
样本相关系数的计算公式
r (x x)( y y) (x x)2 (y y)2
第29页/共181页
30
什么是回归分析?
(Regression)
1. 从一组样本数据出发,确定变量之间 的数学关系式
2. 对这些关系式的可信程度进行各种统 计检验,并从影响某一特定变量的诸 多变量中找出哪些变量的影响显著, 哪些不显著(即确定因果关系及影响大 小)
相关文档
最新文档