计量经济学第二章简单线性回归模型案例分析
计量经济学计量经济学教学案例
计量经济学教学案例案例一 简单线性回归模型一、主题与背景用真实数据进行简单线性回归分析,应用Eviews6.0分析软件进行操作,与课本内容相对应,分析模型的截距、斜率以及可决系数,引导学生熟悉Eviews6.0的基本操作,能够解读分析报告,并尝试进行被解释变量的预测,体会变量测度单位的改变和函数形式变化给OLS 估计结果和统计特征的影响。
二、情景描述对于由CEO 构成的总体,令y 代表年薪(salary),单位为千美元。
令x 表示某个CEO 所在公司在过去三年的平均股本回报率(roe ,股本回报率定义为净收入占普通股价的百分比)。
为研究该公司业绩指标和CEO 薪水之间的关系,可以定义以下模型:Salary=0β+1βroe + u . 斜率参数1β衡量当股本回报率增长一个单位(一个百分点)时CEO 年薪的变化量,由于更高的股本回报率预示更高的CEO 年薪,所以,1β>0。
三、教学过程设计(一)数据说明数据集CEOSAL1.RAW 包含1990年209位CEO 的相关信息,该数据来自《商业周刊》(5/6/91),该样本中CEO 年薪的平均值为$1,281,120,最低值和最高值分别为$223,000和$14,822,000,1988、1989和1990年的平均股本回报率是17.18%。
(二)操作建议1:在 eviews6.0命令输入窗口定义变量:data salary roe2、用 edit+/- 编辑数据3、描述统计分析过程:view---descriptive stats---common sample4、画散点图:Scat roe salary5、在eviews6.0命令输入窗口运行简单线性回归 Ls salary c roe6、用resids 观测残差7、产生新序列:S eries lsalary =log(salary)8、改变函数形式:Ls lsalary c lsales9、改变变量测度单位:Ls salary*1000 c roe四、教学研究(一)案例结论1、回归结果估计出的回归线为:salˆary = 963.191 + 18.501 roe(1)截距和斜率保留了3位小数,回归结果显示,如果股本回报率为0,年薪的预测值为截距963.191千美元,可以把年薪的预测变化看做股本回报率变化的函数:∆salˆary = 18.501 (∆roe),这意味着当股本回报率增加1个百分点,即∆roe =1,则年薪的预测变化就是18.5千美元,在线性方程中,估计的变化与初始年薪无关。
计量经济学第二章 简单线性回归
Yˆi Y
2
Yi Yˆi 2
计量经济学
ECONOMETRICS
计量经济学
ECONOMETRICS
两种不同的解释
Jeffrey M. Wooldridge等的解释。 SST表示Y的总体变异。它分为两部分,一部分SSE, 这部分可以由模型解释,另一部分SSR,这是模型解 释不了的部分。
另一种解释。 William H. Greene和Robert S. Pindyck等 SSE(Error Sum of Squares)——残差平方和 SSR(Regression Sum of Squares)——回归平方和
ECONOMETRICS
线性
ˆ1
X X Y Y X X 2
X X
X X
2Y
CY
ˆ0
Y
X
X X
X X
2Y
1 n
XC
Y
都是关于Y的线性函数
C 0
CX 1
C
2
1 X
X
2
计量经济学
ECONOMETRICS
ˆ0 , ˆ1
E
ˆ0
E
ˆ0
ˆ1 E ˆ1
Cov
1 n
Y
,
X X
X X
2
Y
XVar
ˆ1
X X 2 n X X 2
X
计量经济学 第二章 一元线性回归模型范文
第二章 一元线性回归模型2.1 一元线性回归模型的基本假定2.1.1一元线性回归模型有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。
其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。
图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。
所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
“线性”一词在这里有两重含义。
它一方面指被解释变量Y 与解释变量X 之间为线性关系,即1tty x β∂=∂220tt y x β∂=∂另一方面也指被解释变量与参数0β、1β之间的线性关系,即。
1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以在经济问题上“控制其他因素不变”是不可能的。
随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。
回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略, (2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。
庞浩计量经济学第二章简单线性回归模型
最小二乘法的应用
在统计学和计量经济学中,最 小二乘法广泛应用于估计线性 回归模型,以探索解释变量与 被解释变量之间的关系。
通过最小二乘法,可以估计出 解释变量的系数,从而了解各 解释变量对被解释变量的影响 程度。
最小二乘法还可以用于时间序 列分析、预测和数据拟合等场 景。
最小二乘法的局限性
最小二乘法假设误差项是独立同分布 的,且服从正态分布,这在实际应用 中可能不成立。
最小二乘法无法处理多重共线性问题, 当解释变量之间存在高度相关关系时, 最小二乘法的估计结果可能不准确。
最小二乘法对异常值比较敏感,异常 值的存在可能导致参数估计的不稳定。
04
模型的评估与选择
R-squared
总结词
衡量模型拟合优度的指标
详细描述
R-squared,也称为确定系数,用于衡量模型对数据的拟合程度。它的值在0到1之间,越接近1表示模型拟合越 好。R-squared的计算公式为(SSreg/SStot)=(y-ybar)2 / (y-ybar)2 + (y-ybar)2,其中SSreg是回归平方和, SStot是总平方和,y是因变量,ybar是因变量的均值。
数据来源
本案例的数据来源于某大型电商 平台的销售数据,包括商品的销 售量、价格、评价等。
数据处理
对原始数据进行清洗和预处理, 包括处理缺失值、异常值和重复 值,对分类变量进行编码,对连 续变量进行必要的缩放和转换。
模型建立与评估
模型建立
基于处理后的数据,使用简单线性回 归模型进行建模,以商品销售量作为 因变量,价格和评价作为自变量。
线性回归模型是一种数学模型, 用于描述因变量与一个或多个 自变量之间的线性关系。它通 常表示为:Y = β0 + β1X1 + β2X2 + ... + ε
计量经济学第二章 一元线性回归模型(1)(肖)
10
2.在经济学中,经济学家要研究个人
消费支出与个人可支配收入的依赖关系。
这种分析有助于估计边际消费倾向,就是
可支配收入每增加一元引起消费支出的平
均变化。
11
3.在企业中,我们很想知道人们对企
业产品的需求与广告费开支的关系。这种
研究有助于估计出相对于广告费支出的需
求弹性,即广告费支出每变化百分之一的
(2.3)
想想:结合表2.1的资料 ,怎样理解式(2.3)
变量Y 的原因, 给定变量X 的值也不能具
体确定变量Y的值, 而只能确定变量Y 的
统计特征,通常称变量X 与Y 之间的这种
关系为统计关系。
16
例如,企业总产出Y 与企业的资本投入
K 、劳动力投入L 之间的关系就是统计关 系。虽然资本K 和劳动力L 是影响产出Y 的两大核心要素,但是给定K 、L 的值并 不能确定产出Y 的值。因为,总产出Y 除 了受资本投入K、劳动力投入L 的影响外
在进入正式的回归理论之前,先斟酌一下变量y与变 量x可以互换的不同名称、术语。 Y 因变量 X 自变量
被解释变量 响应变量
被预测变量
解释变量 控制变量
预测变量
回归子
归回元
22
第二节
一、引例
一元线性回归模型
假定我们要研究一个局部区域的居 民消费问题,该区域共有80户家庭组成 ,将这80户家庭视为一个统计总体。
32
函数f (Xi)采取什么函数形式,是一个
需要解决的重要问题。在实际经济系统
中,我们不会得到总体的全部数据,因
而就无法据已知数据确定总体回归函数 的函数形式。同时,对总体回归函数的 形式只能据经济理论与经验去推断。
计量经济学模型案例
计量经济学模型案例计量经济学是经济学的一个重要分支,它通过建立数学模型来研究经济现象,并利用实证数据对模型进行检验和估计。
在实际应用中,计量经济学模型可以帮助我们理解经济现象的规律,预测未来的经济走势,制定经济政策等。
下面,我们将通过几个实际案例来介绍计量经济学模型在经济分析中的应用。
首先,我们来看一个简单的线性回归模型的案例。
假设我们想研究劳动力市场的供求关系,我们可以建立一个简单的线性回归模型来分析劳动力市场的工资水平与就业率之间的关系。
我们收集了一些城市的数据,包括每个城市的平均工资水平、就业率、教育水平等变量,然后利用线性回归模型来估计工资水平与就业率之间的关系。
通过对模型的检验和估计,我们可以得出一些结论,比如工资水平的提高是否会影响就业率,教育水平对工资水平的影响等。
其次,我们来看一个时间序列模型的案例。
假设我们想预测未来几个季度的经济增长率,我们可以利用时间序列模型来进行预测。
我们收集了过去几年的经济增长率数据,然后利用时间序列模型来对未来的经济增长率进行预测。
通过对模型的估计和预测,我们可以得出一些结论,比如未来几个季度的经济增长率可能会呈现什么样的趋势,有助于政府制定经济政策和企业进行经营决策。
最后,我们来看一个面板数据模型的案例。
假设我们想研究不同地区的经济增长对环境污染的影响,我们可以利用面板数据模型来进行分析。
我们收集了不同地区的经济增长率和环境污染指标的数据,然后利用面板数据模型来估计经济增长与环境污染之间的关系。
通过对模型的检验和估计,我们可以得出一些结论,比如经济增长对环境污染的影响程度,不同地区之间的差异等。
综上所述,计量经济学模型在经济分析中具有重要的应用价值。
通过建立合适的模型并利用实证数据进行分析,我们可以更好地理解经济现象的规律,预测未来的经济走势,为政府制定经济政策和企业经营决策提供科学依据。
希望以上案例可以帮助大家更好地理解计量经济学模型在实际应用中的重要性和价值。
第二章 简单线性回归模型
Y 的条件均值
E (Y X i )
55
75
95
115
135
155
175
195
215
235
之间的对应关系是: 家庭可支配收入 X 与平均消费支出 E ( Y X i ) 之间的对应关系是:
E ( Y X i ) = 15 + 2 X 3
i
的条件期望表示为解释变量的某种函数称为总体函数。 这种把总体应变量 Y 的条件期望表示为解释变量的某种函数称为总体函数。简记 PRF。 为 PRF。
(三)回归与相关的联系与区别
两者的区别在于: 用途不同—— ——相关分析是用相关系数去度量变量之间线性 (1)用途不同——相关分析是用相关系数去度量变量之间线性 关联的程度,而回归分析却要根据解释变量的确定值, 关联的程度,而回归分析却要根据解释变量的确定值,去估计和预测 被解释变量的平均值; 被解释变量的平均值; 变量性质不同—— ——相关分析中把相互联系的变量都作为随 (2)变量性质不同——相关分析中把相互联系的变量都作为随 机变量, 机变量, 而在回归分析中, 而在回归分析中, 假定解释变量在重复抽样中具有固定数值, 假定解释变量在重复抽样中具有固定数值, 是非随机的,被解释变量才是随机变量。 是非随机的,被解释变量才是随机变量。 对变量的因果关系处理不同—— ——回归分析是在变量因果关 (3)对变量的因果关系处理不同——回归分析是在变量因果关 系确定的基础上研究解释变量对被解释变量的具体影响,对变量的处 系确定的基础上研究解释变量对被解释变量的具体影响, 理是不对称的, 而在相关分析中, 把相互联系的变量都作为随机变量, 理是不对称的, 而在相关分析中, 把相互联系的变量都作为随机变量, 是对称的。 是对称的。
计量经济学 第二章 简单线性回归模型案例分析 PPT
3. 用P值检验 α=0.05 >> p=0.0000
表明,城镇居民人均总收入对城镇居民每百户计算机拥有量确 有显著影响。
4. 经济意义检验:
所估计的参数
,说明城镇
居民家庭人均总收入每增加1元,平均说来城变量选择:被解释变量选择能代表城乡所有居民消费的 “城镇居民家庭平均每百户计算机拥有量”(单位:台) ; 解释变量选择表现城镇居民收入水平的“城镇居民平均每 人全年家庭总收入”(单位:元) 研究范围:全国各省市2011年底的城镇居民家庭平均每 百户计算机拥有量和城镇居民平均每人全年家庭总收入数 据。
3、总体回归函数(PRF)是将总体被解释变量Y的条件 均值表现为解释变量X的某种函数。 样本回归函数(SRF)是将被解释变量Y的样本条件 均值表示为解释变量X的某种函数。 总体回归函数与样本回归函数的区别与联系。
4、随机扰动项是被解释变量实际值与条件均值的偏差, 代表排除在模型以外的所有因素对Y的影响。
Yt 12Xt ut
估计参数
假定模型中随机扰动满足基本假定,可用OLS法。 具体操作:使用EViews 软件,估计结果是:
用规范的形式将参数估计和检验的结果写为: Y ˆt11.95800.002873X t
(5.6228) (0.00024) t= (2.1267) (11.9826) R2 0.8320 F=143.5836 n=31
即是说:当地区城镇居民人均总收入达到25000元时,城镇居 民每百户计算机拥有量 平均值置信度95%的预测区间为 (80.6219,86.9473)台。
12
个别值区间预测:
庞浩计量经济学第二章 简单线性回归模型
18
100个家庭构成的总体 研究其消费支出与可支配收入之间的关系(单位:元)
每 月 家 庭 可 支 配 收 入 X 1500 2000 2500 962 1108 1329 1024 1201 1365 1121 1264 1410 1210 1310 1432 1259 1340 1520 1324 1400 1615 条件均值、条件期望, 1448 1650 指在月可支配收入为 1489 1712 Xi的条件下,各家庭 1538 1778 月消费支出的均值。 1600 1841 1702 1886 1900 2012 1000 820 888 932 960 3000 1632 1726 1786 1835 1885 1943 2037 2078 2179 2298 2316 2387 2498 2589 1150 1400 1650 1900 3500 1842 1874 1906 1068 2066 2185 2210 2289 2313 2398 2423 2453 2487 2586 2150 4000 2037 2110 2225 2319 2321 2365 2398 2487 2513 2538 2567 2610 2710 2400 4500 2275 2388 2426 2488 2587 2650 2789 2853 2934 3110 5000 2464 2589 2790 2856 2900 3021 3064 3142 3274 5500 2824 3038 3150 3201 3288 3399
6
案例——相关表
可支 配收 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500 入X (元)
消费 支出 932 Y (元)
计量经济学 第二章 一元线性回归模型
计量经济学第二章一元线性回归模型第二章一元线性回归模型第一节一元线性回归模型及其古典假定第二节参数估计第三节最小二乘估计量的统计特性第四节统计显著性检验第五节预测与控制第一节回归模型的一般描述(1)确定性关系或函数关系:变量之间有唯一确定性的函数关系。
其一般表现形式为:一、回归模型的一般形式变量间的关系经济变量之间的关系,大体可分为两类:(2.1)(2)统计关系或相关关系:变量之间为非确定性依赖关系。
其一般表现形式为:(2.2)例如:函数关系:圆面积S =统计依赖关系/统计相关关系:若x和y之间确有因果关系,则称(2.2)为总体回归模型,x(一个或几个)为自变量(或解释变量或外生变量),y为因变量(或被解释变量或内生变量),u为随机项,是没有包含在模型中的自变量和其他一些随机因素对y的总影响。
一般说来,随机项来自以下几个方面:1、变量的省略。
由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。
2、统计误差。
数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。
3、模型的设定误差。
如在模型构造时,非线性关系用线性模型描述了;复杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。
4、随机误差。
被解释变量还受一些不可控制的众多的、细小的偶然因素的影响。
若相互依赖的变量间没有因果关系,则称其有相关关系。
对变量间统计关系的分析主要是通过相关分析、方差分析或回归分析(regression analysis)来完成的。
他们各有特点、职责和分析范围。
相关分析和方差分析本身虽然可以独立的进行某些方面的数量分析,但在大多数情况下,则是和回归分析结合在一起,进行综合分析,作为回归分析方法的补充。
回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
计量经济学实验简单线性回归模型
计量经济学实验简单线性回归模型引言计量经济学是经济学中的一个分支,致力于通过经验分析和实证方法来研究经济问题。
实验是计量经济学中的重要方法之一,能够帮助我们理解和解释经济现象。
简单线性回归模型是实验中常用的工具之一,它能够通过建立两个变量之间的数学关系,预测一个变量对另一个变量的影响。
本文将介绍计量经济学实验中的简单线性回归模型及其应用。
简单线性回归模型模型定义简单线性回归模型是一种用于描述自变量(X)与因变量(Y)之间关系的线性模型。
其数学表达式为:Y = β0 + β1X + ε其中,Y表示因变量,X表示自变量,β0和β1为未知参数,ε表示误差项。
参数估计在实际应用中,我们需要通过数据来估计模型中的参数。
最常用的估计方法是最小二乘法(OLS)。
最小二乘法的目标是通过最小化观测值与拟合值之间的平方差来估计参数。
具体而言,我们需要求解以下两个方程来得到参数的估计值:∂(Y - β0 - β1X)^2 / ∂β0 = 0∂(Y - β0 - β1X)^2 / ∂β1 = 0解释变量与被解释变量在简单线性回归模型中,解释变量(X)用来解释或预测被解释变量(Y)。
例如,我们可以使用房屋的面积(X)来预测房屋的价格(Y)。
在实验中,我们可以根据收集到的数据来建立回归模型,并利用该模型进行预测和分析。
应用实例数据收集为了说明简单线性回归模型的应用,我们假设收集了一些关于学生学习时间与考试成绩的数据。
下面是收集到的数据:学习时间(小时)考试成绩(百分制)2 723 784 805 856 88模型建立根据收集到的数据,我们可以建立简单线性回归模型来分析学生学习时间与考试成绩之间的关系。
首先,我们需要确定自变量和因变量的符号。
在这个例子中,我们可以将学习时间作为自变量(X),考试成绩作为因变量(Y)。
然后,我们使用最小二乘法来估计模型中的参数。
通过计算,可以得到如下参数估计值:β0 = 69.85β1 = 2.95最终的回归方程为:Y = 69.85 + 2.95X预测与分析通过建立的回归模型,我们可以进行预测和分析。
(完整版)计量经济学第三版课后习题答案解析
第二章简单线性回归模型2.1(1)①首先分析人均寿命与人均GDP的数量关系,用Eviews分析:Dependent Variable: YMethod: Least SquaresDate: 12/23/15 Time: 14:37Sample: 1 22Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 56.64794 1.960820 28.88992 0.0000 X1 0.128360 0.027242 4.711834 0.0001R-squared 0.526082 Mean dependentvar 62.50000Adjusted R-squared 0.502386 S.D. dependentvar 10.08889S.E. of regression 7.116881 Akaike infocriterion 6.849324Sum squared resid 1013.000 Schwarzcriterion 6.948510Log likelihood -73.34257 Hannan-Quinncriter. 6.872689F-statistic 22.20138 Durbin-Watsonstat 0.629074 Prob(F-statistic) 0.000134有上可知,关系式为y=56.64794+0.128360x1②关于人均寿命与成人识字率的关系,用Eviews分析如下:Dependent Variable: YMethod: Least SquaresDate: 12/23/15 Time: 15:01Sample: 1 22Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 38.79424 3.532079 10.98340 0.0000 X2 0.331971 0.046656 7.115308 0.0000R-squared 0.716825 Mean dependentvar 62.50000Adjusted R-squared 0.702666 S.D. dependentvar 10.08889S.E. of regression 5.501306 Akaike infocriterion 6.334356Sum squared resid 605.2873 Schwarzcriterion 6.433542Log likelihood -67.67792 Hannan-Quinncriter. 6.357721F-statistic 50.62761 Durbin-Watsonstat 1.846406 Prob(F-statistic) 0.000001由上可知,关系式为y=38.79424+0.331971x2③关于人均寿命与一岁儿童疫苗接种率的关系,用Eviews分析如下:Dependent Variable: YMethod: Least SquaresDate: 12/23/14 Time: 15:20Sample: 1 22Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 31.79956 6.536434 4.864971 0.0001 X3 0.387276 0.080260 4.825285 0.0001R-squared 0.537929 Mean dependentvar 62.50000Adjusted R-squared 0.514825 S.D. dependentvar 10.08889S.E. of regression 7.027364 Akaike infocriterion 6.824009Sum squared resid 987.6770 Schwarzcriterion 6.923194Log likelihood -73.06409 Hannan-Quinncriter. 6.847374F-statistic 23.28338 Durbin-Watsonstat 0.952555Prob(F-statistic) 0.000103由上可知,关系式为y=31.79956+0.387276x3(2)①关于人均寿命与人均GDP模型,由上可知,可决系数为0.526082,说明所建模型整体上对样本数据拟合较好。
计量经济学模型案例
计量经济学模型案例计量经济学是经济学的一个重要分支,它运用数理统计和数学工具来分析经济现象。
计量经济学模型是对经济现象进行定量分析的重要工具,通过建立数学模型来揭示经济现象的内在规律。
在本文中,我们将通过几个实际案例来介绍计量经济学模型的应用。
首先,我们来看一个简单的线性回归模型。
假设我们想要分析收入对消费支出的影响,我们可以建立一个线性回归模型来探讨二者之间的关系。
通过收集一定时间内的个体数据,我们可以利用最小二乘法来估计模型参数,从而得到收入对消费支出的影响程度。
这个模型可以帮助我们更好地理解收入和消费之间的关系,为政府制定经济政策提供参考依据。
其次,我们可以考虑一个面板数据模型的案例。
面板数据是指在一定时间内对多个个体进行观测得到的数据,它能够更好地反映出个体间的异质性。
比如,我们可以建立一个面板数据模型来分析不同城市房价与人口密度、经济发展水平等因素的关系。
通过面板数据模型,我们可以更准确地把握不同城市房价受到各种因素影响的情况,为房地产市场的监管和预测提供支持。
最后,让我们来看一个时间序列模型的案例。
时间序列数据是指在一段时间内对同一变量进行观测得到的数据,它能够更好地反映出变量随时间的变化规律。
比如,我们可以建立一个时间序列模型来预测未来某个经济指标的变化趋势。
通过对历史数据的分析和建模,我们可以利用时间序列模型来进行未来经济趋势的预测,为政府和企业的决策提供参考。
综上所述,计量经济学模型在实际应用中具有重要的意义。
通过建立合适的模型,我们可以更好地分析和解释经济现象,为经济政策的制定和实施提供科学依据。
当然,在实际应用中,我们需要根据具体问题选择合适的模型,并结合实际数据进行估计和预测。
希望本文介绍的几个案例能够帮助读者更好地理解计量经济学模型的应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模型设定:
为了初步分析城镇居民家庭平均每百户计算机拥有量 (Y)与城镇居民平均每人全年家庭总收入(X)的关系, 作以X为横坐标,以Y为纵坐标的散点图。
从散点图可以看出城镇居民家庭 平均每百户计算机拥有量(Y)与 城镇居民平均每人全年家庭总收
入(X) 大体呈现线性关系。
可以建立如下简单线性回归模型:
量;OLS 估计量的分布性质及期望、方差和标准误差; OLS估计式是最佳线性无偏估计量。
14
7、简单线性回归模型极大似然估计的思想和方法。
8、对回归系数区间估计的思想和方法。 9、拟合优度是样本回归线对样本观测数据拟合的优 劣程度,可决系数是在总变差分解基础上确定的。 可决系数的计算方法、特点与作用。 10、对回归系数假设检验的基本思想。对回归系数t 检验的思想与方法;用P值判断参数的显著性。
ˆ ) 11.9826 t (29) 2.045 t( 2 0.025
应拒绝 H0 : 2 0
3. 用P值检验 α = 0.05 >> p=0.0000
表明,城镇居民人均总收入对城镇居民每百户计算机拥有量确 有显著影响。
8
4. 经济意义检验:
所估计的参数
,说明城镇
居民家庭人均总收入每增加1元,平均说来城镇居
R 2 0.8320
F=143.5836 n=31
7 7
模型检验
1. 可决系数: R 2 0.8320
模型整体上拟合较好。
2. 系数显著性检验:取 α = 0.05 ,查t分布表得自由度
为 n 2 31 2 29 的临界值为 t0.025 (29) 2.045 。
ˆ ) 2.1267 t (29) 2.045 应拒绝 H : 0 因为 t( 0 1 1 0.025
第八节 案例分析
案例:分析各地区城镇居民计算机拥有量与城 镇居民收入水平的关系
提出问题:随着信息化程度和居民收入水平的提高,作 为居民耐用消费品重要代表的计算机已为众多城镇居民 家庭所拥有。研究中国各地区城镇居民计算机拥有量与 居民收入水平的数量关系,对于探寻居民消费增长的规 律性,分析各地区居民消费的差异,预测地区全体居民 消费水平和结构的发展趋势,合理规划信息产业的发展, 都有重要的意义。 理论分析:影响居民计算机拥有量的因素有多种,但从 理论和经验分析,最主要的影响因素应是居民收入水平。
( X f X )2 (25000 22666.97) 2 5443028.981
2 2 2 x ( X X ) i i X ( n 1)
6112.9652 (31 1) 1121050233
X f 25000时
1 5443028.981 83.7846 m 2.045 8.027957 83.7846 m 3.1627 31 1121050233
13
4、随机扰动项是被解释变量实际值与条件均值的偏差,
代表排除在模型以外的所有因素对Y的影响。
5、简单线性回归的基本假定:对模型和变量的假定、对 随机扰动项u的假定(零均值假定、同方差假定、无自 相关假定、随机扰动与解释变量不相关假定、正态性 假定)
6、普通最小二乘法(OLS)估计参数的基本思想及估计
从理论上说居民收入水平越高,居民计算机拥有量越多。1
变量选择:被解释变量选择能代表城乡所有居民消费的 “城镇居民家庭平均每百户计算机拥有量”(单位:台) ; 解释变量选择表现城镇居民收入水平的“城镇居民平均每 人全年家庭总收入”(单位:元) 研究范围:全国各省市2011年底的城镇居民家庭平均每
百户计算机拥有量和城镇居民平均每人全年家庭总收入数
Yt 1 2 X t ut
5
估计参数
假定模型中随机扰动满足基本假定,可用OLS法。 具体操作:使用EViews 软件,估计结果是:
6
用规范的形式将参数估计和检验的结果写为: ˆ 11.9580 0.002873X Y
t t
(5.6228) (0.00024) t= (2.1267) (11.9826)
1 5443028.981 83.7846 m 2.045 8.027957 1 83.7846 m16.7190 31 1121050233
即是说:当地区城镇居民人均总收入达到25000元时, 城镇居民每百户计算机拥有量 个别值置信度95%的预 测区间为(67.0656,100.5036)台。
民每百户计算机拥有量将增加0.002873台,这与
预期的经济意义相符。
9
经济预测
点预测: 如果西部地区某省城镇居民家庭人均总收入能达到 25000元/人,利用所估计的模型可预测城镇居民每 百户计算机拥有量,点预测值为
ˆ 11.9580 0.002873 25000 83.7846 Y f
12 12
本章小结
1、变量间的关系分为函数关系与相关关系。
相关系数是对变量间线性相关程度的度量。 2、现代意义的回归是一个被解释变量对若干个解释变量 依存关系的研究,回归的实质是由解释变量去估计被 解释变量的平均值。 3、总体回归函数(PRF)是将总体被解释变量Y的条件 均值表现为解释变量X的某种函数。 样本回归函数(SRF)是将被解释变量Y的样本条件 均值表示为解释变量X的某种函数。 总体回归函数与样本回归函数的区别与联系。
即是说:当地区城镇居民人均总收入达到25000元时,城镇居 民每百户计算机拥有量 平均值置信度95%的预测区间为 (80.6219,86.9473)台。 11
个别值区间预测:
X F 25000时 :
1 ˆ ˆ Y f Y f t 2 1 n
( X f X )2
2 x i
15
11、被解释变量平均值预测与个别值预测的关系,被解
释变量平均值的点预测和区间预测的方法,被解释变 量个别值区间预测的方法。 12、运用EViews软件实现对简单线性回归模型的估计 和检验。
16
第二章结束了!
17
(台)
区间预测:
平均值区间预测上下限:
2
已知:
1 (X f - X ) ˆ ˆ Y f = Y f tα 2 σ + 2 n x i
t0.025 (29) = 2.045
Yf 83.7846
ˆ 8.027957
n = 31
10
平均值区间预测区间预测
由X和Y的描述统计结果
X 22666.97
重 庆
四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆
76.07
68.86 63.89 63.55 58.83 82.43 56.14 52.65 59.39 61.2
21794.27
19688.09 17598.87 20255.13 18115.76 20069.87 16267.37 17794.98 19654.59 17631.15
地区
2011年底城镇居民家庭平均每百户计算机拥有 量 (台)Y
城镇居民平均每人全年家庭总收入 (元)X
河 பைடு நூலகம் 湖 北 湖 南 广 东 广 西 海 南
71.41 75.49 66.36 104.13 91.72 63.82
19526.92 20193.27 20083.87 30218.76 20846.11 20094.18
据。
2011年中国各地区城镇居民每百户计算机拥有量和人均 总收入
地区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 2011年底城镇居民家庭平均每百户计算机拥有量 (台)Y 103.51 95.4 74.74 69.45 60.83 71.66 68.04 55.36 137.7 96.94 103.17 74.04 103 73.87 85.88 城镇居民平均每人全年家庭总收入 (元)X 37124.39 29916.04 19591.91 19666.1 21890.19 22879.77 19211.71 17118.49 40532.29 28971.98 34264.38 20751.11 27378.11 18656.52 24889.8