简单回归分析计算例
简单回归分析
一、线性回归分析
若是自变数与依变数都是一个,且Y 和X 呈线性关系,这就称为一元线性回归。例如,以X 表示小麦每667m 2
有效穗数,Y 表示小麦每667m 2
的产量,有效穗数即属于自变数,
产量即属于依变数。在这种情形下,可求出产量依有效穗数而变更的线性回归方程。在另一种情形下,两类变数是平行关系很难分出哪个是自变数,哪个是依变数。例如,大豆脂肪含量与蛋白质含量的关系,依照需要确信求脂肪含量依蛋白质含量而变更的回归方程,或求蛋白质含量依脂肪含量而变更的回归方程。
回归分析要解决的问题要紧有四个方面:一是依如实验观看值成立适当的回归方程;二是查验回归方程是不是适用,或对回归方程中的回归系数的进行估量;三是对未知参数进行假设考试;四是利用成立起的方程进行预测和操纵。 (一)成立线性回归方程
用来归纳两类变数互变关系的线性方程称为线性回归方程。若是两个变数在散点图上呈线性,其数量关系可能用一个线性方程来表示。这一方程的通式为:
上式叫做y 依x 的直线回归。其中x 是自变数,y ˆ
是依变数y 的估量值,a 是x =0时的y ˆ
值,即回归直线在y 轴上的截距,称为回归截距,b 是x 每增加一个单位时,y 将平均
地增加(b >0时)或减少(b <0时) b 个单位数,称为回归系数或斜率(regression coefficient or slope )。
要使 能够最好地代表Y 和X 在数量上的互变关系,依照最小
平方式原理,必需使
将Q 看成两个变数a 与b 的函数,应该选择a 与b ,使Q 取得最小值,必需求Q 对a ,b 的一阶偏导数,且令其等于零,即得:
回归计算公式举例分析
回归计算公式举例分析
回归分析是一种统计方法,用于研究变量之间的关系。它可以帮助我们了解一个或多个自变量对因变量的影响程度,以及它们之间的关联性。在实际应用中,回归分析被广泛应用于经济学、金融学、社会学、医学等领域,用于预测、解释和控制变量之间的关系。
回归分析的基本公式如下:
Y = β0 + β1X1 + β2X2 + ... + βnXn + ε。
其中,Y表示因变量,X1、X2、...、Xn表示自变量,β0表示截距,β1、β2、...、βn表示自变量的系数,ε表示误差项。
下面我们以一个简单的例子来说明回归分析的计算公式。
假设我们想研究一个人的身高(Y)与其父母的身高(X1、X2)之间的关系。我们收集了100对父母和子女的身高数据,并进行回归分析。
首先,我们需要建立回归方程:
Y = β0 + β1X1 + β2X2 + ε。
然后,我们使用最小二乘法来估计回归系数β0、β1、β2。最小二乘法是一种常用的参数估计方法,它可以最小化误差平方和,找到最优的回归系数。
假设我们得到了如下的回归方程:
Y = 60 + 0.5X1 + 0.3X2 + ε。
接下来,我们可以使用这个回归方程来进行预测。比如,如果一个孩子的父母身高分别为170cm和165cm,那么根据回归方程,这个孩子的身高预测值为:Y = 60 + 0.5170 + 0.3165 = 60 + 85 + 49.5 = 194.5。
这个预测值可以帮助我们了解一个孩子的身高可能在哪个范围内,以及父母的身高对孩子身高的影响程度。
除了预测,回归分析还可以帮助我们了解变量之间的关系。比如,根据回归系数,我们可以得知父母的身高对孩子的身高有正向影响,而且父亲的身高对孩子的身高影响更大。
回归分析方法应用实例
4、回归分析方法应用实例
在制定运动员选材标准时,理论上要求先对不同年龄的运动员,各测试一个较大的样本,然后,计算出各年龄的平均数、标准差,再来制定标准。
但是,在实际工作中,有时某些年龄组不能测到较大的样本。这时能不能使用统计的方法,进行处理呢?
我们遇到一个实例。测得45名11至18岁男田径运动员的立定三级跳远数据。其各年龄组人数分布如表一。由于受到许多客观因素的限制,一时无法再扩大样本,因此决定使用统计方法进行处理。
第一步,首先用原始数据做散点图,并通过添加趋势线,看数据的变化趋势是否符合随年龄增长而变化的趋势,决定能否使用回归方程制定标准。如果趋势线不符合随年龄增长而变化的趋势,或者相关程度很差就不能用了。
本例作出的散点图如图1,图上用一元回归方法添加趋势线,并计算出年龄和立定三级跳远的:
一元回归方程:Y=2.5836+0.3392 X
相关系数 r=0.7945(P<0.01)
由于从趋势线可以看出,立定三级跳远的成绩是随年龄增加而逐渐增加,符合青少年的发育特点。而且, 相关系数r=0.7945,呈高度相关。因此,可以认为计算出的一元回归方程,反映了11至18岁男运动员年龄和立定三级跳远成绩的线性关系。决定用一元回归方程来制定各年龄组的标准。
第二步,用一元回归方程:Y=2.5836+0.3392 X 推算出各年龄的立定三级跳远回归值,作为各年龄组的第2等标准。
第三步,用45人的立定三级跳远数据计算出标准差为:0.8271。由于在正态分布下,如把平均数作为标准约有50%的人可达到标准,用平均数-0.25标准差制定标准则约有60%的人可达到,用平均数+0.25、+0.52、+0.84标准差制定标准约有40%、30%、20%的人可达到标准。本例用各年龄组回归值-0.25标准差、+0.25标准差、+0.52标准差、+0.84标准差计算出1至5等标准如表2、图2。
回归经典案例
回归经典案例
回归分析是一种统计学方法,用于研究变量之间的关系。以下是一个经典的回归分析案例:
假设我们有一个数据集,其中包含一个人的身高(height)和体重(weight)信息。我们想要研究身高和体重之间的关系,以便预测一个人
的体重。
1. 首先,我们使用散点图来可视化身高和体重之间的关系。从散点图中可以看出,身高和体重之间存在一定的正相关关系,即随着身高的增加,体重也会增加。
2. 接下来,我们使用线性回归模型来拟合数据。线性回归模型假设身高和体重之间的关系可以用一条直线来表示,即 y = ax + b。其中,y 是体重,x 是身高,a 和 b 是模型参数。
3. 我们使用最小二乘法来估计模型参数 a 和 b。最小二乘法是一种优化方法,它通过最小化预测值与实际值之间的平方误差来估计模型参数。
4. 拟合模型后,我们可以使用回归方程来预测一个人的体重。例如,如果我们知道一个人的身高为米,我们可以使用回归方程来计算他的体重。
5. 最后,我们可以使用残差图来检查模型的拟合效果。残差图显示了实际值与预测值之间的差异。如果模型拟合得好,那么残差应该随机分布在零周围。
这个案例是一个简单的线性回归分析案例。在实际应用中,回归分析可以应用于更复杂的问题,例如预测股票价格、预测疾病发病率等。
回归计算公式举例说明
回归计算公式举例说明
回归分析是统计学中常用的一种分析方法,用于研究变量之间的关系。回归分
析可以帮助我们了解自变量和因变量之间的关系,并用于预测未来的结果。在回归分析中,有许多不同的公式和方法,其中最常见的是简单线性回归和多元线性回归。本文将以回归计算公式举例说明为标题,介绍简单线性回归和多元线性回归的计算公式,并通过具体的例子来说明其应用。
简单线性回归。
简单线性回归是回归分析中最基本的形式,用于研究一个自变量和一个因变量
之间的关系。其数学模型可以表示为:
Y = β0 + β1X + ε。
其中,Y表示因变量,X表示自变量,β0和β1分别表示回归方程的截距和
斜率,ε表示误差项。简单线性回归的目标是通过最小化误差项来估计回归方程的参数β0和β1。
为了说明简单线性回归的计算公式,我们假设有一组数据,其中自变量X的取值为{1, 2, 3, 4, 5},对应的因变量Y的取值为{2, 4, 5, 4, 5}。我们可以通过最小二
乘法来估计回归方程的参数β0和β1。
首先,我们需要计算自变量X和因变量Y的均值,分别记为X和Ȳ。然后,我
们可以计算回归方程的斜率β1和截距β0:
β1 = Σ((Xi X)(Yi Ȳ)) / Σ((Xi X)²)。
β0 = Ȳβ1X。
其中,Σ表示求和符号,Xi和Yi分别表示第i个观测数据的自变量和因变量
取值。
在我们的例子中,自变量X的均值为3,因变量Y的均值为4。根据上面的公式,我们可以计算得到回归方程的斜率β1为0.6,截距β0为2。因此,简单线性
回归的回归方程可以表示为:
回归分析实例
实验(三) :回归分析
1. 用刀削机床加工时,为实地调整机床需测定刀具的磨损速度,现每隔 1 小时测量刀具的 厚度得到以下数据,试建立刀具厚度关于刀削时间的回归模型,对模型和回归系数进行 检验,预测 15 小时后刀具的厚度。
从残差图看出无异常点。 3. 某人记录了 21 天中每天使用空调器的时间和使用烘干器的次数,并检测电表以计算每 天的耗电量,数据见下表,试研究耗电量(KWH)与空调器使用的小时数(AC)和烘干器使 用次数(DRYER)之间的关系,建立并检验回归模型,诊断是否有异常点。 要求:将数据先存成一个 xls 文件。程序中将数据从该文件中读入 Matlab。 序号 1 2 3 4 5 6 7 8 10 11 9 KWH 35 63 66 17 94 79 93 66 94 82 78 AC DRYER 1 2 2 0 3 3 1 1 1 2 3 序号 12 13 14 15 16 17 18 19 20 21 KWH 65 77 75 62 85 43 57 33 65 33 AC 7.5 7.5 12 6 5 6 8 8 DRYER 1 2 2 1 1 0 3 0 1 0
第 1 页 共 8 页
年级、专业 姓名 学号 名单序号 实验时间 2010 年 月 日 Matlab 软件版本 注:实验报告的最后一部分是实验小结与收获
回归分析计算程序及检验
《实用回归分析》方开泰等,P58,例2.5
例2.5 某病虫测报站为了能较准确地预报第三代棉铃虫的产卵期,以便能适时采取杀虫措施,保证棉花现根据这些数据建立预报方程。
首先画散点图(图2.9)。从图看出y与x之间有线性关系。
年序6月份平均气温x(℃)7月份卵见期y(日)经计算得
12023.9x平均=23.33,y平均=20.78
21424.6Lxx=4.44,Lyy=171.56,Lxy=-23 31824.1由此得
42722.7b=Lxy/Lxx=-23.433/4.44=-5.28 52622.3a=y平均-bx平均=20.78-(-5.28)* 61823.1回归方程为
72422.9y=143.96-5.28x
81623.5又计算得
92422.9S回=123.726
S残=47.834
F=S回/S残(-)=18.107
因为临界值F0.01(1,7)=12.25,所
最后,求预测区间(α=5%)
当x=x0时,y的预测区间为[y0-△
这里y0=143.96-5.28x0
验算
y x
2023.9n9
1424.6平均值23.3333320.77778
1824.1Lxx 4.44
2722.7Lxy-23.4333
2622.3Lyy171.5556
1823.1b-5.27778
2422.9a143.9259
1623.5回归方程y=143.93-5.28x
2422.9r-0.84906
S总171.5556
S回123.6759
S残47.87963
F检验18.08142十分显著
F0.05 5.591448
计量经济学 第二章 简单线性回归模型案例分析
Y ˆ f 1 1 .9 5 8 0 0 .0 0 2 8 7 3 2 5 0 0 0 8 3 .7 8 4 6 (台)
区间预测:
平均值区间预测上下限:
Yf = Yˆ f
tα 2 σˆ
1 + (X n
f
-X xi2
)2
已知:
Yf 83.7846 t0.025(29)=2.045 ˆ8.027957 n = 31
96.94
103.17
74.04
103
73.87
85.88
H
城镇居民平均每人全年家庭总收入 (元)X
37124.39
29916.04 19591.91
19666.1
21890.19
22879.77
19211.71
源自文库
17118.49
40532.29 28971.98
34264.38
20751.11
27378.11
H
城镇居民平均每人全年家庭总收入 (元)X 19526.92 20193.27 20083.87 30218.76 20846.11 20094.18 21794.27 19688.09 17598.87 20255.13 18115.76 20069.87 16267.37 17794.98 19654.59 17631.15
α=0.05
典型例题:线性回归方程
认识线性回归方程
一、线性回归方程
设X与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致
分布在一条直线的附近,这条直线就叫做回归直线.
例1.假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)
有如下的统计资料:
若由资料知y对x呈线性相关关系,试求:
(1)线性回归方程y = a+bxi
(2)估计使用年限10年时,维修费用是多少?
分析:因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题.
解:(1)制表
于是有& = • =].23,。=亍一庚= 5 — 1.23x4 = 0.08.
90-5x42
・•・线性回归方程为y = 1.23X+0.08 ;
(2)当x = 10时,『 = 1.23x10+0.08 = 12.38 (万元),即估计使用10年
时
1 / 3
维修费用约是12.38万元.
评注:已知y对x呈线性相关关系,无须进行相关性检验,否则应首先进行
相关性检验.
二、回归分析
通过对有关数据的分析,作出散点图,并利用散点图直观地认识两个变量的 相关关系,也可以用相关系数r 来确定两个变量的线性相关关系.
例2. —个车间为了规定工时定额,需要确定加工零件所花费的时间,为此 进行了 10次试验,测得的数据如下:
零件数X (个) 10 20
30 40 50
60
70
80
90
100
加工时间y (分)
62 68 75 81 89 95 102 108 115 122
(1) y 与
X 是否具有线性相关关系?
(2) 如果y 与x 具有线性相关关系,求回归直线方程.
分析:先求出r 的值,I"的值越接近于1,表明两个变量的线性相关关系越 强.
回归分析的例子
Hierarchical Regression的測試 的測試-2 的測試
(1)設立保守假設,即在母體中兩個方程式對Y的預 測及解釋能力沒有分別,即兩個方程式的 「1 – (ε的變異量)/(Y的變異量)」 是一樣的。 (2)抽取樣本、測量各自變項及依變項,以取得數據 計算兩個方程的R2及R2; (3)計算在保守假設正確時,我們會看到這個樣本的 R2的機會有多大(即P值;P value); (4)根據P值判斷是否要推翻原來保守的假設。
依變項的虛擬變項
假如依變項(Y)是類別尺度測量及分為兩類的, 我們仍可設立虛擬變項,進行特別的迴歸 分析,稱為Logistic Regression。 例如:離職(Turnover)的研究。
多於兩個類別的虛擬變項
假如X2是多於兩個類別,例如是公司的種類:國營企業 (SOE)、中外合資企業(JV)、外資獨資企業(WOFE) ,這 樣我們便要創造兩個新的虛擬變項(D1及D2)來代替這變項。 例如當企業是SOE時,把D1設定為1,而其他企業則把D1設 定為0;當企業是JV時,把D2設定為1,而其他企業則把 D2設定為0。 我們的迴歸方程式便是: 「Y = β0 + β1 X1 + β2D1 + β3D2 + ε」 如果在統計測試中我們的結論是β2及β3均等於零時,則代表 企業類別對預測或解釋Y方面沒有用。 如果自變項的類別數目為n時,我們祗要設定(n-1)個虛擬變 項,便可進行迴歸分析以測試此自變項對依變項的影響。
实验报告简单线性回归分析
西南科技大学
Southwest University of Science and Technology
经济管理学院
计量经济学
实验报告
——多元线性回归的检验
专业班级:姓名: 学号: 任课教师: 成
绩:
简单线性回归模型的处理
实验目的:掌握多元回归参数的估计和检验的处理方法。
实验要求:学会建立模型,估计模型中的未知参数等。
试验用软件:Eviews
实验原理:线性回归模型的最小二乘估计、回归系数的估计和检验。实验内容:
1、实验用样本数据:
运用Eviews软件,建立1990-2001年中国国内生产总值X和深圳市收入Y的回归模型,做简单线性回归分析,并对回归结果进行检验。以研究我国国内生产总值对深圳市收入的影响。
经过简单的回归分析后得出表EQ1:
Depe ndent Variable: Y Method: Least Squares Date: 11/27/11 Time: 14:02 Sample: 1990 2001 In cluded observati ons: 12 Variable
Coefficie
nt
Std. Error t-Statistic Prob.
C -3.611151 4.161790 -0.867692 0.4059 X
0.134582 0.003867 34.80013 0.0000 R-squared
0.991810 Mean depe ndent var 119.879
3 Adjusted R-squared 0.990991 S.D. dependent var 79.3612
统计学线性回归分析作业
白杨树重量与其直径、高度、生长地点的相关指标数据表
一、散点图
白杨树重量与地点的散点图相关性很弱。
白杨树重量与高度的散点图相关性较强,为正相关。
白杨树重量与直径的散点图相关性很强,为正相关。
二、检验(统计-回归-回归)
回归分析: 重量与直径, 高度, 地点
回归方程为:重量= - 0.185 + 0.513 直径- 0.210 高度+ 0.0019 地点
自变量系数系数标准误T P
常量-0.18477 0.07859 -2.35 0.043
直径0.51276 0.04428 11.58 0.000
高度-0.21012 0.04172 -5.04 0.001
地点0.00193 0.02861 0.07 0.948
S = 0.0469198 R-Sq = 98.9% R-Sq(调整)= 98.6%
方差分析
来源自由度SS MS F P
回归 3 1.85328 0.61776 280.61 0.000
残差误差9 0.01981 0.00220
合计12 1.87309
来源自由度Seq SS
直径 1 1.78807
高度 1 0.06520
地点 1 0.00001
异常观测值
拟合值标准化
观测值直径重量拟合值标准误残差残差
2 2.12 0.1500 0.242
3 0.022
4 -0.0923 -2.24R
R 表示此观测值含有大的标准化残差
因地点的P值大于0.05,无法通过回归方程检验,故剔除自变量“地点”。回归分析: 重量与直径, 高度
回归方程为:重量= - 0.181 + 0.514 直径- 0.211 高度
回归分析举例
回归分析举例
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。
回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部分详细解释这一点。
我们为什么使用回归分析?
如上所述,回归分析估计了两个或多个变量之间的关系。下面,让我们举一个简单的例子来理解它:
比如说,在当前的经济条件下,你要估计一家公司的销售额增长情况。现在,你有公司最新的数据,这些数据显示出销售额增长大约是经济增长的2.5倍。那么使用回归分析,我们就可以根据当前和过去的信息来预测未来公司的销售情况。
使用回归分析的好处良多。具体如下:
1.它表明自变量和因变量之间的显著关系;
2.它表明多个自变量对一个因变量的影响强度。
回归分析也允许我们去比较那些衡量不同尺度的变量之间的相互影响,如价格变动与促销活动数量之间联系。这些有利于帮助市场研究人员,数据分析人员以及数据科学家排除并估计出一组最佳的变量,用来构建预测模型。
我们有多少种回归技术?
有各种各样的回归技术用于预测。这些技术主要有三个度量(自变量的个数,因变量的类型以及回归线的形状)。我们将在下面的部分详细讨论它们。
对于那些有创意的人,如果你觉得有必要使用上面这些参数的一个组合,你甚至可以创造出一个没有被使用过的回归模型。但在你开始之前,先了解如下最常用的回归方法:
简单回归分析(4)
24
来自百度文库 总体回归系数b的假设检验-方差分析*
Y
(x,y)
y=a+bx
y -y
y -y
y
Y
y -y
(y-y)=(y-y)+(y-y)
方差齐性(equal variance):对于任何x值,随机变量y的方差
y|x2相等
N(my|x, sy|x2)
LINE 假定 y
y|x = α + x
9
x
三、回归参数的估计
根据一个给定的包含n对X和Y观测数据的样本,可以建立 样本回归直线
但是并非所有实际测量值y都在该回归线上,即实测值与 直线估计值间存在误差——残差
由于上述可信区间的 特点,当所有可信区 间的上下限相连接后 就会形成一个弧形的 区带,称为my|x的置信 带(confidence band)
34
总体回归线的95%置信带
例如年龄为12时,其所对应的尿肌酐均值为 3.332(y hat);总体均值 (my|x)的95%可信区间为 3.080~3.584 mmol/24h
R2=SS回/SS总 取值介于0~1,表示回归解释了因变量变异的比
回归计算公式
回归计算公式
回归计算公式是统计学中常用的一种方法,用于分析两个或多个变量之间的关系。回归分析可以帮助我们预测一个变量的值,基于另一个或多个变量的值。在本文中,我们将详细介绍回归计算公式及其应用。
回归计算公式可以表示为:
y = a + bx
其中,y是我们要预测的变量,x是用于预测y的变量,a是截距,b是斜率。回归分析的目的是找到最佳的a和b值,以最小化预测误差。
回归分析可以分为两种类型:简单线性回归和多元回归。简单线性回归是指只有一个自变量和一个因变量的情况。多元回归是指有多个自变量和一个因变量的情况。
在简单线性回归中,我们可以使用最小二乘法来计算a和b的值。最小二乘法是一种优化方法,用于最小化预测误差的平方和。我们可以使用以下公式来计算a和b的值:
b = Σ((xi - x̄)(yi - ȳ)) / Σ(xi - x̄)²
a = ȳ -
b x̄
其中,xi是自变量的值,yi是因变量的值,x̄是自变量的平均值,ȳ是因变量的平均值。
在多元回归中,我们可以使用多元线性回归来计算a和b的值。多元线性回归是指有多个自变量和一个因变量的情况。我们可以使用以下公式来计算a和b的值:
y = a + b1x1 + b2x2 + ... + bnxn
其中,x1,x2,...,xn是自变量的值,b1,b2,...,bn是自变量的系数,a是截距。
回归分析可以应用于各种领域,例如经济学、金融学、医学、社会科学等。在经济学中,回归分析可以用于预测股票价格、通货膨胀率等。在医学中,回归分析可以用于预测疾病的发生率、治疗效果等。
统计学回归分析公式整理
统计学回归分析公式整理
回归分析是一种常用的统计学方法,用于探究变量之间的关系和预测未来的结果。在回归分析中,我们通常会使用一些公式来计算相关的统计量和参数估计。本文将对统计学回归分析常用的公式进行整理和介绍。
一、简单线性回归
简单线性回归是最基本的回归分析方法,用于研究两个变量之间的线性关系。其回归方程可以表示为:
Y = β0 + β1X + ε
其中,Y代表因变量,X代表自变量,β0和β1分别是回归方程的截距和斜率,ε表示随机误差。
常用的统计学公式如下:
1.1 残差的计算公式
残差是观测值与回归直线之间的差异,可以通过以下公式计算:残差 = Y - (β0 + β1X)
1.2 回归系数的估计公式
回归系数可以通过最小二乘法估计得到,具体的公式如下:
β1 = Σ((Xi - X均值)(Yi - Y均值)) / Σ((Xi - X均值)^2)
β0 = Y均值 - β1 * X均值
其中,Σ表示求和运算,Xi和Yi分别表示第i个观测值的自变量和
因变量,X均值和Y均值表示自变量和因变量的平均数。
1.3 相关系数的计算公式
相关系数用于衡量两个变量之间的线性关系的强度和方向,可以通
过以下公式计算:
相关系数= Σ((Xi - X均值)(Yi - Y均值)) / (n * σX * σY)
其中,n表示样本量,σX和σY分别表示自变量和因变量的标准差。
二、多元线性回归
多元线性回归是扩展了简单线性回归的一种方法,可以用于研究多
个自变量和一个因变量之间的关系。
2.1 多元线性回归模型
多元线性回归模型可以表示为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例9-3】-【例9-8】简单回归分析计算举例
利用例9-1的表9-1中已给出我国历年城镇居民人均消费支出和人均可支配收入的数据,(1)估计我国城镇居民的边际消费倾向和基础消费水平。
(2)计算我国城镇居民消费函数的总体方差S2和回归估计标准差S。
(3)对我国城镇居民边际消费倾向进行置信度为95%的区间估计。(4)计算样本回归方程的决定系数。
(5)以5%的显著水平检验可支配收入是否对消费支出有显著影响;对Ho:β2=0.7,H1:β2<0.7进行检验。
(6)假定已知某居民家庭的年人均可支配收入为8千元,要求利用例9-3中拟合的样本回归方程与有关数据,计算该居民家庭置信度为95%的年人均消费支出的预测区间。
解:
(1)教材中的【例9-3】
Yt=β1+β2Xt+u t
将表9-1中合计栏的有关数据代入(9.19)和(9.20)式,可
得:
==0.6724
=97.228÷14-0.6724×129.009÷14=0. 7489
样本回归方程为:
=0.7489+0.6724Xt
上式中:0.6724是边际消费倾向,表示人均可支配收入每增加1千元,人均消费支出会增加0.6724千元;0.7489是基本消费水平,即与收入无关最基本的人均消费为0.7489千元。
(2)教材中的【例9-4】
将例9-1中给出的有关数据和以上得到的回归系数估计值代入
(9.23)式,得:
=771.9598-0.7489×97.228-0. 6724×1039.683=0.0808
将以上结果代入(9.21)式,可得:
S2=0.0808/(14-2)=0.006732
进而有:S==0.082047
(3)教材中的【例9-5】 将前面已求得的有关数据代入(9.34)式,可得:
=0.082047÷=0.0056
查t分布表可知:显著水平为5%,自由度为12的t分布双侧临
界值是2.1788,前面已求得,将其代入(9.32)式,可得:即:
(4)教材中的【例9-6】
r2=1 - = 1- =0.9992
上式中的SST是利用表9-1中给出的数据按下式计算的:
SST=∑-(∑Yt)2/n
=771.9598-(97.228)2÷14=96.7252
(5)教材中的【例9-7】
首先,检验收入对消费支出是否有显著影响,提出假设 Ho:β2=0,H1:β2≠0。
利用(9.40)式计算t值
=0. 0.6724/0.0056=119.82
查t分布表可知:显著水平为5%,自由度为12的双侧t检验的临界值是2.178。以上计算的t值远远大于此临界值,所以拒绝原假设,接受备择假设,即认为可支配收入对消费支出的影响是非常显著的。
其次,对边际消费倾向是否明显小于0.7进行检验。
利用(9.40)式计算t值
=(0. 6724-0.7)/ 0.0056=-4.9210
查t分布表可知:显著水平为5%,自由度为12的单侧t检验的临界值是1.782。因为计算的t值的绝对值大于此临界值,所以否定β2=0.7的原假设,接受备择假设,认为我国城镇居民的平均消费倾向小于0.7。
(6)教材中的【例9-8】
将有关数据代入拟合好的样本回归方程,可得:
=0.7489+0.6724Xf
=0.7489+0.6724×8=6.1280(千元)
从前面几例的结果可知: S=0.0820
, n=14,
213.7673
,将其代入求预测标准误差估计值的公式(9.47)式,有
Sef=0.0820=0.0852 (千元)
查t分布表可知:显著水平为5%,自由度为12的双侧t检验的临界值是2. 178。因此,当人均可支配收入为8千元时,置信度为95 %的消费支出的预测区间如下:
6.1280-2.178×0.0852≤Yf≤6.1280+2. 178×0.0852
5.9424(千元)≤Yf≤
6.3135(千元)