第十一章 一元线性回归分析

合集下载

一元回归分析

一元回归分析

一元回归分析1. 简介回归分析是统计学中重要的分析方法之一,用于研究变量之间的关系。

在回归分析中,一元回归是指只涉及一个自变量和一个因变量的分析。

一元回归分析的目的是建立一个数学模型,描述自变量对因变量的影响关系,并通过拟合数据来确定模型的参数。

通过一元回归分析,我们可以研究自变量和因变量之间的线性关系,预测因变量的值,并进行因变量的控制。

2. 原理2.1 线性回归模型一元线性回归模型假设自变量和因变量之间存在线性关系,可以用以下方程来表示:Y = β0 + β1 * X + ε其中,Y 表示因变量,X 表示自变量,β0 和β1 分别表示模型的截距和斜率,ε 表示误差项。

2.2 最小二乘法拟合回归模型的常用方法是最小二乘法。

最小二乘法的目标是通过最小化残差平方和来确定模型的参数。

残差是指观测值与模型预测值之间的差异。

最小二乘法通过计算观测值与回归线之间的垂直距离来确定参数值,使得这些距离的平方和最小化。

3. 回归分析步骤一元回归分析通常包括以下步骤:3.1 数据收集收集与研究问题相关的数据。

数据包括自变量和因变量的观测值。

3.2 模型设定根据问题和数据,选择适当的回归模型。

对于一元回归分析,选择一元线性回归模型。

3.3 模型估计利用最小二乘法估计模型的参数值。

最小二乘法将通过最小化残差平方和来确定参数值。

3.4 模型诊断对拟合的模型进行诊断,检查模型是否满足回归假设。

常见的诊断方法包括检查残差的正态分布性、检查残差与自变量的关系等。

3.5 结果解释解释模型的结果,包括参数估计值、模型拟合程度、因变量的预测等。

3.6 模型应用利用拟合的模型进行预测、推断或决策。

4. 注意事项在进行一元回归分析时,需要注意以下几点:•数据的收集应当尽可能准确和全面,以确保分析的可靠性;•模型的设定应当符合问题的实际情况,并选择合适的函数形式;•模型诊断是确定模型是否可靠的重要步骤,需要进行多种检验;•需要注意回归分析的局限性,不能因为有了一元回归模型就能解释所有的问题。

管理统计学习题参考答案第十一章

管理统计学习题参考答案第十一章

十一章1. 解:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。

回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;在线性回归中,按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。

如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多元线性回归分析。

相关分析,相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。

相关分析和回归分析是研究客观现象之间数量联系的重要统计方法。

既可以从描述统计的角度,也可以从推断统计的角度来说明。

所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。

所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。

它们具有共同的研究对象,在具体应用时,相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。

只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

由于相关分析不能指出变量间相互关系的具体形式,所以回归分析要对具有相关关系的变量之间的数量联系进行测定,从而为估算和预测提供了一个重要的方法。

在有关管理问题的定量分析中,推断统计加具有更加广泛的应用价值。

需要指出的是,相关分析和回归分析只是定量分析的手段。

通过相关与回归分析,虽然可以从数量上反映现象之间的联系形式及其密切程度,但是现象内在联系的判断和因果关系的确定,必须以有关学科的理论为指导,结合专业知识和实际经验进行分析研究,才能正确解决。

因此,在应用时要把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。

一元线性回归PPT演示课件

一元线性回归PPT演示课件

196.2
15.8
16.0
102.2
12.0
10.0
本年固定资产投资额 (亿元) 51.9 90.9 73.7 14.5 63.2 2.2 20.2 43.8 55.9 64.3 42.7 76.7 22.8 117.1 146.7 29.9 42.1 25.3 13.4 64.3 163.9 44.5 67.9 39.7 97.1
6. r 愈大,表示相关关系愈密切.
例 11.7
根据例11.6的样本数据,计算不良贷款、贷款余额、应收 贷款、贷款项目、固定资产投资额之间的相关系数.
解:用Excel计算的相关系数矩阵如下.
三、相关系数的显著性检验
(一) r 的抽样分布
当样本数据来自正态总体,且 0 时,则
t r n 2 ~ t(n 2) 1 r2
时,yˆ ˆ0 .
二、参数的最小二乘估计
假定样本数据 (xi , yi ) , i 1,2,, n ,满足一元线性回归模 型, 根据(11.6)式则样本回归方程为
yˆi ˆ0 ˆ1xi , i 1,2,, n
(11.7)
最小二乘法是使因变量的观察值 yi 与估计值 yˆi 之间的离差平
i1 i1
n
n
n
n
n xi2 ( xi )2 n yi2 ( yi )2
i 1
i 1
i 1
i 1
( 11.1 ) ( 10.2 )
相关系数的取值范围及意义
1. r 的取值范围为[-1,1].
2. r 1 ,称完全相关,既存在线性函数关系.
r =1,称完全正相关. r =-1,称完全负相关. 3. r =0,称零相关,既不存在线性相关关系. 4. r <0,称负相关. 5. r >0,称正相关.

第11章 一元线性回归分析

第11章 一元线性回归分析
统计学
第11章 一元线性回归
方差分析能做什么? 不能做什么?

可以做:

比较多个总体均值是否相等。 一个或两个分类自变量对因变量是否有影响? 不能揭示因素之间的更确切的规律。 不能用于预测未知。

不可做:

回归分析
第11章 一元线性回归
11.1 11.2 11.3 11.4 变量间关系的度量 一元线性回归 利用回归方程进行预测 残差分析
高尔顿(Francis Galton)

达尔文的表弟。 “优生学的创始人” 在统计学方面的贡献


高尔顿在1877年提出回归到平均值(regression toward the mean)现象的存在,这个概念与现代统计学中的“回归” 并不相同,但是却是回归一词的起源。 在此后的研究中,高尔顿第一次使用了相关系数 (correlation coefficient)的概念。他使用字母“r”来表示相 关系数,这个传统一直延续至今。

变量间的函数关系与相关关系在一定条件下可 以相互转化。
当存在测量误差或随机因素的干扰时,函数关系有可能 表现为相关关系; 当我们对变量内在联系的规律性认识更深刻时,相关关 系有可能转化为函数关系或用函数关系来描述。
真实的相关关系 扭曲的因果关系
11.1.2 相关关系的描述与测 度
1. 散点图 2. 相关系数
11.1.3 相关系数的显著性检验
检验总体相关系数 ,要了解: - 样本相关系数 r服从何种分布
总体数据服从何种分布 样本容量n大小 总体正态分布,样本容量n较大, r →正态分布 - →0,则r→正态分布 - 远离0,样本容量n非常大, 则r →正态分布 →1, 则 r 是有偏分布 - →1,则r →左偏分布 - →-1,则r →右偏分布

一元线性回归分析

一元线性回归分析

一元线性回归分析摘要:一元线性回归分析是一种常用的预测和建模技术,广泛应用于各个领域,如经济学、统计学、金融学等。

本文将详细介绍一元线性回归分析的基本概念、模型建立、参数估计和模型检验等方面内容,并通过一个具体的案例来说明如何应用一元线性回归分析进行数据分析和预测。

1. 引言1.1 背景一元线性回归分析是通过建立一个线性模型,来描述自变量和因变量之间的关系。

通过分析模型的拟合程度和参数估计值,我们可以了解自变量对因变量的影响,并进行预测和决策。

1.2 目的本文的目的是介绍一元线性回归分析的基本原理、建模过程和应用方法,帮助读者了解和应用这一常用的数据分析技术。

2. 一元线性回归模型2.1 模型表达式一元线性回归模型的基本形式为:Y = β0 + β1X + ε其中,Y是因变量,X是自变量,β0和β1是回归系数,ε是误差项。

2.2 模型假设一元线性回归模型的基本假设包括:- 线性关系假设:自变量X与因变量Y之间存在线性关系。

- 独立性假设:每个观测值之间相互独立。

- 正态性假设:误差项ε服从正态分布。

- 同方差性假设:每个自变量取值下的误差项具有相同的方差。

3. 一元线性回归分析步骤3.1 数据收集和整理在进行一元线性回归分析之前,需要收集相关的自变量和因变量数据,并对数据进行整理和清洗,以保证数据的准确性和可用性。

3.2 模型建立通过将数据代入一元线性回归模型的表达式,可以得到回归方程的具体形式。

根据实际需求和数据特点,选择适当的变量和函数形式,建立最优的回归模型。

3.3 参数估计利用最小二乘法或最大似然法等统计方法,估计回归模型中的参数。

通过最小化观测值与回归模型预测值之间的差异,找到最优的参数估计值。

3.4 模型检验通过对回归模型的拟合程度进行检验,评估模型的准确性和可靠性。

常用的检验方法包括:残差分析、显著性检验、回归系数的显著性检验等。

4. 一元线性回归分析实例为了更好地理解一元线性回归分析的应用,我们以房价和房屋面积之间的关系为例进行分析。

一元线性回归分析

一元线性回归分析

S xx xi2 nx 2 218500 10 1452 8250 S xy xi yi nx y 101570 10 145 67.3
i 1
3985 ˆ S xy 3985 0.483 b S xx 8250 ˆ ˆ a y xb 67.3 145 0.483 2.735
这里45.394>2.306,即|t|值在H0的拒绝域内,故 拒绝H0 ,说明回归效果是显著的。 b的置信度为0.95(=0.05)的置信区间为 0.934 0.934 (b, b ) 0.483 2.306 , 0.483 2.306 8250 8250
i 1 n 2 n
2
ˆ ˆ yi y yi yi
i 1 i 1
2
S回 Qe
18
线性回归的方差分析
回归平方和
残差平方和
ˆ S回 yi y
i 1 n
n
2
ˆ Qe yi yi
i 1
2
Syy自由度为n-1, Qe自由度为n-2, S回自由度为1
平方和 1924.6 7.5 1932.1
自由度
均方
F比
回归 残差 总和
1 8 9
1924.6 0.94
2047.4
30
对=0.01,查出F0.01(1,8)=11.26 因为2047.3 >>11.26,所以回归效果是 非常显著的。
六、利用回归方程进行预报(预测) 回归问题中Y是随机变量,x是普通 变量。回归方程 y a bx 是Y对x的依赖 ˆ ˆ ˆ 关系的一个估计。对给定的x值,用回归 方程确定Y的值,叫预报。

一元线性回归分析

一元线性回归分析
一元线性回归分析是通过一个普通变量的线性关系式来估计、预测一个随机变量的观测值的统计分析方法。首先,通过试验获取普通变量x与随机变量y的实测数据,并绘制散点图来观察它们之间的相关关系。如果发现这些点大致分布在一条直线附近,那么可以用这条直线来近似表示y与x之间的关系,即建立y对x的一元线性回归方程。为了确定回归方程中的回归系数,采用最小二乘法,通过求解偏导数方程组,找到使误差平方和达到最小值的a,b。最终得到的回归方程为y=a+bx,其中a,b为回归系数,可通过公式计算得出。整个过程中,还涉及到了散点图的绘制、回归直线的确定、以及最小二乘法原理的应用等关键步骤。这些步骤共同构成了具。

一元线性回归分析PPT课件

一元线性回归分析PPT课件
第18页/共40页
拟合程度评价
拟合程度是指样本观测值聚集在样本回归线周围的紧
密程度. ( Y t Y ) ( Y ˆ t Y ) ( Y t Y ˆ t)
n
n
n
(Y t Y )2 (Y ˆt Y )2 (Y t Y ˆ)2
t 1
t 1
t 1
n
(Yt Y)2 :总离差平方和,记为SST;
t1
n
第8页/共40页

食品序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
求和
脂肪Xt 4 6 6 8 19 11 12 12 26 21 11 16 14 9 9 5
热量Yt 110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120
第1页/共40页
回归分析的分类
一个自变量
一元回归
回归分析
两个及以上自变量
多元回归
线性 回归
非线性 回归
线性 回归
非线性 回归
第2页/共40页
一元线性回归模型
(一)总体回归函数
Yt=0+1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的 随机变量,反映未列入方程式的其他各种因素对Y的 影响。
(ˆ1t(n2)Sˆ1)
2
第15页/共40页
回归分析的Excel实现
“工具”->“数据分析”->“回归”
第16页/共40页
ˆ 0
S ˆ 0
ˆ 1
S ˆ 1
(ˆ0t(n2)Sˆ0)
2
(ˆ1t(n2)Sˆ1)
2
第17页/共40页

贾俊平第四版统计学-第十一章一元线性回归练习答案

贾俊平第四版统计学-第十一章一元线性回归练习答案

第十一章一元线性回归练习题答案二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验;t 检验;2.图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。

三.计算题1.(1) SSR 的自由度是1,SSE 的自由度是18。

(2)2418/6080220/1/==-=SSE SSR F(3)判定系数%14.57140802===SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。

(4)7559.05714.02-=-=-=R r相关系数为-0.7559。

(5)线性关系显著和:线性关系不显著和y x y x H 10H :因为414.424=>=αF F,所以拒绝原假设,x 与y 之间的线性关系显著。

2.(1)方差分析表df SS MS F Significance F回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计16500---(2)判定系数%8585.05004252====SST SSR R表明在维护费用的变差中,有85%的变差可由使用年限来解释。

(3)9220.085.02===R r二者相关系数为0.9220,属于高度相关(4)x y248.1388.6ˆ+= 分布;显著。

的自由度为t n r n r t 2);12||2---=回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。

(5)线性关系显著性检验:线性关系显著:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H因为Significance F=0.017<05.0=α,所以线性关系显著。

(6)348.3120248.1388.6248.1388.6ˆ==⨯++=x y当产量为10时,生产费用为31.348万元。

一元线性回归分析的原理

一元线性回归分析的原理

一元线性回归分析的原理
一元线性回归分析是一种用于研究变量之间相互关系的统计分析方法。

它旨在
在一组数据中,以一个线性方程的式子去拟合变量之间的关系。

借此,分析一个独立变量(即自变量)和一个取决变量(即因变量)之间的关系,求出最合适的回归系数。

一元线性回归分析可以用来发现和描述变量之间的复杂方程式,用来估计参数,以及构建预测模型。

具体而言,一元线性回归分析指的是自变量和因变量之间有线性关系的回归分析。

也就是说,自变量和因变量均遵从一元线性方程,也就是y=βx+α,其中y
为因变量,x为自变量,β为系数,α为常数。

通过一元线性回归分析可以精确
的定义出变量之间的关系,从而可以得出最佳的回归系数和常数,并估计每个参数。

一元线性回归分析用于研究很多方面,例如决策科学、经济学和政治学等领域。

例如,在政治学研究中,可以使用一元线性回归分析来分析政府的软性政策是否能够促进社会发展,以及社会福利是否会影响民众的投票行为。

在经济学研究中,则可以使用一元线性回归分析来检验价格是否会影响消费水平,或检验工资水平是否会影响经济增长率等。

总结而言,一元线性回归分析是一种有效的研究变量之间关系的统计分析方法,精确地检验独立变量和取决变量之间的关系,从而求得最合适的回归系数和常数,并用该回归方程式构建预测模型,为决策提供参考。

第11章一元线性回归剖析

第11章一元线性回归剖析

相关关系
(类型)
相关关系
线性相关 非线性相关 完全相关 不相关
正相关 负相关
正相关 负相关
相关关系的描述与测度
(散点图)
相关分析及其假定
1. 相关分析要解决的问题
变量之间是否存在关系? 如果存在关系,它们之间是什么样的关系? 变量之间的关系强度如何? 样本所反映的变量之间的关系能否代表总体变量之
(不良贷款对其他变量的散点图)
不良贷款
14
12
10
8பைடு நூலகம்
6
4
2
0
0
100
200
300
400
贷款余额 不良贷款与贷款余额的散点图
14
12
10
8
6
4
2
0 0
10
20
30
40
贷款项目个数
不良贷款与贷款项目个数的散点图
不良贷款
不良贷款
14
12
10
8
6
4
2
0 0
10
20
30
累计应收贷款
不良贷款与累计应收贷款的散点图
第11章 一元线性回归
第11章 一元线性回归
11.1 变量间关系的度量 11.2 一元线性回归 11.3 利用回归方程进行估计和预测 11.4 残差分析
学习目标
1. 相关关系的分析方法 2. 一元线性回归的基本原理和参数的最小
二乘估计 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 6. 用 Excel 进行回归
性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着, r=0只表示两个变 量之间不存在线性相关关系,并不说明变量之间 没有任何关系

一元线性回归分析

一元线性回归分析

9--36
判定系数与回归估计标准差的计算
根据前述计算公式计算判定系数与回归估计标准差 ,需先根据样本回归方程计算出 X 的各观测值 xi 对 应的回归估计值 yi ,计算过程比较繁琐。
借助于 EXCEL 的“回归”分析工具可轻松得到其数 值。显示在 EXCEL 的回归输出结果的第一部分
判定系数( R Square )
也称为可解释的平方和。
3. 残差平方和( SSE 、 Q )
反映除 x 以外的其他因素对 y 取值的影 响,
9--29
可决系数(判定系数 r2 或
R2 )
1. 可决系数 = 回归平方和占总离差平方和的
比例
r2
SSR SST
ቤተ መጻሕፍቲ ባይዱ
回归平方和 总离差平方和
1
残差平方和 总离差平方和
综合度量回归方程对样本观测值拟合优度, 衡量变量之间的相关程度。
称为古典线性回归模型。
9--12
2. 样本回归方程( SRF )
实际中只能通过样本信息去估计总体回归方程的参 数。


线
性回归的
yˆi ˆ

本ˆx回i


a

的形
bxi


ˆ a, ˆ b 是样本回归方程的截距和斜率
yˆ ; i 是与 xi 相对应的 Y 的条件均值的估计 ; 9--13
样本回归方程与总体回归方程之关系
i 1
n2
�n ( yi yˆi ) 2
i 1
n2
9--34
回归估计标准差的作用
1. 反映实际观察值在回归直线周围的分散状 况;反映因变量各实际值与其回归估计值之

2021年统计学(贾5)课后练答案(11-14章)

2021年统计学(贾5)课后练答案(11-14章)

第11章 一元线性回归分析欧阳光明(2021.03.07)11.1(1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)920232.0=r(3) 检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

11.2(1)散点图(略)。

11.3 (1)0ˆβ表示当0=x 时y 的期望值。

(2)1ˆβ表示x 每变动一个单位y 平均下降0.5个单位。

11.4 (1)%902=R(2)1=e s11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态: (2)计算线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

解:(1)可能存在线性关系。

(2)x 运送距离(km )y 运送时间(天) x 运送距离(km )Pearson 相关性 1.949(**) 显著性(双侧)0.000 N10 10 y 运送时间(天)Pearson 相关性 .949(**) 1显著性(双侧) 0.000 N**. 在 .01 水平(双侧)上显著相关。

有很强的线性关系。

(3)模型非标准化系数标准化系数t 显著性B标准误Beta1(常量) 0.118 0.355 0.333 0.748 x 运送距离(km )a. 因变量: y 运送时间(天)回归系数的含义:每公里增加0.004天。

11.6 下面是7个地区2000年的人均国内生产总值(GDP )和人均消费水要求:(1)人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

第十一章-一元线性回归分析

第十一章-一元线性回归分析

第十一章一元线性回归11.1从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)1 40 130 7 84 1652 42 150 8 100 1703 50 155 9 116 1674 55 140 10 125 1805 65 150 11 130 1756 78 154 12 140 185要求:(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。

(2)计算产量与生产费用之间的线性相关系数。

(3)对相关系数的显著性进行检验(α = 0.05),并说明二者之间的关系强度。

解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:从散点图的形态可知,产量与生产费用之间存在正的线性相关。

(2)利用Excel的数据分析中的相关系数功能,得到产量与生产费用的线性相关系数r = 0.920232。

(3)计算t统计量,得到t = 7.435453,在α = 0.05的显著性水平下,临界值为2.6337,统计量远大于临界值,拒绝原假设,产量与生产费用之间存在显著的正线性相关关系。

r大于0.8,高度相关。

11.2 学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,以为研究者抽取了由8名学生构成的一个随机样本,得到的数据如下:复习时间x考试分数y20 6416 6134 8423 7027 8832 9218 7222 77要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。

(2)计算相关系数,说明两个变量之间的关系强度。

解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:从散点图的形态来看,考试分数与复习时间之间似乎存在正的线性相关关系。

(2)r = 0.862109,大于0.8,高度相关。

11.3根据一组数据建立的线性回归方程为ˆ100.5=-。

y x要求:ˆβ的意义。

一元线性回归模型案例分析

一元线性回归模型案例分析

一元线性回归模型案例分析一、研究的目的要求居民消费在社会经济的持续发展中有着重要的作用。

居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。

改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。

但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。

例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。

为了研究全国居民消费水平及其变动的原因,需要作具体的分析。

影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。

为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。

二、模型设定我们研究的对象是各地区居民消费的差异。

居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。

而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。

所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。

因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。

因此建立的是2002年截面数据模型。

影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十一章一元线性回归11.1从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)1 40 130 7 84 1652 42 150 8 100 1703 50 155 9 116 1674 55 140 10 125 1805 65 150 11 130 1756 78 154 12 140 185要求:(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。

(2)计算产量与生产费用之间的线性相关系数。

(3)对相关系数的显著性进行检验(α = 0.05),并说明二者之间的关系强度。

解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:从散点图的形态可知,产量与生产费用之间存在正的线性相关。

(2)利用Excel的数据分析中的相关系数功能,得到产量与生产费用的线性相关系数r = 0.920232。

(3)计算t统计量,得到t = 7.435453,在α = 0.05的显著性水平下,临界值为2.6337,统计量远大于临界值,拒绝原假设,产量与生产费用之间存在显著的正线性相关关系。

r大于0.8,高度相关。

11.2 学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,以为研究者抽取了由8名学生构成的一个随机样本,得到的数据如下:复习时间x考试分数y20 6416 6134 8423 7027 8832 9218 7222 77要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。

(2)计算相关系数,说明两个变量之间的关系强度。

解:(1)利用Excel的散点图绘制功能,绘制的散点图如下:从散点图的形态来看,考试分数与复习时间之间似乎存在正的线性相关关系。

(2)r = 0.862109,大于0.8,高度相关。

11.3根据一组数据建立的线性回归方程为ˆ100.5=-。

y x要求:ˆβ的意义。

(1)解释截距ˆβ意义。

(2)解释斜率1(3)计算当x = 6时的E(y)。

解:(1)在回归模型中,一般不能对截距项赋予意义。

ˆβ的意义为:当x增加1时,y减小0.5。

(2)斜率1(3)当x = 6时,E(y) = 10 – 0.5 * 6 = 7。

11.4 设SSR = 36,SSE = 4,n = 18。

要求:(1)计算判定系数R2并解释其意义。

(2)计算估计标准误差s e并解释其意义。

解:SST = SSR+SSE = 36+4 = 40,R2 = SSR / SST = 36 /40 = 0.9,意义为自变量可解释因变量变异的90%,自因变量与自变量之间存在很高的线性相关关系。

s== 0.5,这是随机项的标准误差的估计值。

(2)e11.5一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,因此,他抽出了公司最近10辆卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:12155.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态。

(2)计算线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

解:(1)利用Excel 绘制散点图,如下:从散点图的形态来看,运送时间和运送距离之间存在正的线性相关关系。

(2)计算的相关系数为0.9489,这是一个很高的相关系数。

(3)用OLS 方法估计得到模型参数为0ˆβ= 0.118129,1ˆβ= 0.003585, 回归方程为:运送时间 = 0.118129 + 0.003*运送距离,意义为:运送距离每增加1km ,运送时间增加0.003383天,即0.086小时。

11.6 下面是7个地区2000年的人均国内生产总值(GDP )和人均消费水平的统计数据:地区 人均GDP (元)人均消费水平(元)北京22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州26621608陕西 4549 2035要求:(1)人均GDP 作自变量,人均消费水平左因变量,绘制散点图,并说明二者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(α = 0.05)。

(6)如果某地区的人均GDP 为5000元,预测其人均消费水平。

(7)求人均GDP 为5000元时,人均消费水平95%的置信区间和预测区间。

解:(1)利用Excel 绘制的散点图如下:从散点图来看,人均消费水平与人均GDP 之间存在很强的正线性相关关系。

(2)r = 0.998,高度相关。

(3)用OLS 方法估计得到模型参数为0ˆβ= 734.69,1ˆβ= 0.308,回归方程为:人均消费水平 = 734.69 + 0.308*人均GDP ,意义为:人均GDP 每增加1元,人均消费水平增加0.31元,此值即为经济学中的边际消费倾向。

这里截距可解释为人均GDP 为0时,居民的消费支出为734元/年,即经济学中的自发支出。

(4)判定系数R 2 = 0.996,人均消费水平变异的99%可由人均GDP 来解释。

(5)这是一个一元线性回归模型,只需要检验斜率系数的显著性即可。

斜率系数的t 统计量1ˆ0.308/0.0085=36.49et s β==, 显著性水平为0.05,自由度为7-2=5,临界值为3.16,统计量远大于临界值,是高度显著的。

(6)将人均GDP 代入到估计的回归方程,计算得到人均消费水平的期望值为2278元。

(7)查表得2(72) 2.570582t α-=,点估计值为2278元,标准误差为247.3035, 人均消费水平95%的置信区间为22782278287.27±=± 即(1990.73,2565.27)。

而人均消费水平95%的预测区间为22782278697.21±=± 即区间(1580.79,2975.21),对个别值的预测精确度比对总体均值的预测低。

11.7 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据如下:要求:(1)绘制散点图,说明二者之间的关系形态。

(2)用航班正点率左自变量,顾客投诉次数左因变量,求出估计的回归方程,并解释回归系数的意义。

(3)检验回归系数的限制性(α=0.05)。

(4)如果航班正点率为80%,估计顾客投诉次数。

(5)求航班正点率为80%时,顾客投诉次数95%的置信区间和预测区间。

解:(1)散点图如下。

从散点图的形态来看,航班正点率与顾客投诉次数之间有负的线性相关关系。

(2)用Excel 回归分析,得到估计的回归方程如下:=430.1892 4.70062*-顾客投诉次数航班正点率斜率系数为-4.70062,表示航班正点率提高1个百分点,顾客投诉次数减少4.7次。

符号为负,与理论相符。

截距系数一般不赋予意义。

(3)一元回归只要检验斜率系数的显著性即可。

斜率西数的t 统计量为1ˆ 4.70062/0.947894= 4.95902et s β==-- 相应的P 值为0.001108,小于0.05,t 统计量是显著的。

(4)由估计的回归方程,得到果航班正点率为80%,估计顾客投诉次数为 430.1892 - 4.70062*80 = 54.1396(次)(5)查表得2(102) 2.306004tα-=,点估计值为54.1396元,标准误差为18.887,故置信区间为54.139616.47989±±即区间(37.6597,70.61949)。

而预测区间为54.139646.56756±±即区间(7.57204,100.7071)11.8下面是20个城市写字楼由出租率和每平方米月租金的数据。

设月租金为自变量,出租率为因变量,用Excel进行回归,并对结果进行解释和分析。

解:回归分析结果如下:SUMMARY OUTPUT回归统计Multiple R 0.79508R Square 0.632151Adjusted R Square 0.611715标准误差2.685819观测值20方差分析df SS MS FSignifica nce F回归分析1223.1403223.140330.933182.8E-05残差18129.84527.213622总计19352.9 855Coeffi cients标准误差t StatP-valueLower95%Upper95%下限95.0%Intercept 49.317683.80501612.961231.45E-1041.3236457.3117241.32364X Variable 10.2492230.044815.5617612.8E-050.155080.3433650.15508结果分析如下:(1)斜率系数的t统计量在95%的显著性水平下是高度显著的,斜率系数等于0.2492,表示每平方米月租金提高1元,出租率将提高0.2492个百分点。

(2)判断系数R2等于6321,表示出租率的变异可由月租金解释63.21%。

判断系数不算很高,可能还有其它的变量影响出租率。

11.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。

通过计算得到下面的有关结果:方差分析表参数估计表要求:(1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显著性(α=0.05)。

解:(1)此为一元线性回归,由自由度可知,样本容量n = (11+1)=12。

由此可计算各自由度和SS 。

进而计算各均方误,最后计算出F 统计量(MSR/MSE )。

结果如下:方差分析表(2)计算判断系数,21602708.6R =0.97551642866.67SSR SST ==人大出版社《统计学》第四版课后习题参考答案表明销售量的变异有97.55%是由广告费用的变东引起的。

(3)一元线性回归模型中,相关系数等于判断系数的平方根,即r =0.9877。

(4)根据估计得到的模型参数,回归方程如下:ˆ363.68911.420211i i yx =+ 表示广告费用增加1单位,销售量将平均增加1.42单位。

(5)由参数估计表可知,斜率系数的t 统计量等于19.97749,这是一个在显著性水平0.05下高度显著的统计量。

相关文档
最新文档