一元线性回归模型.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
与回归分析密切相联的是相关 分析。相关分析主要测度两个变量 之间的线性关联度,相关系数就是 用来测度两个变量之间的线性关联 程度的。例如,吸烟与肺癌、统计 学成绩与数学成绩、身高与体重等 等之间的相关程度,就可用相关系 数来测度。
而在回归分析中,我们的主要目 的在于根据其它变量的给定值来估 计或预测某一变量的平均值。例如 ,我们想知道能否从一个学生的数 学成绩去预测他的统计学平均成绩 。
在现代,回归一词已演变为一种新 的概念。回归分析就是研究被解释变 量对解释变量的依赖关系,其目的就 是通过解释变量的已知或设定值,去 估计或预测被解释变量的总体均值。 在下面的几个例子中,我们可以清晰 地看到回归分析的实际意义。
1.高尔顿普遍回归定律。高尔顿 的目的在于发现为什么人口的身高 分布有一种稳定性。在现代,我们 并不关心这种解释,我们关心的是: 在给定父辈身高的情形下,找到儿 辈平均身高的变化规律。
就是说,我们如果知道了父辈的 身高,就可预测儿辈的平均身高。 假设我们得到了一组父亲、儿子 身高的数据,制成如下的散点图。 图中按统计分组的方法将父亲身 高分为若干组。
××××× ××××× ××××× cm ×××××
cm
儿 子 身 高 (
)
) (高身亲父
图4.1
给定父亲身高 儿子身高的分 布
1270 1680 2080 2480 2900 3300 3720 4130 4530
1320 1740 2140 2540 2980 3380 3820 4230 4640
(Francis Galton)提出。在一篇研究 父母身高与子女身高相互关系的论文 中,高尔顿发现,虽然有一个趋势, 父母高,子女也高;父母矮,子女也 矮,但给定父母的身高,子女的平均 身高却趋向于或者回归到全体人口的 平均身高。
也就是说,当父母双亲都异常高或 异常矮,则子女的身高有趋向于人 口总体平均身高的趋势。这种现象 被称为高尔顿普遍回归定律。这就 是回归一词的原始含义。
在回归分析中,被解释变量Y 被 当作是随机变量,而解释变量X 则被 看作非随机变量。而在相关分析中, 我们把两个变量都看作是随机变量。
例如 ,在学生的数学成绩与统 计学成绩的分析中,如为回归分析 ,则统计学成绩是随机变量,数学 成绩是非随机变量,即数学成绩被 固定在给定的水平上,以此求得统 计学的平均成绩。而在相关分析中 ,两者处于平等地位,不存在谁为 解释变量,谁为被解释变量的问题 ,两者均为随机变量。
第二节 一元线性回归模型
一、引例
假定我们要研究一个局部区域 的居民消费问题,该区域共有80户 家庭组成,将这80户家庭视为一个 统计总体。
我们研究每月家庭消费支出Y 与 每月可支配收入X 的关系。就是说, 已知家庭每月可支配收入,要预测家 庭每月消费支出的总体平均水平。为 此,将80户家庭分为10组。表4.1给 出了人为数据。
经济计量分析
第四章 一元线性回归模型
本章介绍一元线性回归模型的概 念及一元线性回归模型所依据的理论 与应用。一元线性回归模型只包含一 个解释变量和一个被解释变量,是最 简单的线性回归模型。通过一元线性 回归模型的学习,可较容易地理解回 归分析的基本理论与应用。
第一节 回归分析的相关概念
一、回归的含 义 回归一词最早由F·高尔顿
二、统计关系与确定性关系
如果给定一个变量X的结果值就可 确定另一个变量Y 的结果值,则称变 量Y是变量X 的函数,即X、Y之间是 函数关系。
在经典物理学中,给定电阻Ω,电
流I 和电压V 之间的关系即为函数
关系,即
I V Ω
。这种典型的变量关系就
是确定性关系。
在经济系统中, 这种变量之间的函 数关系或确定性关系就很少见 。常 见的是变量之间是一种不确定的关系, 既使变量X 是变量Y 的原因, 给定变 量X 的值也不能具体确定变量Y的值, 而只能确定变量Y 的统计特征,通常 称变量X 与Y 之间的这种关系为统计 关系。
3.在企业中,我们很想知道人 们对企业产品的需求与广告费开支的 关系。这种研究有助于估计出相对于 广告费支出的需求弹性,即广告费支 出每变化百分之一的需求变化百分比 ,这有助于制定最优广告策略。
4.农业工作需要预计粮食产量, 需要研究粮食产量与播种面积、施 肥量、降雨量之间的依赖关系。
这种一个变量依赖于另一个或多 个变量的事例在经济系统中普遍存 在。回归分析就是要研究这种变量 之间的依存关系。
表4.1 居民收入、消费数据
X
每月家庭可支配收入(元)
Y
100 150 200 250 300 350 400 450 500 550 0 0 0 0 0 0 0 0 00
每
月
1050 1380 1780 2180
2900
家 700 1070 1440 1840 2240 2620 2980 3320 3710 4090
图4.1中对应于设定的父亲身高 ,儿子身高有一个分布范围。随着 父亲身高的增加,儿子的平均身高 也在增加,画一条通过儿子平均身 高的线,说明儿子的平均身高是如 何随着父亲身高的增加而增加的, 这条线就是回归线。
2.在经济学中,经济学家要研 究个人消费支出与个人可支配收入 的依赖关系。这种分析有助于估计 边际消费倾向,就是可支配收入每 增加一元引起消费支出的平均变化 。
例如,企业总产出Y 与企业的资 本投入K 、劳动力投入L 之间的关系 就是统计关系。虽然资本K 和劳动力 L 是影响产出Y 的两大核心要素,但 是给定K 、L 的值并不能确定产出Y 的值。因为,总产出Y 除了受资本投 入K、劳动力投入L 的影响外,还要
受到技源自文库进步、自然条件等其它因素 的影响。
三、回归分析与相关 分析
庭 740 1120 1500 1900 2300 2680 3060 3420 3810 4200
消 780 1170 1560 1960 2360 2740 3140 3520 3910 4310
费 支 出 (元
)
820 860 900 940
1220 1620 2020 2420 2820 3220 3620 4020 4420
而在回归分析中,我们的主要目 的在于根据其它变量的给定值来估 计或预测某一变量的平均值。例如 ,我们想知道能否从一个学生的数 学成绩去预测他的统计学平均成绩 。
在现代,回归一词已演变为一种新 的概念。回归分析就是研究被解释变 量对解释变量的依赖关系,其目的就 是通过解释变量的已知或设定值,去 估计或预测被解释变量的总体均值。 在下面的几个例子中,我们可以清晰 地看到回归分析的实际意义。
1.高尔顿普遍回归定律。高尔顿 的目的在于发现为什么人口的身高 分布有一种稳定性。在现代,我们 并不关心这种解释,我们关心的是: 在给定父辈身高的情形下,找到儿 辈平均身高的变化规律。
就是说,我们如果知道了父辈的 身高,就可预测儿辈的平均身高。 假设我们得到了一组父亲、儿子 身高的数据,制成如下的散点图。 图中按统计分组的方法将父亲身 高分为若干组。
××××× ××××× ××××× cm ×××××
cm
儿 子 身 高 (
)
) (高身亲父
图4.1
给定父亲身高 儿子身高的分 布
1270 1680 2080 2480 2900 3300 3720 4130 4530
1320 1740 2140 2540 2980 3380 3820 4230 4640
(Francis Galton)提出。在一篇研究 父母身高与子女身高相互关系的论文 中,高尔顿发现,虽然有一个趋势, 父母高,子女也高;父母矮,子女也 矮,但给定父母的身高,子女的平均 身高却趋向于或者回归到全体人口的 平均身高。
也就是说,当父母双亲都异常高或 异常矮,则子女的身高有趋向于人 口总体平均身高的趋势。这种现象 被称为高尔顿普遍回归定律。这就 是回归一词的原始含义。
在回归分析中,被解释变量Y 被 当作是随机变量,而解释变量X 则被 看作非随机变量。而在相关分析中, 我们把两个变量都看作是随机变量。
例如 ,在学生的数学成绩与统 计学成绩的分析中,如为回归分析 ,则统计学成绩是随机变量,数学 成绩是非随机变量,即数学成绩被 固定在给定的水平上,以此求得统 计学的平均成绩。而在相关分析中 ,两者处于平等地位,不存在谁为 解释变量,谁为被解释变量的问题 ,两者均为随机变量。
第二节 一元线性回归模型
一、引例
假定我们要研究一个局部区域 的居民消费问题,该区域共有80户 家庭组成,将这80户家庭视为一个 统计总体。
我们研究每月家庭消费支出Y 与 每月可支配收入X 的关系。就是说, 已知家庭每月可支配收入,要预测家 庭每月消费支出的总体平均水平。为 此,将80户家庭分为10组。表4.1给 出了人为数据。
经济计量分析
第四章 一元线性回归模型
本章介绍一元线性回归模型的概 念及一元线性回归模型所依据的理论 与应用。一元线性回归模型只包含一 个解释变量和一个被解释变量,是最 简单的线性回归模型。通过一元线性 回归模型的学习,可较容易地理解回 归分析的基本理论与应用。
第一节 回归分析的相关概念
一、回归的含 义 回归一词最早由F·高尔顿
二、统计关系与确定性关系
如果给定一个变量X的结果值就可 确定另一个变量Y 的结果值,则称变 量Y是变量X 的函数,即X、Y之间是 函数关系。
在经典物理学中,给定电阻Ω,电
流I 和电压V 之间的关系即为函数
关系,即
I V Ω
。这种典型的变量关系就
是确定性关系。
在经济系统中, 这种变量之间的函 数关系或确定性关系就很少见 。常 见的是变量之间是一种不确定的关系, 既使变量X 是变量Y 的原因, 给定变 量X 的值也不能具体确定变量Y的值, 而只能确定变量Y 的统计特征,通常 称变量X 与Y 之间的这种关系为统计 关系。
3.在企业中,我们很想知道人 们对企业产品的需求与广告费开支的 关系。这种研究有助于估计出相对于 广告费支出的需求弹性,即广告费支 出每变化百分之一的需求变化百分比 ,这有助于制定最优广告策略。
4.农业工作需要预计粮食产量, 需要研究粮食产量与播种面积、施 肥量、降雨量之间的依赖关系。
这种一个变量依赖于另一个或多 个变量的事例在经济系统中普遍存 在。回归分析就是要研究这种变量 之间的依存关系。
表4.1 居民收入、消费数据
X
每月家庭可支配收入(元)
Y
100 150 200 250 300 350 400 450 500 550 0 0 0 0 0 0 0 0 00
每
月
1050 1380 1780 2180
2900
家 700 1070 1440 1840 2240 2620 2980 3320 3710 4090
图4.1中对应于设定的父亲身高 ,儿子身高有一个分布范围。随着 父亲身高的增加,儿子的平均身高 也在增加,画一条通过儿子平均身 高的线,说明儿子的平均身高是如 何随着父亲身高的增加而增加的, 这条线就是回归线。
2.在经济学中,经济学家要研 究个人消费支出与个人可支配收入 的依赖关系。这种分析有助于估计 边际消费倾向,就是可支配收入每 增加一元引起消费支出的平均变化 。
例如,企业总产出Y 与企业的资 本投入K 、劳动力投入L 之间的关系 就是统计关系。虽然资本K 和劳动力 L 是影响产出Y 的两大核心要素,但 是给定K 、L 的值并不能确定产出Y 的值。因为,总产出Y 除了受资本投 入K、劳动力投入L 的影响外,还要
受到技源自文库进步、自然条件等其它因素 的影响。
三、回归分析与相关 分析
庭 740 1120 1500 1900 2300 2680 3060 3420 3810 4200
消 780 1170 1560 1960 2360 2740 3140 3520 3910 4310
费 支 出 (元
)
820 860 900 940
1220 1620 2020 2420 2820 3220 3620 4020 4420