一元线性回归模型ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其e中i ,ui是 的估计量,ei 称 为残差(residual)。
ei ◦ 表示了Y的实际值与样本回归估计值的差。
10
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 回归分析:根据样本回归函数估计总体回 归函数。
11
3.1 回归的涵义
“线性”回归的特殊含义
总体回归函数(population regression function, PRF)
◦ 上图中,圆圈点称为条件均值;条件均值的连线 称为总体回归线。
◦ 总体回归线表明了Y的均值与每个X的变动关系。 ◦ 上图近似线性的总体回归线可以表示成:
E Y 参cXoie数ffE(i表cipeY示nart给saX)mi定e;t的er称sBX)1值为,所截B也2对距X称应(i回的in归tYe系r的ce数均pt()值r,;egBr1e称、ss为Bio称2n斜为 率(slope)。 ◦ 斜率系数B度1 量了X每变动一单位,YB(2 条件)均值 的变化率。举例: ,含义?
◦ 本书主要关注参数线性模型。从现在起, 线性回归(linear regression)是指参数线性12
3.2 随机扰动项的来源
◦ 总体回归函数说明在给定的家庭收入下, 美国学生 平均的数学分数。
◦ 但对于某一个学生,他的数学分数可能与 该平均水平有偏差。
◦ 可以解释为,个人数学分数等于这一组的 平均值加上或减去某个值。用数学公式表 示为Y:i B1 B2 Xi ui
B2 0.001
6
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 实际中往往无法获得整个总体的数据,怎 么估计总体回归函数?即如何求参数B1、 B2?
◦ 通常,我们仅仅有来自总体的一个样本。 ◦ 我们的任务就是根据样本信息估计总体回
归函数。 ◦ 怎么实现?
ui
其中, 表示随机扰动项,简称扰动项。扰 动项是一个随机变量,通常用概率分布来 描述。
13
3.2 随机扰动项的来源
◦ 对于回归模型 Yi B1 B2 Xi ui
◦ Yi 称为 被解释变量(explained variable)
Xi
也称 应变量或因变量(dependent variable) 称为 解释变量(explanatory variable)
9
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 可用样Yˆ本i 回b1归函b2 X数i (SRF)表示样本回归线:
其Y中ˆi , 总体条件均E值Y Xi 的估计量; b1 B1的估计量;b2 B2的估计量
◦ 并非所有样本数据都准确地落在样本回归线上, 因此建立随机样本回归函数: Yi b1 b2 X i ei
2
3.1 回归的涵义
回归分析(regression analysis)
◦ 用于研究一个变量(称为被解释变量或应 变量)与另一个或多个变量(称为解释变 量或自变量)之间的关系。
◦ Y代表被解释变量,X代表解释变量;解释 变量有多个时,用X1,X2,X3等表示。
◦ 例:商品的需求量与该商品价格、消费者 收入以及其他竞争性商品价格之间的关系。
3.2 随机扰动项的来源
◦
16
3.2 随机扰动项的来源
◦ 性质1:扰动项代表了未纳入模型变量的影 响。例如个人健康状况、居住区域等等。
◦ 性质2:反映了人类行为的内在随机性。即 使模型中包括了决定数学分数的所有变量, 其内在随机性也不可避免,这是做任何努 力都无法解释的。
◦ 性质3:还代表了度量误差,例如收入的数 据可能不等于真实值。
7
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 表2-2、2-3的数据都是从表2-1中随机抽取 得到的。
8
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 通过散点得到两条“拟合”样本数据的样 本回归线。
3
3.1 回归的涵义
总体回归函数(population regression function,PRF)
◦ 例:学生的家庭收入与数学分数有怎样的 关系?
4
3.1 回归的涵义
总体回归函数(population regression function,PRF)
◦ 根据上面数据做散点图
5
3.1 回归的涵义
第三章 一元线性回归模 型
(教材第二、三章)
第三章 一元线性回归模型
3.1 回归的涵义 3.2 随机扰动项的来源 3.3 参数的最小二乘估计 3.4 参数估计的性质 3.5 显著性检验 3.6 拟合优度 3.7 预测
学习要点 回归模型的涵义,参数的OLS估计及其性质, 显著性检验
◦ 对“线性”有两种解释:变量线性和参数 线性。
◦ 变 归E量 函Y线 数 性 ;B1:下 B例面2 X如的i2,前函E面数Y的不 总是B1体变 B(量2 X或线1i 样性本的):回
◦ 参 出数 现线 。性 下E:面Y参的 数模B1型B1B是、ห้องสมุดไป่ตู้2X参Bi 2数仅以非线一性次方的:的形式
◦一B1是 B2 Xi ,E即Y Xi ,是该收入水平上的
平均数学分数。这一部分称为系统或确定
u性i 部分。
◦ 二 外是 的Y因i ,素E称决Y为定X非i 。 系ui统 或B1 随B机2 X成i 本ui ,由收入以
◦ 此时,称
为随机总体回
归函数(stochastic PRF)。 15
◦ 性质4:“奥卡姆剃刀原则”——即描述应 该尽可能简单,只要不遗漏重要的信息,
B1,
ui
B也 称2 称 为 称为
自变量(independent variable) 参数(parameter) 随机扰动项(random error term)
14
3.2 随机扰动项的来源
◦ 上式如何解释?
◦ 可以认为,在给定家庭收X i 入水平 上,第i 个学生的数学分数可以表达为两部分之和:
ei ◦ 表示了Y的实际值与样本回归估计值的差。
10
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 回归分析:根据样本回归函数估计总体回 归函数。
11
3.1 回归的涵义
“线性”回归的特殊含义
总体回归函数(population regression function, PRF)
◦ 上图中,圆圈点称为条件均值;条件均值的连线 称为总体回归线。
◦ 总体回归线表明了Y的均值与每个X的变动关系。 ◦ 上图近似线性的总体回归线可以表示成:
E Y 参cXoie数ffE(i表cipeY示nart给saX)mi定e;t的er称sBX)1值为,所截B也2对距X称应(i回的in归tYe系r的ce数均pt()值r,;egBr1e称、ss为Bio称2n斜为 率(slope)。 ◦ 斜率系数B度1 量了X每变动一单位,YB(2 条件)均值 的变化率。举例: ,含义?
◦ 本书主要关注参数线性模型。从现在起, 线性回归(linear regression)是指参数线性12
3.2 随机扰动项的来源
◦ 总体回归函数说明在给定的家庭收入下, 美国学生 平均的数学分数。
◦ 但对于某一个学生,他的数学分数可能与 该平均水平有偏差。
◦ 可以解释为,个人数学分数等于这一组的 平均值加上或减去某个值。用数学公式表 示为Y:i B1 B2 Xi ui
B2 0.001
6
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 实际中往往无法获得整个总体的数据,怎 么估计总体回归函数?即如何求参数B1、 B2?
◦ 通常,我们仅仅有来自总体的一个样本。 ◦ 我们的任务就是根据样本信息估计总体回
归函数。 ◦ 怎么实现?
ui
其中, 表示随机扰动项,简称扰动项。扰 动项是一个随机变量,通常用概率分布来 描述。
13
3.2 随机扰动项的来源
◦ 对于回归模型 Yi B1 B2 Xi ui
◦ Yi 称为 被解释变量(explained variable)
Xi
也称 应变量或因变量(dependent variable) 称为 解释变量(explanatory variable)
9
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 可用样Yˆ本i 回b1归函b2 X数i (SRF)表示样本回归线:
其Y中ˆi , 总体条件均E值Y Xi 的估计量; b1 B1的估计量;b2 B2的估计量
◦ 并非所有样本数据都准确地落在样本回归线上, 因此建立随机样本回归函数: Yi b1 b2 X i ei
2
3.1 回归的涵义
回归分析(regression analysis)
◦ 用于研究一个变量(称为被解释变量或应 变量)与另一个或多个变量(称为解释变 量或自变量)之间的关系。
◦ Y代表被解释变量,X代表解释变量;解释 变量有多个时,用X1,X2,X3等表示。
◦ 例:商品的需求量与该商品价格、消费者 收入以及其他竞争性商品价格之间的关系。
3.2 随机扰动项的来源
◦
16
3.2 随机扰动项的来源
◦ 性质1:扰动项代表了未纳入模型变量的影 响。例如个人健康状况、居住区域等等。
◦ 性质2:反映了人类行为的内在随机性。即 使模型中包括了决定数学分数的所有变量, 其内在随机性也不可避免,这是做任何努 力都无法解释的。
◦ 性质3:还代表了度量误差,例如收入的数 据可能不等于真实值。
7
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 表2-2、2-3的数据都是从表2-1中随机抽取 得到的。
8
3.1 回归的涵义
样本回归函数(sample regression function, SRF)
◦ 通过散点得到两条“拟合”样本数据的样 本回归线。
3
3.1 回归的涵义
总体回归函数(population regression function,PRF)
◦ 例:学生的家庭收入与数学分数有怎样的 关系?
4
3.1 回归的涵义
总体回归函数(population regression function,PRF)
◦ 根据上面数据做散点图
5
3.1 回归的涵义
第三章 一元线性回归模 型
(教材第二、三章)
第三章 一元线性回归模型
3.1 回归的涵义 3.2 随机扰动项的来源 3.3 参数的最小二乘估计 3.4 参数估计的性质 3.5 显著性检验 3.6 拟合优度 3.7 预测
学习要点 回归模型的涵义,参数的OLS估计及其性质, 显著性检验
◦ 对“线性”有两种解释:变量线性和参数 线性。
◦ 变 归E量 函Y线 数 性 ;B1:下 B例面2 X如的i2,前函E面数Y的不 总是B1体变 B(量2 X或线1i 样性本的):回
◦ 参 出数 现线 。性 下E:面Y参的 数模B1型B1B是、ห้องสมุดไป่ตู้2X参Bi 2数仅以非线一性次方的:的形式
◦一B1是 B2 Xi ,E即Y Xi ,是该收入水平上的
平均数学分数。这一部分称为系统或确定
u性i 部分。
◦ 二 外是 的Y因i ,素E称决Y为定X非i 。 系ui统 或B1 随B机2 X成i 本ui ,由收入以
◦ 此时,称
为随机总体回
归函数(stochastic PRF)。 15
◦ 性质4:“奥卡姆剃刀原则”——即描述应 该尽可能简单,只要不遗漏重要的信息,
B1,
ui
B也 称2 称 为 称为
自变量(independent variable) 参数(parameter) 随机扰动项(random error term)
14
3.2 随机扰动项的来源
◦ 上式如何解释?
◦ 可以认为,在给定家庭收X i 入水平 上,第i 个学生的数学分数可以表达为两部分之和: