含定性变量的数量化方法协方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为
Y X Z , H 0,
~ N 0, 2In ,
(6.10)
其中Y 是随机变量的 n 次独立观测值组成的向量, X 为 n p 的矩阵,
其元素非 0 即 1, 是未知参数向量。
上海财经大学 统计与管理学院
12
第六章 含定性变量的数量化方法
当 6.4 满足经典回归假定,应用 OLS 法得:
yˆ i
(ˆˆ00ˆ1ˆ2xxi ,*x)
x*
(ˆ1
ˆ2 )xi , x
x*
要检验真实的回归线在 x* 点是否有弯折,只需要对 6.4 估计式中的 2 进行显著性检验就可
以了。
上海财经大学 统计与管理学院
9
第六章 含定性变量的数量化方法
协方差分析
其中的分量为一般平均、因子的主效应、交互效应等,它们满足方差 分析中的对效应的约束条件,记为 H 0 ,这里的 H 是 s p 矩阵,其 秩为 s,Z 为 n k 的矩阵,其中第 j 列为第 j 个协变量 z j 在 n 次试验中 的观测值, 为 k 1的协变量的回归系数向量。 是随机误差向量。
上海财经大学 统计与管理学院
3
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
1.虚拟变量只影响回归函数的截距 设回归模型为
yi 01xi i
如果观察单位的不同状态只影响回归函数的截距而不影响斜率,可以如例 6.1 所示,引进一个
反映这种影响的虚拟变量 D ,并将模型 6.1 改写成:
j
2,3,4
这样第一季度可以用 D2i D3i D4i 0 表示,这时回归函数的季节回归模型表达为:
yi 02 D2i 3 D3i 4 D4i 5 xi i
上海财经大学 统计与管理学院
10
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
一般地,若某自变量具有 k 个不同的水平,则设置 k 1个虚拟变量,令
Di 10,,当当该该自自变变量量取去第其他i个水水平平时 时, ,i 1,, k 1,
(6.7)
把 D1, D2 ,Dk1 与其他定量的变量一起建立线性回归方程,我们仍使用最小二乘估计求出 回归系数,可以用最小二乘基本定理检验该定性变量的显著性。
虚拟变量引入回归模型的几种形式
显然四个季节构成了所有的状态空间,四个虚拟变量之间具有关系:
D1i D2i D3i D4i 1
(6.6)
造成了完全多重共线性,这就是虚拟变量陷阱问题,为了克服陷阱问题,要改变虚拟变 量的引入方法,只使用三个虚拟变量:
D ji
1, 观测i处于第j季, 0, 其他季
例 6.1 某经济学家想调查文化程度对家庭储蓄的影响,在一个中等收 入的样本框中,随机调查了 13 户高学历家庭与 14 户中低学历的家庭。 因变量 y 为上一年家庭储蓄增加额,自变量 x1为上一年家庭总收入, 自变量 x2 表示家庭学历。高学历家庭 x2 1,低学历家庭 x2 0 ,调查 数据见表 6.1。
y 与 x 的总体关系表现为另一条截距与斜率都不相同的直线。可以用一个统一的折线回归模
型来表示:
yi 01xi 2 (xi x* )Di i
(6.4)
Di
1, 0,
xi xi
x* x*
上海财经大学 统计与管理学院
8
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
率差异。
上海财经大学 统计与管理学院
6
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
3.虚拟变量引入折线模型 在实际中可能会遇到折线回归的情况,如下图所示:
y
X1*
x
图 6.1 两段折线模型
上海财经大学 统计与管理学院
7
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
数据观测以 x* 为分界点,当 x x* 时,y 与 x 的总体关系表现为一条直线,当 x x* 时,
wenku.baidu.com
上海财经大学 统计与管理学院
2
第六章 含定性变量的数量化方法
自变量中含有定性变量的回归模型
建立 y 对 x1, x2 的线性回归,用最小二乘法得回归方程为:
yˆ 7976 3826 x1 3700 x2
这个结果表明,中等收入的家庭每增加 1 万元收入,平均拿出 3826 元作为储蓄。高学历家庭每年的平均储蓄额少于低学历的家庭,平均 少 3700 元。
上海财经大学 统计与管理学院
11
第六章 含定性变量的数量化方法
协方差分析
本节我们讨论另一类问题。在一个问题中,影响试验结果 y 的因素既 有象方差分析中所讨论的定性的因子 A, B,K ,也有象回归分析中的定 量变量 z1, z2,K , zk ,此时我们可以采用协方差分析的方法在实际问题 中,称这些定性的因子为因子,定量的变量为协变量。模型可以表示
yi 01xi 2 Di i
(6.2)
其中
Di
1, 状态1 0, 状态2
上海财经大学 统计与管理学院
4
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
当(6.2)满足经典回归假定时,可应用 OLS 法得:
yˆi (ˆˆ00ˆ1ˆx2 i),状ˆ态1x2i , 状态1 2 表示回归函数在状态 1 与状态 2 的差异。根据检验假设 H 0 : 2 0 是否成立,可以判断
第六章 含定性变量的数量化方法
自变量中含有定性变量的回归模型
在回归分析中,对一些自变量是定性变量 的情型先给予数量化处理。当自变量中含 有定性变量时,我们采用设置虚拟变量的 方法建立回归方程,这种方法即为数量化 方法。
上海财经大学 统计与管理学院
1
第六章 含定性变量的数量化方法
自变量中含有定性变量的回归模型
状态 1 与状态 2 的截距是否无显著差异。
上海财经大学 统计与管理学院
5
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
当(6.3)满足经典回归假定时,可应用 OLS 法得:
yˆ i
(ˆˆ00ˆ1ˆ1x)i
(ˆ2 , 状态2
ˆ3 )xi , 状态1
1 表示回归函数在状态 1 与状态 2 的截距差异, 3 则表示回归函数在状态 1 与状态 2 的斜
Y X Z , H 0,
~ N 0, 2In ,
(6.10)
其中Y 是随机变量的 n 次独立观测值组成的向量, X 为 n p 的矩阵,
其元素非 0 即 1, 是未知参数向量。
上海财经大学 统计与管理学院
12
第六章 含定性变量的数量化方法
当 6.4 满足经典回归假定,应用 OLS 法得:
yˆ i
(ˆˆ00ˆ1ˆ2xxi ,*x)
x*
(ˆ1
ˆ2 )xi , x
x*
要检验真实的回归线在 x* 点是否有弯折,只需要对 6.4 估计式中的 2 进行显著性检验就可
以了。
上海财经大学 统计与管理学院
9
第六章 含定性变量的数量化方法
协方差分析
其中的分量为一般平均、因子的主效应、交互效应等,它们满足方差 分析中的对效应的约束条件,记为 H 0 ,这里的 H 是 s p 矩阵,其 秩为 s,Z 为 n k 的矩阵,其中第 j 列为第 j 个协变量 z j 在 n 次试验中 的观测值, 为 k 1的协变量的回归系数向量。 是随机误差向量。
上海财经大学 统计与管理学院
3
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
1.虚拟变量只影响回归函数的截距 设回归模型为
yi 01xi i
如果观察单位的不同状态只影响回归函数的截距而不影响斜率,可以如例 6.1 所示,引进一个
反映这种影响的虚拟变量 D ,并将模型 6.1 改写成:
j
2,3,4
这样第一季度可以用 D2i D3i D4i 0 表示,这时回归函数的季节回归模型表达为:
yi 02 D2i 3 D3i 4 D4i 5 xi i
上海财经大学 统计与管理学院
10
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
一般地,若某自变量具有 k 个不同的水平,则设置 k 1个虚拟变量,令
Di 10,,当当该该自自变变量量取去第其他i个水水平平时 时, ,i 1,, k 1,
(6.7)
把 D1, D2 ,Dk1 与其他定量的变量一起建立线性回归方程,我们仍使用最小二乘估计求出 回归系数,可以用最小二乘基本定理检验该定性变量的显著性。
虚拟变量引入回归模型的几种形式
显然四个季节构成了所有的状态空间,四个虚拟变量之间具有关系:
D1i D2i D3i D4i 1
(6.6)
造成了完全多重共线性,这就是虚拟变量陷阱问题,为了克服陷阱问题,要改变虚拟变 量的引入方法,只使用三个虚拟变量:
D ji
1, 观测i处于第j季, 0, 其他季
例 6.1 某经济学家想调查文化程度对家庭储蓄的影响,在一个中等收 入的样本框中,随机调查了 13 户高学历家庭与 14 户中低学历的家庭。 因变量 y 为上一年家庭储蓄增加额,自变量 x1为上一年家庭总收入, 自变量 x2 表示家庭学历。高学历家庭 x2 1,低学历家庭 x2 0 ,调查 数据见表 6.1。
y 与 x 的总体关系表现为另一条截距与斜率都不相同的直线。可以用一个统一的折线回归模
型来表示:
yi 01xi 2 (xi x* )Di i
(6.4)
Di
1, 0,
xi xi
x* x*
上海财经大学 统计与管理学院
8
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
率差异。
上海财经大学 统计与管理学院
6
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
3.虚拟变量引入折线模型 在实际中可能会遇到折线回归的情况,如下图所示:
y
X1*
x
图 6.1 两段折线模型
上海财经大学 统计与管理学院
7
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
数据观测以 x* 为分界点,当 x x* 时,y 与 x 的总体关系表现为一条直线,当 x x* 时,
wenku.baidu.com
上海财经大学 统计与管理学院
2
第六章 含定性变量的数量化方法
自变量中含有定性变量的回归模型
建立 y 对 x1, x2 的线性回归,用最小二乘法得回归方程为:
yˆ 7976 3826 x1 3700 x2
这个结果表明,中等收入的家庭每增加 1 万元收入,平均拿出 3826 元作为储蓄。高学历家庭每年的平均储蓄额少于低学历的家庭,平均 少 3700 元。
上海财经大学 统计与管理学院
11
第六章 含定性变量的数量化方法
协方差分析
本节我们讨论另一类问题。在一个问题中,影响试验结果 y 的因素既 有象方差分析中所讨论的定性的因子 A, B,K ,也有象回归分析中的定 量变量 z1, z2,K , zk ,此时我们可以采用协方差分析的方法在实际问题 中,称这些定性的因子为因子,定量的变量为协变量。模型可以表示
yi 01xi 2 Di i
(6.2)
其中
Di
1, 状态1 0, 状态2
上海财经大学 统计与管理学院
4
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
当(6.2)满足经典回归假定时,可应用 OLS 法得:
yˆi (ˆˆ00ˆ1ˆx2 i),状ˆ态1x2i , 状态1 2 表示回归函数在状态 1 与状态 2 的差异。根据检验假设 H 0 : 2 0 是否成立,可以判断
第六章 含定性变量的数量化方法
自变量中含有定性变量的回归模型
在回归分析中,对一些自变量是定性变量 的情型先给予数量化处理。当自变量中含 有定性变量时,我们采用设置虚拟变量的 方法建立回归方程,这种方法即为数量化 方法。
上海财经大学 统计与管理学院
1
第六章 含定性变量的数量化方法
自变量中含有定性变量的回归模型
状态 1 与状态 2 的截距是否无显著差异。
上海财经大学 统计与管理学院
5
第六章 含定性变量的数量化方法
虚拟变量引入回归模型的几种形式
当(6.3)满足经典回归假定时,可应用 OLS 法得:
yˆ i
(ˆˆ00ˆ1ˆ1x)i
(ˆ2 , 状态2
ˆ3 )xi , 状态1
1 表示回归函数在状态 1 与状态 2 的截距差异, 3 则表示回归函数在状态 1 与状态 2 的斜