异方差及其处理讲解
Stata面板数据回归分析中的异方差问题及解决方法
Stata面板数据回归分析中的异方差问题及解决方法面板数据回归分析是经济学领域常用的一种方法,它旨在研究一个或多个因变量如何受到一个或多个自变量的影响。
然而,在实际应用中,我们常常会遇到异方差问题,即误差项的方差并不相等,从而导致分析结果的不准确性。
本文将探讨Stata面板数据回归分析中的异方差问题,并提供解决方法。
1. 异方差问题的背景异方差问题在面板数据回归分析中很常见。
它的存在可能是由于不同个体之间的方差差异,也可能是由于时间序列上的方差差异。
无论是个体效应还是时间效应,异方差都会对回归结果的解释和统计推断产生不良影响。
2. 异方差问题的影响异方差问题会导致普通最小二乘法(Ordinary Least Squares, OLS)估计出现偏误和无效性。
当误差项方差呈现某种模式时,OLS估计量可能对某些变量的系数进行过度调整或忽略重要的影响。
这使得统计推断变得不可靠,造成错误的结论。
3. 异方差问题的检验在面板数据回归中,有多种方法可用于检验异方差问题,其中最常见的是Breusch-Pagan检验和White检验。
Breusch-Pagan检验基于残差平方与解释变量之间是否存在关系来判断异方差问题的存在。
White检验则基于残差平方与所有自变量值之间的关系来检验异方差。
如果检验的p值小于设定的显著水平(如0.05),则可以判断存在异方差问题。
4. 异方差问题的解决方法(1)异方差稳健标准误(Robust Standard Errors):该方法通过对OLS估计进行修正,使用异方差稳健标准误来替代传统的标准误。
这样可以降低估计的标准误,从而得到更准确的参数估计和显著性检验。
(2)异方差稳健回归(Robust Regression):除了使用异方差稳健标准误外,还可以使用异方差稳健回归来解决异方差问题。
异方差稳健回归可以通过加权最小二乘法来处理异方差,缓解异方差对估计的影响。
(3)固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model):面板数据回归中,可以使用固定效应模型或随机效应模型来控制个体效应和时间效应。
第4讲异方差与自相关解析
三、实验操作指导
这就是实验模型。显然模型将一个非线性模型转化成了线性 模型,在运用计量经济学进行模型研究时,将非线性模型 化为线性模型来简化分析一直是计量经济学的指导准则。
2.打开文件,进行回归
(1)打开文件命令 use c:\data\nerlove,clear 或者直接从菜单栏中“file”选择“open”找到需要打开的数据 文件nerlove
通过绘制残差图可以直观地观察到是否存在异方 差,但是观察残差图的方法标准较为模糊,会遇 到模型残差图很难判断的情形。所以只采用残差 图的方式判定模型的方差形式是不够严谨的,必 须配合下面几种正规的检验方法才有信服力。 (2)怀特检验法 根据本章节介绍的该方法的原理,Stata可以直接 得到检验结果。对模型基本回归结束后,需要在 命令窗口输入如下命令:
3.异方差检验 对模型进行回归并不是本章的知识,然而回归是一个基础, 即做异方差检验之前必须做回归,下面将会详细介绍异方 差检验的基本方法。 (1)残差图观察法 做完模型的基本回归后,运用Stata绘制残差图来观察异 方差是否存在。 在命令窗口中输入如下两个命令中的任意一个即可 rvfplot (residual-versus-fitted plot) rvpplot varname (residual-versus-predictor plot) 第一个命令语句的作用是绘制默认形式的残差图,第二个 命令语句的作用是绘制残差与某个解释变量的散点图, varname可以换做认为合理的解释变量。
二、实验内容和数据来源 数据来自Nerlove 1963年的一篇文章,数据内容是美国1955 年145家电力企业的横截面数据,变量主要有TC(企业总 成本)、Q(产量)、PL(工资率)、PF(燃料价格)及 PK(资本租赁价格)。完整的数据在本书附带光盘里的 data文件夹的“nerlove.dta”工作文件夹中。 根据cobb-douglas生产函数:,在企业追求成本最小化的 的合理假设下,可证明其成本函数也为cobb-douglas函数, 可显示如下: 本实验中,运用nerlove数据分析各个解释变量对总成本 TC的影响,并运用多种方法检验是否存在异方差,如果 存在异方差则对模型进行合理的修正,最终得到一个效果 较好的模型。
异方差性的概念、类型、后果、检验及其修正方法含案例
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)
第五章第四节 异方差的解决方法
(5)权数的选择(**)
• 一般地,Wi=1/2i。问题在于:2i一般是未知的 • 关键:找出ui随着Xi的变化而变化的规律,对异方差
Var(ui)= 2i = 2 f( Xi )( i=1,2,…,n)的具体形式作出 合理假设。
• 怎样才能提出合理的假设呢? (1)通过对具体经济问题的经验分析,或 (2)考察OLS的ei2与Xi的关系,或 (3)通过White等检验的结果提供的信息 • 粗略做法: Wi =1/|ei|或1/ ei2 ,ei是OLS估计的残差 • 所以,利用WLS的思路是:寻找合适的“权数”,
4.WLS法在eviews中的实现
1.创建文件:File/New/Workfile/输入数据频率/Ok 2.输入数据:在主菜单,点quick / empty group/输入变量
名称和数值/ 3.产生新序列:在eviews栏,点quick/generate series/输
入w=1/sqr(x),点ok(假设w=1/sqr(x) 4.作回归:在eviews栏,点quick/ estimate equation/键入
变量和常数[如y c x],同时点右下方的option,选择 Weighted LS/TLS,键入w,点ok
同质性 权数序列名
二、对原模型变换的方法
1、模型变换法的定义
模型变换法是对存在异方差的总体回归模型作适当的代数变换,使之成为满足同方 差假定的模型 , 进而运用OLS方法估计参数。
2、模型变换法的关键是: 通过对具体经济问题的经验分析,事先对异方差
往往有较小的差异。
利用EViews对模型进行对数变换
例 ln Yi 1 2 ln Xi ui 在eviews栏,点quick/generate series/输入 LY=LOG(Y) 在eviews栏,点quick/generate series/输入 LX=LOG(X)
实验四异方差性的检验与处理
实验四异方差性的检验及处理(2学时)一、实验目的(1)、掌握异方差检验的基本方法;(2)、掌握异方差的处理方法。
二、实验学时:2学时三、实验要求(1)掌握用MATLAB软件实现异方差的检验和处理;(2)掌握异方差的检验和处理的基本步骤。
四、实验原理1、异方差检验的常用方法(1) 用X-Y的散点图进行判断(2).22ˆ(,)(,)e x e y%%或的图形,),x)i iy%%i i((e或(e的图形)(3) 等级相关系数法(又称Spearman检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。
检验的三个步骤①ˆt ty y=-%ie②|i x %%i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21n i i d =∑s 26r =1-n(n -1)③ 做等级相关系数的显着性检验。
n>8时,/2(2),t t n α>-反之,若||i i e x %说明与之间存在系统关系,异方差问题存在。
(4) 帕克(Park)检验帕克检验常用的函数形式:若?在统计上是显着的,表明存在异方差性。
2、异方差性的处理方法: 加权最小二乘法如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:121i i p pi i y x x u βββ=+⋅+⋅+L 在该模型中: 即满足同方差性。
于是可以用OLS 估计其参数,得到关于参数12,,,p βββL 的无偏、有效估计量。
五、实验举例例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:01i i i y x u ββ=++若用线性模型,研究不同收入家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?解:(一)编写程序如下:(1)等级相关系数法(详见test4_1.m 文件)%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性 %%%%%%%%[data,head]=xlsread('test4.xlsx');x=data(:,1); %提取第一列数据,即可支配收入xy=data(:,2); %提取第二列数据,即居民消费支出yplot(x,y,'k.'); % 画x和y的散点图xlabel('可支配收入x(千元)') % 对x轴加标签ylabel('居民消费支出y(千元)') % 对y轴加标签%%%%%%%% 调用regres函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones(size(x,1),1),x]; %在x矩阵最左边加一列1,为线性回归做准备[b,bint,r,rint,s]=regress(y,xdata);yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};[head1;num2cell([b,bint])]% 定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell([y,yhat,r,rint])]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'}; [head3;num2cell(s)]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot(r,rint) % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot(yhat,r,'k.') % 画散点图xlabel('估计值yhat') % 对x轴加标签ylabel('残差r') % 对y轴加标签%%%%%%%%%%%% 调用corr函数计算皮尔曼等级相关系数res=abs(r); % 对残差r取绝对值[rs,p]=corr(x,res,'type','spearman')disp('其中rs为皮尔曼等级相关系数,p为p值');(2)帕克(park)检验法(详见test4_2.m文件)%%%%%%%%%%%%%%% 用帕克(park)检验法来检验异方差性 %%%%%%%[data,head]=xlsread('test4.xlsx'); %导入数据x=data(:,1);y=data(:,2);%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,'linear',{'yhat','r','standres'});scatter(x,(ST.r).^2) % 画x与残差平方的散点图xlabel('可支配收入(x)') % 对x轴加标签ylabel('残差的平方') %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归ST1=regstats(log((ST.r).^2),log(x),'linear',{'r','beta','tstat','fstat'})ST1.tstat.beta % 输出参数的估计值ST1.tstat.pval % 输出回归系数t检验的P值ST1.fstat.pval % 输出回归模型显着性检验的P值(3)加权最小二乘法(详见test4_3.m文件)%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread('test4.xlsx'); % 导入数据x=data(:,1);y=data(:,2);% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(x,y) %调用函数作稳健回归stats.p % 输出模型检验的P值%%% 绘制残差和权重的散点图 %%%%%%%plot(stats.resid,stats.w,'o') %绘制残差和权重的散点图xlabel('残差')ylabel('权重'(二)实验结果与分析:第一步::用OLS方法估计参数,并保留残差(1)散点图图4.1 可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。
异方差性的概念、类型、后果、检验及其修正方法(含案例)
分别为两个子样对应的随机项方差。
H0成立,意味着同方差; H1成立,意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平,确定F分布表中相应的临界值
例4.1.2:以绝对收入假设为理论假设、以分组数据 (将居民按照收入等距离分成n组,取组平均数为样 本观测值)作样本建立居民消费函数:
Ci= 0+1Yi+i 一般情况下:居民收入服从正态分布,处于中等收入组中 的人数最多,处于两端收入组中的人数最少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。所以样本观 测值的观测误差随着解释变量观测值的增大而先减后增。 如果样本观测值的观测误差构成随机误差项的主要部分,那 么对于不同的样本点,随机误差项的方差随着解释变量观测值
并不随解释变量 Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同, 即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即
i2 =f(Xi) (i=1,2,…,n)
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
③对每个子样本分别求回归方程,并计算各自的残差平方
e 2 ,较大的一 和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。 个规定为 e2i 。二者的自由度均为 2
2 2 H0 : 12 2 12 2 ④提出假设: ,H 1 : 2 12 与 2
异方差的名词解释
异方差的名词解释引言:在实际应用中,我们常常会遇到一种数据特征,即样本的方差不稳定的现象。
这种现象称为异方差,是统计分析中一个重要的概念。
本文将从定义、原因、影响以及如何处理异方差等方面进行探讨,以帮助读者更好地理解异方差的概念及其应用。
一、定义异方差(Heteroscedasticity)指的是在统计学中,方差并不是恒定的,而是与自变量的某些特征相关联。
换句话说,样本的方差会随着自变量的不同取值而发生变化。
二、原因异方差可能由多种因素引起。
常见的原因包括以下几个方面:1. 异常值:样本中存在极端值或异常值,使得方差的测量结果被拉大或压缩;2. 比例误差:不同自变量取值下,因变量的测量误差有一定的比例关系;3. 数据收集:数据收集过程中的误差,或者是相关变量的选择问题,可能导致异方差的出现。
三、影响异方差存在对统计分析结果产生不良影响的情况,对回归分析尤为关键。
以下是几个常见的影响:1. 回归系数估计值的不准确:异方差可能导致回归系数估计值的偏倚,进而影响模型的解释和预测能力;2. 统计检验结果的误导:异方差使得恰当的统计检验成为挑战,常见的问题是标准误估计的错误;3. 置信区间和预测区间的准确性下降:异方差可能导致对未来观测值进行预测时的不确定性增加。
四、处理方法针对异方差问题,有一些常用的方法可以帮助我们处理。
以下是几种常见的处理方法:1. 权重最小二乘法(Weighted Least Squares, WLS):根据异方差的特征,使用加权最小二乘法来估计回归系数。
即根据样本的方差-均值关系,为每个样本赋予相应的权重,从而平衡不同自变量值下对模型的贡献。
2. 魏布尔-克劳修斯检验(White-Huber test):该检验用于检验异方差的存在。
若检验结果表明存在异方差,则可以尝试使用WLS进行回归估计。
3. 变量转换(Variable Transformation):通过将特征变量进行线性或非线性的转换,以消除异方差的影响。
异方差的现实意义-概述说明以及解释
异方差的现实意义-概述说明以及解释1.引言1.1 概述概述异方差是指在统计学中,随机变量的方差在不同取值下发生变化的现象。
它是一种常见的统计数据特征,广泛存在于现实中的各种数据集中。
异方差的存在可能会导致统计分析结果的偏差和误判,因此对于异方差的理解和应对策略具有重要意义。
本文旨在探讨异方差的定义、特点以及其在现实中的影响和重要性。
首先,我们将介绍异方差的定义和特点,包括在不同取值下方差的变化趋势和原因。
然后,我们将探讨异方差在现实中的影响,包括统计分析结果的偏差、参数估计的不准确性等。
最后,我们将提出对异方差的认识与应对策略,以及强调异方差的重要性和现实意义。
通过对异方差的深入了解,我们可以更好地理解统计数据的特点,在分析和解释数据时更加准确和全面。
同时,对于异方差的应对策略的掌握,有助于改善统计模型的拟合效果,提高预测和决策的准确性。
因此,对于异方差的研究具有重要的理论和实际价值。
在接下来的部分中,我们将详细介绍异方差的定义和特点,并探讨其在现实中的影响和重要性。
同时,我们将提出对异方差的认识与应对策略,以期为读者提供指导和启示。
让我们一同进入这个有关异方差的探索之旅吧!1.2 文章结构文章结构部分的内容可以如下编写:文章结构部分旨在向读者介绍本篇长文的组织框架和内容安排。
通过清晰明了的文章结构,读者可以更好地理解整篇文章的逻辑顺序和主要论点。
本文的文章结构如下:第一部分是引言部分,通过对异方差的引入和分析,概述了整篇文章的背景和意义。
在概述中,我们将提供对异方差概念的简明扼要的描述,同时阐明本文的目的和意义。
第二部分是正文部分,主要分为两个小节。
首先,我们将在2.1小节详细介绍异方差的定义和特点。
这一小节将对异方差的背景和相关概念进行深入探讨,并分析其特点和表现形式。
其次,在2.2小节中,我们将重点探讨异方差的现实影响。
通过具体的案例研究和数据分析,我们将展示异方差对实证研究和数据分析的影响,并探讨其可能带来的结果偏差和误判。
(完整版)异方差性的white检验及处理方法
(完整版)异⽅差性的white检验及处理⽅法实验⼆异⽅差模型的white检验与处理【实验⽬的】掌握异⽅差性的white检验及处理⽅法【实验原理】1. 定性分析异⽅差(1) 经济变量规模差别很⼤时容易出现异⽅差。
如个⼈收⼊与⽀出关系,投⼊与产出关系。
(2) 利⽤散点图做初步判断。
(3) 利⽤残差图做初步判断。
2、异⽅差表现与来源异⽅差通常有三种表现形式(1)递增型(2)递减型(3)条件⾃回归型。
3、White检验(1)不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过⼀个辅助回归式构造χ2 统计量进⾏异⽅差检验。
White检验的零假设和备择假设是H0: (4-1)式中的ut不存在异⽅差,H1: (4-2)式中的ut存在异⽅差。
(2)在不存在异⽅差假设条件下,统计量T R 2 ~χ2(5) 其中T表⽰样本容量,R2是辅助回归式(4-3)的OLS估计式的可决系数。
⾃由度5表⽰辅助回归式(4-3)中解释变量项数(注意,不计算常数项)。
T R 2属于LM统计量。
(3)判别规则是若T R 2 ≤χ2α (5), 接受H0(ut 具有同⽅差)若T R 2 > χ2α (5), 拒绝H0(ut 具有异⽅差)【实验软件】Eview6【实验要求】熟练掌握异⽅差white检验⽅法【实验内容】建⽴并检验我国部分城市国民收⼊y和对外直接投资FDI异⽅差模型【实验⽅案设计】下表列出了我国部分城市国民收⼊y和对外直接投资FDI的统计资料,并利⽤统计软件Eviews建⽴异⽅差模型。
地区Y FDI北京32061219126天津26532153473河北1051396405⼭西743521361内蒙古89758854辽宁14258282410吉林933819059⿊龙江1161532180上海46718546849江苏168091056365浙江20147498055安徽645536720福建14979259903江西6678161202⼭东136********河南757053903湖北9011156886湖南7554101835⼴东17213782294⼴西596941856海南831642125重庆720926083四川641841231贵州36034521云南56628384陕西648033190⽢肃50222342青海72772522宁夏66911743新疆97001534【实验过程】1、启动Eviews6软件,建⽴新的workfile.在主菜单中选择【File】--【New】--【Workfile】,弹出Workfile Create对话框,在Workfile structure typ中选择unstructured/undted.然后在observations中输⼊30.在WF中输⼊Work1,点击OK按钮。
异方差性的概念、类型、后果、检验及其修正方法(含案例)
• 在教材P29-32和P64-65,分别对一元和多元线性回归模型
提出了若干基本假设,只有在满足这些基本假设的情况下, 应用普通最小二乘法才能得到无偏的、有效的参数估计量。 • 但是,在实际的计量经济学问题中,完全满足这些基本假 设的情况并不多见。 • 如果违背了某一项基本假设,那么应用普通最小二乘法估 计模型所得参数估计量就可能不具有某些优良特性,这就需 要发展新的方法估计模型。 • 本章正是要讨论违背了某一项基本假设的问题及其估计方 法。
ˆ
j
j
c
jj
2
ˆ
j 2
j
( X X ) 1 jj
(j=0,1,2,…,k)
2 。 包含有随机误差项共同的方差
如果出现了异方差性,而仍按同方差时的公式计算t 统计量,将使t统计量失真【偏大或偏小,见第三版P110补 充说明】,从而使t检验失效【使某些原本显著的解释变量
2 E() I
Var( ) 2 , i 1,2, , n i Cov( , ) 0, i j i j
即同方差和无序列相关条件。
2.变量的显著性检验失去意义
在变量的显著性检验中,t统计量
t ˆ
j j j
ˆ ) Se(
规
律
• 一般经验告诉人们:对于采用截面数据作样本
的计量经济学问题,由于在不同样本点(即不
同空间)上解释变量以外的其他因素的差异较
大,所以往往存在异方差性。
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时,其普通最小二乘法参 数估计量仍然具有无偏性,但不具有有效性。而且,在大样 本情况下,参数估计量仍然不具有渐近有效性。 因为在有效性证明(见教材P70-71)中利用了
第九章多元线性回归-异方差问题
记下这个回归的R平方 (3)构造F或LM统计量并计算p值(前者为 F2,n-3分布, 后者用 2 分布。
2
13
(五) 实例
使用Wooldridge中的数据HPRICE.RAW中的数据 来检验一个简单的住房价格方程中的异方差性。水平 变量模型为(分别采用水平变量和其对数项分别进行
回归分析)
price 0 1lotsize 2 sqrft 3bdrms
(2)误差方差与xi2成比例 Var(ui)=σ2 * xi2 其中σ2为常数,这时可以令权序列
wi 1/ xi
wi 1/ xi
19
(一)加权最小二乘法
方差已知的情形 实例:住房支出模型 给出由四组家庭住房支出和年收入组成的截面数据, 建立住房支出模型,并检验和修正异方差。 (3)其他的与自变量xi的加权形式f(xi)
第九章 多元线性回归的异方差问题
一、异方差及其影响 二、异方差的发现和判断 三、异方差的解决方法
1
一、异方差及其影响
1、异方差的定义:
对于多元线性回归模型,如果随机扰动项的方差并非是 不变的常数,则称为存在异方差(heteroscedasticity)。
异方差可以表示为 Var i i2 。 或
2 下这个回归的R平方Ru 2。
4、检验零假设是
H 0 : 1 2 k 0
2 2 LM n Ru ~ 2 k
对方程(2)进行F检验,或计算LM统计量进行检验。
9
(三)戈里瑟检验
1、通常拟合 e 和 X j 之间的回归模型:
e X lj 根据图形中的分布选择
2000
1000
0
-1000
异方差知识点总结
异方差知识点总结异方差的存在可能会导致回归模型下列问题:1. 预测的不确定性增加:当异方差存在时,回归模型的预测区间可能会变得更宽,因为方差的不稳定性会使得预测更加不确定。
2. 参数估计的失真:在存在异方差的情况下,最小二乘法(OLS)回归的方法可能会导致参数估计的偏误。
3. 统计推断的失真:在存在异方差时,通常使用的标准误差可能被低估或高估,从而影响统计推断的结果。
因此,我们有必要了解异方差的特征、检验方法和处理方法。
本文将从以下几个方面对异方差进行总结。
一、异方差的特征和识别方法二、检验异方差的统计方法三、处理异方差的方法一、异方差的特征和识别方法1. 异方差的特征异方差的特征主要包括两个方面:方差的不稳定性和误差项的相关性。
首先是方差的不稳定性,即随着自变量的变化,因变量的方差也会跟着变化。
这种不稳定性可能出现在回归模型的残差中,表现为残差的离散程度随着自变量的变化而变化。
其次是误差项的相关性,即自变量与误差项之间存在相关性。
这种相关性可能是由于遗漏变量、测量误差或其他未知因素导致的,而这种相关性可能会影响到回归模型的假设前提,从而影响到参数的估计和统计推断的结果。
2. 异方差的识别方法在实际应用中,我们可以通过以下几种方法来识别是否存在异方差:(1)绘制残差图:同时绘制残差与预测值的散点图和残差与自变量的散点图,观察残差的离散程度是否与自变量相关。
(2)利用统计检验:利用统计学中的异方差检验方法,如BP检验、White检验等。
(3)利用经验判断:在经验分析中,我们也可以通过观察实际数据的特征,来判断是否存在异方差。
比如,如果数据中存在明显的带状结构或呈现出明显的异方差现象,那么可能存在异方差问题。
二、检验异方差的统计方法1. BP检验BP检验是一种常用的异方差检验方法,它的原假设是误差的方差是恒定的,备择假设是误差的方差是非恒定的。
BP检验的具体步骤为:(1)先对相关变量进行回归分析,得到残差eˆ2;(2)在残差的平方的基础上,增加自变量的平方和自变量与自变量的乘积,得到新的残差变量;(3)利用新的残差变量进行正态性检验,判断残差是否服从正态分布;(4)最后,利用新的残差变量进行F检验,检验自变量的平方及其交叉项是否显著。
什么是异方差性如何进行异方差性的检验与处理
什么是异方差性如何进行异方差性的检验与处理异方差性,它是统计学中一种常见的现象,指的是观测值的方差在不同的条件下不相等。
在数据分析和建模过程中,异方差性可能会导致模型参数估计不准确,假设检验无效以及预测效果下降等问题。
因此,了解异方差性并进行检验和处理是非常重要的。
1. 异方差性的表征异方差性通常表现为残差的方差与预测值的关系不稳定。
在回归分析中,当残差的方差与预测值的关系呈现出一定的模式时,可以初步判断存在异方差性。
常见的异方差性模式有以下几种:(1)线性模式:残差的方差与预测值呈线性关系,即残差的方差随着预测值的增大而增大或减小。
(2)指数模式:残差的方差与预测值呈指数关系,即残差的方差随着预测值的增大呈指数级别增大或减小。
(3)对数模式:残差的方差与预测值呈对数关系,即残差的方差随着预测值的增大呈对数级别增大或减小。
(4)多重峰值模式:残差的方差具有多个峰值,表示不同分组或条件之间存在不同的方差水平。
2. 异方差性的检验针对上述异方差性模式,可以进行一些统计检验来验证异方差性的存在。
常用的异方差性检验方法包括帕金森-斯皮尔曼检验(Park test)、布劳什-帕甘检验(Breusch-Pagan test)和韦斯特曼检验(White test)等。
这些检验方法都是基于残差的方差与预测值之间的关系建立的。
以布劳什-帕甘检验为例,该检验的原假设是残差的方差与预测变量之间不存在显著相关关系,即不存在异方差性。
在进行检验时,首先需要对模型进行拟合,并获得残差。
然后,根据拟合残差和预测变量的关系构建辅助回归模型,并进行显著性检验。
如果辅助回归模型的显著性检验结果小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为存在异方差性。
3. 异方差性的处理在实际数据分析中,如果检验结果表明存在异方差性,需要对数据进行处理以减小或消除其影响。
常用的异方差性处理方法包括以下几种:(1)对数或平方根变换:通过对原始数据进行对数或平方根变换,可以降低数据的异方差性。
实验四-异方差性的检验与处理
实验四异方差性的检验及处理〔2学时〕一、实验目的〔1〕、掌握异方差检验的基本方法; 〔2〕、掌握异方差的处理方法.二、实验学时:2学时 三、实验要求〔1〕掌握用MATLAB 软件实现异方差的检验和处理; 〔2〕掌握异方差的检验和处理的基本步骤.四、实验原理1、异方差检验的常用方法<1> 用X-Y 的散点图进行判断<2>.22ˆ(,)(,)e x e y 或的图形,),x )i i y i i ((e 或(e 的图形)<3> 等级相关系数法〔又称Spearman 检验〕是一种应用较广的方法,既可以用于大样本,也可与小样本. 检验的三个步骤 ①ˆt t y y=-i e②|i x i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21ni i d =∑s 26r =1-n(n -1)③做等级相关系数的显著性检验.n>8时,/2(2),t t n α>-反之,若||i i e x 说明与之间存在系统关系,异方差问题存在.<4> 帕克<Park>检验帕克检验常用的函数形式:若α在统计上是显著的,表明存在异方差性. 2、异方差性的处理方法: 加权最小二乘法 如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:1211(i i p pi iy x x u f x βββ=+⋅++⋅+在该模型中:即满足同方差性.于是可以用OLS 估计其参数,得到关于参数12,,,pβββ的无偏、有效估计量.五、实验举例例101i i i ,研究不同收入家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?解:〔一〕编写程序如下:〔1〕等级相关系数法〔详见test4_1.m 文件〕%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性%%%%%%%% [data,head]=xlsread<'test4.xlsx'>; x=data<:,1>; %提取第一列数据,即可支配收入x y=data<:,2>; %提取第二列数据,即居民消费支出y plot<x,y,'k.'>; % 画x 和y 的散点图xlabel<'可支配收入x 〔千元〕'> % 对x 轴加标签 ylabel<'居民消费支出y<千元>'> % 对y 轴加标签%%%%%%%% 调用regres 函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones<size<x,1>,1>,x]; %在x 矩阵最左边加一列1,为线性回归做准备 [b,bint,r,rint,s]=regress<y,xdata>; yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间 head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'}; [head1;num2cell<[b,bint]>]% 定义元胞数组,以元胞数组形式显示y 的真实值,y 的估计值,残差和残差的95%置信区间 head2={'y 的真实值','y 的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell<[y,yhat,r,rint]>]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'};[head3;num2cell<s>]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot<r,rint> % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot<yhat,r,'k.'> % 画散点图xlabel<'估计值yhat'> % 对x轴加标签ylabel<'残差r'> % 对y轴加标签%%%%%%%%%%%%调用corr函数计算皮尔曼等级相关系数res=abs<r>; % 对残差r取绝对值[rs,p]=corr<x,res,'type','spearman'>disp<'其中rs为皮尔曼等级相关系数,p为p值'>;〔2〕帕克〔park〕检验法〔详见test4_2.m文件〕%%%%%%%%%%%%%%% 用帕克〔park〕检验法来检验异方差性%%%%%%%[data,head]=xlsread<'test4.xlsx'>; %导入数据x=data<:,1>;y=data<:,2>;%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats<y,x,'linear',{'yhat','r','standres'}>;scatter<x,<ST.r>.^2> % 画x与残差平方的散点图xlabel<'可支配收入<x>'> % 对x轴加标签ylabel<'残差的平方'> %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log<x>和log〔r^2〕进行一元线性回归ST1=regstats<log<<ST.r>.^2>,log<x>,'linear',{'r','beta','tstat','fsta t'}>% 输出参数的估计值% 输出回归系数t检验的P值% 输出回归模型显著性检验的P值<3>加权最小二乘法〔详见test4_3.m文件〕%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread<'test4.xlsx'>; % 导入数据x=data<:,1>;y=data<:,2>;% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit<x,y> %调用函数作稳健回归stats.p% 输出模型检验的P值%%% 绘制残差和权重的散点图%%%%%%%plot<stats.resid,stats.w,'o'> %绘制残差和权重的散点图xlabel<'残差'>ylabel<'权重'〔二〕实验结果与分析:第一步::用OLS方法估计参数,并保留残差〔1〕散点图图4.1 可支配收入〔x〕居民消费支出〔y〕散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状.〔2〕回归模型参数估计值与显著性检验表1'系数的估计值' '估计值的95%置信下限' '估计值的95%置信上限'[ -0.5390] [ -3.7241] [ 2.6460][ 0.8091] [ 0.6768] [ 0.9415]'判定系数' 'F统计量的观测值' '检验的P值' '误差方差的估计值'[ 0.8485] [ 156.8387] [5.4040e-13] [ 9.1316]由输出结果看,常数项和回归系数的估计值分别为-0.539和0.8091,从而可以写出线性回归方程为^=−0.539+0.8091∗xy回归系数的估计值的95%置信区间为[0.6768,0.9415].对回归直线进行显著性检验,原假设和对立假设分别为H0:β1=0 H1:β1≠0检验的P值为5.4040×10−13<0.01,可知在显著性水平α=0.01下应拒绝原假设H0,可认为y〔居民消费收入〕与x〔可支配收入〕的线性关系是显著的.〔3〕方差分析图4.2原始数据对应残差图从残差图可以看到有2条线段〔红色虚线〕与水平线y=0没有交点,它对应的观测号为22和29,也就是说这两组观测对应的残差的置信区间不包含0点,可认为这两组观测数据为异常数据.它们分别是〔30,16.7〕,〔35,20〕.第二步:异方差性检验〔1〕图示法图4.3<2> 等级相关系数法在y与x 的OLS 回归的基础上计算出残差的绝对值,并记为res,并计算出皮尔曼等级相关系数rs=0.4860与对应的p值为0.0065<0.05〔*〕,说明残差r与x 存在系统关系,即存在异方差问题.〔3〕帕克<Park>检验法1〕散点图图4.4可支配收入与残差平方的散点图从图4.4可知,可考虑拟合指数曲线.现将其取对数,即可进行一元线性拟合.2〕回归系数与模型检验做ln<r^2>对ln<x>回归,得到表2β0=-8.49730.02950.0207β1=2.96790.0207从上表可以看出,得到的回归模型为ln (r 2)=−8.4973+2.9679∗ln (x),常数项和线性项的t 检验的P 值均小于0.05,说明回归方程中常数项和线性项均是显著的.并且,检验的P 值为0.0207小于0.05,说明整个回归方程是显著的,表明存在异方差性.综上所述,通过以上3种方法的检验,我们得到原数据存在异方差性.第三步:用加权最小二乘法处理异方差性表3‘回归系数’回归系数t 检验的P 值β0=-1.6091 0.2375β1=0.8870 0.0000由表3得:回归方程为 y ^=−1.6091+0.887x ,由p 值可知x 的回归系数是显著的,常数项未显著,说明其无实际意义.图4.5 残差和权重的散点图由图4.5知:权重集中在最上方的1附近的点比较多,说明稳健性比较好.六、实验内容01i i i FDI u ββ=++若用线性模型GDP ,研究不同地区FDI 和GDP 的关系,试问原数据有无异方差性?如果存在异方差性,应如何处理?七、思考练习现用线性模型01i i i y x u ββ=++ ,研究不同收入水平家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?八、参考文献[1].李宝仁.计量经济学[M].机械工业出版社,2007.12 [2].何晓群. 应用回归分析[M].中国人民大学出版,2002.9。
《异方差及其处理》课件
数据清洗与处理
数据预处理
在处理异方差问题之前,需要对数据进行预处理,包括缺失值填充 、异常值处理、数据标准化等,以保证数据的完整性和一致性。
数据转换
对于某些特定的数据分布,可以使用数据转换的方法来处理异方差 问题,如对数转换、平方根转换等。
数据分层
对于具有分层结构的数据,可以使用分层抽样或分层模型的方法来处 理异方差问题,以更好地拟合数据并提高预测精度。
在社会领域的应用
社会调查数据分析
在社会调查数据分析中,异方差性问题常见,如态度、观 点、行为等变量的分布往往存在异方差现象。
人口统计学研究
在人口统计学研究中,年龄、性别、教育程度等变量的分 布可能存在异方差性,需要进行异方差性检验和处理。
社会学研究
在社会学研究中,异方差性可能影响对群体特征、社会现 象等的理解和解释,需要进行异方差性检验和处理以确保 研究的准确性和可靠性。
预测误差
异方差的存在可能导致预 测误差增大,降低模型的 预测精度。
统计推断失效
异方差的存在可能导致模 型的统计推断失效,如置 信区间和假设检验的结果 不准确。
02
异方差的检验
图示检验法
残差图
通过绘制实际观测值与预测值的残差 ,观察其随解释变量变化的趋势,判 断是否存在异方差。
箱线图
利用箱线图展示不同解释变量取值下 的残差分布情况,通过比较箱子的宽 度和位置,判断异方差的存在。
倒数变换法
总结词
倒数变换法是一种处理异方差的方法, 通过将响应变量取倒数,可以减小异方 差的影响。
VS
详细描述
倒数变换法适用于因变量为连续型且呈偏 态分布的情况。通过对原始数据取倒数, 可以使数据更接近正态分布,从而减小异 方差的影响。在回归分析中,可以使用倒 数变换后的数据作为因变量进行回归分析 。
异方差的性质
预测置信区间不准确
在异方差情况下,预测的置信区间可 能不准确,导致对预测结果的信任度 降低。
对统计推断的影响
统计推断有效性下
降
在异方差情况下,常用的统计推 断方法可能不再适用,导致推断 结果的不准确。
假设检验失效
在异方差情况下,假设检验的结 果可能受到影响,导致无法准确 地做出统计决策。
置信水平降低
由于异方差的存在,统计推断的 置信水平可能会受到影响,导致 对推断结果的信任度降低。
03
CATALOGUE
异方差的检验
图示检验法
残差图检验
通过绘制残差与拟合值的图形,观察 残差是否随拟合值的变动而出现系统 性模式,如随拟合值增大而逐渐增大 或减小。
QQ图检验
将残差与标准正态分布的期望值进行 比较,观察其是否落在预期的置信区 间内,判断残差是否服从正态分布。
总结词
医学研究数据中,由于个体差异、病情 进展和治疗方法等因素,常常表现出异 方差性。
VS
详细描述
在医学研究中,由于个体之间的差异、病 情进展的不同阶段以及治疗方法的多样性 等因素,数据分布往往不均匀。例如,不 同患者的生理指标、治疗效果等可能会有 很大的差异,导致数据异方差性的出现。
实例三:社会调查数据
通过计算残差的二次项与解释变量的线性组 合,构建统计量对异方差进行检验。
04
CATALOGUE
异方差的解决方法
数据变换法
平方根变换
通过取平方根的方式减小异方差的影 响,适用于数据分布为正态分布的情 况。
对数变换
通过取对数的方式减小异方差的影响 ,适用于数据分布为偏态分布的情况 。
幂变换
通过取幂的方式减小异方差的影响, 适用于数据分布为幂律分布的情况。
(3)5.4异方差的解决方法
ε i2 = 1 ( y − α − β ) 2 ∑ 2 ∑ 2 i ˆ ˆ xi σ i σ i
u u
(5.4.7)
达到最小。这就是加权最小二乘法。 下面我们说明,这种加权最小二乘法同样可以消除 异方差性的影响。 设异方差是xi的函数
σ = k f ( xi )
2 ui 2
(5.4.8)
将(5.4.8)代入(5.4.7)得加权最小二乘法,要求
(5.4.20)(或(5.4.20)′)称为广义最小二乘估计式。这种 将原模型(5.4.11)进行适当变换,变为模型(5.4.18), 然后对新模型(5.4.18)应用普通最小二乘法,求得参数 估计量,称作对原模型的广义最小二乘法,记作GLS。
当 = In时,
% ˆ β = ( X ' X ) −1 X 'Y = β
1 ε i2 = ˆ − β xi )2 ( yi − α ˆ ∑ 2 ∑ 2 σ i k f ( xi) 达到最小。
u
(5.4.9)
现在对原模型(5.4.1)作变换:
yi f (xi ) =
α
f (xi )
+
β
f (xi )
xi +
ui f (xi )
(5.4.3)
对(5.4.3)应用普通最小二乘法,要求残差平方和:
能使(5.4.9)式达到最小,因为二者只差一个常数因子。 即两种方法得到的结果相同。两种方法实质上是一回 事。对原模型进行变换的方法实际上是加权最小二乘 1 法当 2 = 1 时的特例,也可以看作是加权最小二乘法 k 的直接应用。
三、广义最小二乘法 ( GLS ) 广义最小二乘法是处理广义线性模型的一种估计方法。 广义线性模型是指线性模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ei 0 1 x ji i
ei 0 1xi2 i
ei 0 1 x ji i
ei
0 1
1 x ji
i
对本例进行Glezser test
异方差的诊断
2、正规的检验 (2)戈德菲尔德-匡特检验(Glodfeld-
F(n1 k,n2 k )
所以,可进行F检验。
异方差的诊断
2、正规的检验 (2)戈德菲尔德-匡特检验(Glodfeld-
Quandt test)
如果,
则拒绝“原假设”存在异方差
戈德菲尔德-匡特检验(GlodfeldQuandt test)
F
RSS1 RSS
2
/ (n1 / (n2
前者是后者的特例。
Generalized Least Squares
• 考虑如下数据生成过程:
Yi 0 1X i ui E(ui ) 0; Var(ui ) 2f(X i )
1,200
800
400
0 12,000 16,000 20,000 24,000 28,000 32,000
INC
ABRE
案例:用截面数据估计消费函数
直观感受:
存在异方差 (heteroskedasticity)
Homoskedasticity (同方差)
Heteroskedasticity(异方差)
2,000
1,600
1,200
ABRE
800
400
横轴:收入
纵轴:残差 的绝对值
0 12,000 16,000 20,000 24,000 28,000 32,000
INC
异方差的诊断
2、正规的检验
(1)戈里瑟检验(Glezser test)
(2)戈德菲尔德-匡特检验(GlodfeldQuandt test)
异方差的诊断
2、正规的检验 (3)怀特检验:
③ 由上述辅助方程的R2构成的统计量 nR2服从X2 (p)分布,可进行卡方检验;
大于临界值时,拒绝同方差假设
当然,也可以应用F检验。
案例:纽约的租金和收入
案例:纽约的租金和收入
因变量:RENT(n=108)
变量 系数
T统计量
C
5455.48
9.05
12,000
10,000
8,000 12,000 16,000 20,000 24,000 28,000 32,000 INC
异方差的诊断
2、正规的检验
(2)戈德菲尔德-匡特检验(GlodfeldQuandt test)
在同方差的情况下,有:
F
RSS1 / (n1 k ) RSS2 / (n2 k )
(3)怀特检验(White test)
异方差的诊断
2、正规的检验 (1)戈里瑟检验(Glezser test) :
①原始回归,获得残差ei; ②用|e|对可疑变量做各种形式的回归;
ei
0
1
x
h ji
i
③对原假设H0: δ1=0,进行检验 .
异方差的诊断
2、正规的检验 (1)戈里瑟检验(Glezser test) :
Income 0.06
4.42
R2=0.1555
案例:纽约的租金和收入
怀特的辅助回归
因变量:e2 (n=108)
变量
系数
C
-14657900
Income 1200.58
Income2 -0.01
T统计量 -1.58 2.42 -1.87
R2=0.082
案例:纽约的租金和收入
怀特统计量=108*0.082=8.87, 自由度为2的卡方统计量=5.99
拒绝“没有异方差”的原假设!
点点滴滴:
EVIEWS设计的一个缺陷: (1)如果在进行怀特检验时,选择“不包 括交叉项”; (2)如果你的原始回归本身不带常数项;
在上述两种情况下,white检验的辅助回 归方程中都不会出现“解释变量的水平值 ”,只有其平方项。
异方差的诊断
2、正规的检验
注意:遗漏变量对异方差检验的影响
k) k)
2.4141
所以,拒绝原假设。即,认为存在异方差
异方差的诊断
2、正规的检验 (3)怀特检验(White test):
由H. White 1980年提出
①原始回归,获得残差ei; ②用ei2对 常数项、x,x2,交叉项同时 做回归;(回归方程称为:辅助方程 ausiliary equation) 该方程中,解释变量的个数为“p”(不 不包括常数项)
第二章:异方差及其处理
案例:用截面数据估计消费函数
上机实验:利用31个省市自治区的人均 收入与人均消费数据估计消费函数。
Consumption = 0.7042*Income t=(83.0652)
R2=0.9289
案例:用截面数据估计消费函数
观察残差图(取残差绝对值):
2,000
1,600
Quandt test)
先给原始数据进行排序,然后。。。
戈德菲尔德-匡特检验(Glodfeld-
Quandt test)
3/8个样本
¼ 个样本
24,000
22,000
两个回归 可以产生 两个残差 平方和
CONS
20,000 18,000 16,000 14,000
同方差时, 两个残差 平方和应 该差不多!
当原方程遗漏重要变量时,异方差检验 通常无法通过;
所以,在进行异方差检验时,先要保 证没有遗漏重要变量——拉姆齐检验
异方差的诊断
更多的时候,我们需要进行定 性的分析!!!!!!
异方差的处理
1、加权最小二乘法(WLS) Weighted Least Squares
广义最小二乘(GLS) Generalized Least Squares
异方差的危害
OLS估计量依然是无偏的 但不再具有有效性!! t检验、F检验无效 置信区间不可信
异方差的诊断
• 1.画图法: 以Xi或Yi为横坐标,以|ei|或ei2为纵坐标
|ei|
ei
0
0 Xi或Yi
Xi或Yi
这说明没有异方差
异方差的诊断
1.画图法:
|ei|
ei
0
0
Xi或Yi
这说明存在异方差
Xi或Yi
消费与收入(我国31个省市, 2011年)
RESID
2,000
1,500
1,000
500
0
-500
-1,000
-1,500
-2,000 12,000 16,000 20,000 24,000 28,000 32,000
横轴:收入; 纵轴:ห้องสมุดไป่ตู้差;
INC
消费与收入(我国31个省市, 2011年)