stata操作介绍之相关性分析PPT课件02

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
correlate尽可能使用两两变量中所有没有缺失的数据
pwcorr [varlist] [if] [in] [weight] [ ,correlate_ options ]
pwcorr只采用没有任何缺失数据的完整观 测值
选项 means covariance
correlate 选 项 说 明含义
test price advert
P值,拒绝原假设 ,即价格和广告支出的 系数不同时为0
相关检验和处理
回归分析时通常需要检验数据是否存在多重共线、序列相关和异方差
等问题,如果存在这些问题,则需要对其进行处理。
1.多重共线性的检验和处理
中多重共线性检验的命令格式为:
vif //该命令用来得到自变量的方差膨胀因子
ptions]
选项 noconstant hascons level(#) beta noheader
含义 不加常数项做线性回归 由用户指定常数项的值 设定置信水平(默认值为95% ) 报告标准化的beta系数 不报告输出表名
实现因变量为销售收入,自变量为单价和广告支出的线 性回归,其命令为:
regress sales price advert
表下方区域为基本的回归结果。第1列依次为被解释变量 sales,解释变量price、advert,截距项constant;第2列 回归系数;第3列回归系数的标准误;第4列回归系数的 t 统计量值;第5列p值;
表左上方区域为方差分析表。第2列从上到下依次为回归平 方为和自(由SS度E,)、分残别差为平k方=2和,(nS-SkR-1)和=7总5-2离-1差=7平2,方n和-1(=S7S5T-1)=;74第;3列第 4列为均方和(MSS),由各项平方和除以相应的自由度得到。 表ua右red上)、方调区整域的给判出定了系样数本(数Ad(Nj uRm-sbqeuraroefdo)、bs)F、统判计定量系的数值(、R-回sq 归方程标准误 (Root MSE) 以及其他一些统计量的信息。
回归分析
回归分析时常用的Stata 命令有:regress , predict, test命令。regress predict, test 是一组命令,它们完成各种简单和多元的普通最小二 乘法回归。
实现因变量对自变量的回归
因变量
自变量
regress命令的格式: regress depvar indepvars[if] [in] [weight] [o
pwcorr , sig star(0.05)
2. Kendall T相关系数分析 Kendall T相关性分析是一个非参数度量变量间的相关性,其取值在 一1和1之间。 Kendall T相关性分析的命令格式:
ktau [varlist] [if] [in] [weight] [ , ktau _ options ]
一般来说,判断多重共线性的标准是(两个标准必须同时
满足): *最大的vif大于10; *平均的vif大于1.
由判断标准可知 不存在多重共线性
处理多重共线性的方法
1.如果只关心方程的预测能力,则在整个方程显著的条件 下,可以不必关心具体的回归系数。 2.增加样本容量,剔除导致多重共线性的变量或者修改模 型设定形式。 3.对于时间序列样本,通过使用差分模型可以一定程度上 消除原模型中的多重共线性。 4.岭回归方法。
计算拟合值和残差
指定需要拟合值
指定存储 类 型 的 格 变量名
还是残差值,若 为resid,则是残
predict命令pe]
newvar
[if]
[in差][,single_
opti
计on算s] 前面所求回归方程的拟合值和残差。其命令分别为:
predict y1
predict e, resid
2.异方差的检验和处理 中异方差检验的命令格式为: hettest或者imtest, white (怀特检验) 判断存在异方差的标准是:命令输出结果的P值小于,则拒 绝原假设,即存在异方差性。
hettest和怀特检验输出 结果的p值均大于故不 存在异方差性
处理异方差性的方法
1.在regress命令的options选项中选择robust选项即可; 2.加权最小二乘法(WLS) 。
3.序列相关的检验和处理
中检验序列相关性的方法: 检验 命令为:estat bgodfrey (默认p=1)
estat bgodfrey,lags(p) estat bgodfrey, nomiss0 (使用不添加0的BG检 验) 2.box-pierce Q检验/ Ljung-Box Q 命令为: reg y x1 x2 x3
spearman [varlist] [if] [in] [weight] [ , spearman _ options ]
用spearman命令实现所有变量的Spearman秩相关系数分 析,并在显著性水平超过的相关系数上打上星号,其命 令为:
spearman, star(0.05)
4.偏相关系数分析
进行指定的检验
test命令主要用来检验系数是否符合一定的关系.test命令的格式
如下:
检验多个变量的系数是否同时为零
test varl var2…var3k 检验变量的系数是否为C
test var=C
检验两个变量的系数是否相等
test varl=var2
检验多个变量之间存在的一些关系
t用esttevsta命rl=令(v检ar验2+价va格r3)和/C广告支出的系数是否同时为0,其命令为:
选项 print(#) star(#)
含义 在屏幕上仅显示达到相应显著性水平的相关系数 在显著的相关系数上打上星号
用ktau命令实现所有变量的Kendall T相关系数分析,并 在显著性水平超过的相关系数上打上星号,其命令为:
ktau , star(0.05)
3. Spearman秩相关系数分析 Spearman秩相关性分析也是一种不依赖于总体分布的非参数检验, 取值也在一1和1之间。 Spearman秩相关性分析的命令格式:
双变量相关分析是研究两个变量之间的相关关系,有时在分析两个 变量之间相关关系时,往往会有其他变量的影响因素混合在里面, 此时计算出来的相关系数可能并不能真正反映两个变量之间的关系。 偏相关性分析的命令格式:
pcorr varnamel varlist [if] [in] [weight]
用pcorr命令实现偏相关分析,其命令为: pcorr, sales price advert
显示变量的均值、标准差、最大最小信 显示协方差矩阵
选项 obs sig print(#) star(#) listwise
pwcorr 选 项 说
含义

显示计算每个相关系数时使用的观测值个数
显示显著性检验的P值
在屏幕上仅显示达到相应显著性水平的相关系数
在显著的相关系数上打上星号
使用listwise的方法处理缺失值,这样pwcorr就退化成
predict el, resid wntestq el (使用stata提供的默认滞后期) wntestq el, lags(p) (使用自己设定的滞后期) 检验:现在已经不常用,因为其只能检验一阶自相关。 命令为: estat dwatson
中处理序列相关性的方法:
1. Newey稳健性标准差 newey y x1 x2 x3, lag(p) (滞后阶数必选)
correlate命令了。所谓listwis。方法是说,如果某一观测值
中某个或者多个变量出现缺失,则将整个观测值删掉,这
也正是correlate命令使用的方法。对于没有缺失值的数据
集,这两种方法没有区别
用pwcorr命令实现所有变量的Pearson相关系数分析,并 在显著性水平超过的相关系数上打上星号,其命令为:
• 相关性分析 • 回归分析 • 多重共线性等相关检验和处理
线性回归分析的stata应用实例
本部分用到的实例是Big Andy’s Burger Barn的 销售模型。Big Andy的汉堡销售收入取决于单 价和广告支出水平 。因此,这个模型包含两个 解释变量和一个常数项。 sales= α1 +α2*price +α3*advert+ ε
2.使用OLS+聚类稳健的标准差(cluster robust standard error)面板数据中经常使用聚类稳健的标准差。 reg y x1 x2 x3, cluster(state) (聚类稳健标准差,假设“st ate”为聚类变量) 3.使用可行广义最小二乘法(FGLS) prais y x1 x2 x3 (使用默认的PW估计法) praise y x1 x2 x3, corc (使用CO估计法) 4.修改模型设定,可能自相关是由于遗漏了自相关的解释 变量。
其中,sales为指定城市的月销售额并以千美仄 元度量,price是以美元度量的单个汉堡的价格, advert为广告支出,同样以千美元度量。
相关性分析
相关性分析主要目的是研究变量之间关系的密切程度。 相关性分析的方法主要有:Pearson相关系数分析、Kend all T相关系数分析、Spearman秩相关系数分析以及偏相 1.关Pe系ar数so分n相析关。系数分析 Pearson相关性分析是一个描述线性相关强度的量,取值于一1和1 之间。 Pearson相关性分析的命令格式: correlate [varlist] [if] [in] [weight] [ ,correlate_ options ]
相关文档
最新文档