第01章 概率与统计基础(第三版)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
3. 分布函数
EViews提供了几种对数据进行初步分析的方法。在§1.1 我们已 列出了几种图来描述序列分布特征。在本节,列出了几种散点图且允
许我们可以用有参数或无参数过程来做拟合曲线图。
这些图包含着复杂计算和大量的特殊操作,对某些完全技术性的 介绍,不必掌握所有细节。EViews中设置的缺省值除了对极特殊的分
当选择View/Graphs/Distribution:Quantile-Quantile 右面的QQ
Graph对话框选择: Theoretical,点击右侧的“Option”按钮,会出 现如下对话框,可以选择比较的理论分布的分位数类型:
19
可以选与如下的理论分布的分位数相比较:
Normal(正态)分布:钟形并且对称的分布. Uniform(均匀)分布:矩形密度函数分布.
要进行均值检验,在Mean内输入 值。如果已知标准差,想要计算 t 统计量,在右边的框内输入标准差值。可以输入任何数或标准 EViews 表达式,下页我们给出检验的输出结果。
11
这是检验例1.7中GDP增长率的均值,检验H0:X=10%, H1:X ≠ 10%。表中的Probability值是P值(边际显著水平)。 在双边假设下,如果这个值小于检验的显著水平,如0.05则拒绝 原假设。这里我们不能拒绝原假设。
选择View/Descriptive Statistics & Teats /Simple Hypothesis Tests,就会出 现下面的序列分布检验对话框:
9
(1)均值检验
原假设是序列 x 的期望值 m ,备选假设是 ≠m ,即
H0 : m H1 : m
如果不指定序列 x 的标准差,EViews将在 t – 统计量中使用该标准差的 估计值 s 。
prob( x x(q) ) q
,且
prob( x x( q) ) 1 q
分位数函数是CDF的反函数,可以通过调换CDF的横纵坐标轴得 到。
18
(2) Quantile—Quantile图
Quantile—Quantile ( QQ图)对于比较两个分布是一种简单但重要 的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列 的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则 QQ图将在一条直线上。如果QQ图不在一条直线上,则这两个分布是不 同的。
1. 描述统计量
以直方图显示序列的频率分布。直方图将序列的长度按等间距划分,
显示观测值落入每一个区间的个数。
同直方图一起显示的还有一些标准的描述统计量。这些统计量都是
由样本中的观测值计算出来的。如图(例1.1):
3
例1.3中GDP增长率的统计量:
4
均值 (mean) 即序列的平均值,用序列数据的总和除以数据的个数。
值意味着序列分布有长的左拖尾。例1.1中X的偏度为0,说明X的分
布是对称的;而例1.3中GDP增长率的偏度是0.78,说明GDP增长率 的分布是不对称的。
6
如下
峰度(Kurtosis) 度量序列分布的凸起或平坦程度,计算公式
1 yi y K ˆ N i 1
1
打开工作文件,双击一个序列名,即进入序列的对话框。单击 “view‖可看到菜单分为四个区,第一部分为序列显示形式,第二和第 三部分提供数据统计方法,第四部分是标签。
点击“Decriptive Statistics & Teats‖可看到一个对话框,点击
2
“Histogram and Stats‖ 可以显示序列的描述统计量。
N
4
ˆ 意义同S中的 ˆ ,正态分布的 K 值为3。 其中
如果 K 值大于3,分布的凸起程度大于 正态分布;如果K值小于3,
序列分布相对于正态分布是平坦的。例1.1中X的峰度为2.5,说明X的分布
相对于正态分布是平坦的;而例1.3中GDP增长率的峰度为2.14 ,说明 GDP增长率的分布相对于正态分布也是平坦的。
的相关。
28
第二列为自由度,第三列是统计量值,第四列为P值。
24
例1.5中方差相等性检验的输出结果
25
3. 协方差和交叉相关系数
交叉相关(Cross correlation and Correligrams) 显示组中头两个序列的交叉相关。序列 X 与 Y 的交叉相关的计算公式 如下:
rxy l
c xy l c xx 0 c yy 0
个公式相对应,i 是延迟数,lag和lead是相应的交叉相关系数。可 以看出,CS_R 和GDP_R的同期相关系数、CS_R与GDP_R(+i)和
GDP_R(i)的相关系数都较高,因此可以认为消费增长率与GDP增
长率波动基本一致,略微先行(lead)。同时要注意,最大的相关 系数虽然接近、但也没有超过二倍的标准差,因此还不是非常显著
N 是样本中观测值的个数, y 是样本均值。
5
偏度(Skewness) 衡量序列分布围绕其均值的非对称性。
计算公式如下
1 S N
其中
i 1
N
yi y ˆ
3
s ( N 1) / N
是变量方差的有偏估计。如果序列的分布
是对称的,S值为0;正的S值意味着序列分布有长的右拖尾,负的S
l 0,1,2
T l xt x yt l y T t 1 c xy l T l yt y xt l x T t 1
的虚线是二倍Hale Waihona Puke Baidu标准差,近似计算。
l 0,1,2,3 l 0,1,2
12
(2) 方差检验
检验的原假设为序列 x 的方差等于 2,备选假设为双边的,x 的方差
不等于 2 ,即
H 0 : var x 2 H 1 : var x 2
EViews计算2统计量,计算公式如下
2 N 1 s 2
2
,
1 N 2 s x x i N 1 i 1
相比较,也可以在编辑框中键入序列或组的名称来选择对照的序 列或组,EViews将针对列出的每个序列计算出QQ图。
20
下图是GDP增长率和指数分布的Q-Q图:
21
1.2 多序列的显示和统计量
对几个感兴趣的序列之间的关系的直 观描述可以通过―组‖中提供的方便功能来 实现。通过组,可以计算几种统计量、描 述不同序列之间的关系,并以表格、数据 表和图等各种方式显示出来。组窗口内的 View下拉菜单分为4个部分:第一部分包 括组中数据的各种显示形式;第二部分包 括各种基本统计量;第三部分为时间序列 的特殊的统计量;第四部分为标签项,提 供组对象的相关信息。以下假定组中包含 G个序列。
7
Jarque-Bera 检验 检验序列是否服从正态分布。统计量计算公式如下
N k JB 6
2 1 2 S 4 K 3
其中,S为偏度,K为峰度,k是序列估计式中参数的个数。
在正态分布的原假设下,J-B统计量是自由度为2的 2 分布。 J-B统计
量下显示的概率值(P值)是J-B统计量超出原假设下的观测值的概率。 如果该值很小,则拒绝原假设。当然,在不同的显著性水平下的拒绝域是
2
N为观测值的个数, x 为 x 的样本均值。在原假设下,如果 x 服从正态 分布, 2 统计量是服从自由度为N-1的 2分布。
要进行方差检验,在Variance处填入在原假设下的方差值。可以填入 任何正数或表达式。
13
(3) 中位数检验
原假设为序列 x 的中位数等于m,备选假设为双边假设,x的中位数
22
1. N步列表、联合概率和统计量
例1.2给出的联合分布表可以通过N步列表以更加清晰的方式来 表现。 打开由X,Y组成的组,在组对象菜单中选择View/N-way Tabulation…,然后在出现的对话框的“Output”复选框上选择 Overall%(每个区间观测值占总个数的百分比),其他的不选,则 在出现的结果窗口的最下方的表格中显示了联合密度和边际密度:
注意与自相关不同,交叉相关不必围绕滞后期对称。交叉相关图中
26
居民消费(CS)和GDP的交叉相关系数
27
交叉相关系数显示组中前两个序列的交叉相关。交叉相关图的
每栏中两侧虚线对应着正负二倍标准差。图中计算了例1.5中消费 CS和GDP两个序列的交叉相关系数。
第1列与式(1.2.8)中第2个公式相对应,第2列与式(1.2.8)中第1
EViews可以描绘出序列的带有加、减二倍标准差的经验累积分布
函数(CDF)和分位数分布。
17
其中,Cumulative Distribution(累积分布)操作用来描绘序列的经验累 积函数(CDF)。CDF是序列中观测值不超过指定值 r 的概率
Fx (r ) prob( x r )
Quantile(分位数) 操作用来描绘序列的经验分位数。对 0 q 1, X 的分位数 x(q) 满足下式:
第一章 概率与统计基础
1.1 单序列的统计量、检验和分布
EViews提供序列的各种统计图、统计方法及过程。当用前述 的方法向工作文件中读入数据后,就可以对这些数据进行统计分
析和图表分析。
EViews 可以计算一个序列的各种统计量并可用表、图等形式 将其表现出来。视图包括最简单的曲线图,一直到核密度估计。
中位数 (median) 即从小到大排列的序列的中间值。是对序列分布
中心的一个粗略估计。 最大最小值 (max and min) 序列中的最大最小值。 标准差(Standard Deviation) 标准差衡量序列的离散程度。计算公 式如下
ˆ s
1 N 2 yi y N 1 i 1
23
2. 相等性检验
相等性检验(Tests of Equality)的原假设是组内所有的序列具有
相同的均值、中位数或方差。例1.5中的方差相等性检验可以通过这个功
能实现。选择View/Tests of Equality后,在出现的对话框中选择 “Variance” ,出现方差相等性检验结果,列出了各种不同的检验方法,
t
x m s N
,
s
1 N 2 x x i N 1 i 1
其中, x 是 x 的样本估计值,N是x的观测值的个数。在原假设下,如果 x
服从正态分布,t 统计量是自由度为N-1的t分布。
10
如果给定x的标准差,EViews计算t 统计量:
x m t N
是指定的x的标准差。
不等于m,即
H 0 : med x m H 1 : med x m
EViews提供了三个以排序为基础的无参数的检验统计量。方法的主
要参考来自于Conover(1980)和Sheskin(1997)。
进行中位数检验,在Median右边的框内输入中位数的值,可以输入 任何数字表达式。
析外,对一般分析而言是足够用的。直接点击ok键接受缺省设置,就
可以轻松的展现出每个图。
15
当选择View/Graphs时,再选择Specific表: “Distribution”,
并点击右侧的“Distribution:”的下拉列表会出现:
16
本节列出了二种描述序列经验分布特征的图。
(1) CDF—Survivor—Quantile图
不一样的。例1.1中X的J-B统计量下显示的概率值(P值)是0.92,接受原
假设, X 服从正态分布;而例1.3中GDP增长率的的J-B统计量的概率值(P 值)是0.455 ,也接受原假设, 说明GDP增长率服从正态分布。
8
2. 均值、方差和中位数的假设检验
这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单
Exponential( 指数 ) 分布:联合指数分布是一个有着一条长右
尾的正态分布. Logistic(逻辑 )分布:除比正态分布有更长的尾外是一种近似
于正态的对称分布.
Extreme value(极值)分布:I型极小值分布是有一条左长尾的 负偏分布,它非常近似于对数正态分布.
可以在工作文件中选择一些序列来与这些典型序列的分位数