序列的统计量、检验和分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这里N是观测值的数目;s是标准离差;R是序列的分位数 间距;因子k是标准带宽变换,标准带宽变换用来调整带宽以便 对不同的核函数自动密度估计有大致相当的平滑。 也可以自定带宽,先点击User Specified,在下面的对话框 中键入一个非负数。
27
下图是GDP增长率序列分布的核密度估计:
28
§1.3.2 带有拟合线的散点图
8
§1.2 均值、中位数、方差的假设检验

这部分是对序列均值、中位数、方差的假设检验。在序
列对象菜单选择View/tests for descriptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框:
9
1. 均值检验

原假设是序列 x 的期望值 m ,备选假设是 ≠m ,即





这里u是核函数的辐角,I (.)是指示函数,辐角为真时,它取 1,否则取 0。26
(2) Bandwidth(带宽)
带宽h控制密度估计的平滑程度;带宽越大,估计越平滑。 带宽的选取在密度估计中非常重要,缺省设置是一种基于数据 的自动带宽,
h 0.9kN 1 / 5 min{ s, R / 1.34}
1 u I u
3 (1 u 2 ) I ( u 1) 4
1
Biweight(Quartic)
Triweight Cosinus
1 I u 1 2 1 1 2 exp u 2 2 15 2 2 1 u I u 1 16 35 2 3 1 u I u 1 32 cos u I u 1 4 2
14
§1.3 分布函数
EViews提供了几种对数据进行初步分析的方法。在§1.1 我们已列出了几种图来描述序列分布特征。在本节,列出了 几种散点图且允许我们可以用有参数或无参数过程来做拟合 曲线图。 这些图包含着复杂计算和大量的特殊操作,对某些完全 技术性的介绍,不必掌握所有细节。EViews中设置的缺省值

2
§1.1

描述统计量
以直方图显示序列的频率分布。直方图将序列的长度按 等间距划分,显示观测值落入每一个区间的个数。
同直方图一起显示的还有一些标准的描述统计量。这些 统计量都是由样本中的观测值计算出来的。如图(例1.1):

3
例1.3中GDP增长率的统计量:
4

均值 (mean) 即序列的平均值,用序列数据的总和除以数
24
当选View/Distribution Graphs/Kernel Density……会出现下 面的核密度对话框:
要展现核密度估计,需要指定如下几项:
25
(1) Kernel(核)
核函数是一个加权函数,它决定冲击的形状。EViews针对核函数K提供如 下操作:
Epanechnikov(default) Triangular (三角形) Uniform(Rectangular) (均匀分布) Normal(Gaussian) (正态分布)
通过view/Graph/Scatter打开一个组的视图菜单包括四种散 点图。 1. Simple Scatter(简单散点图)
其第一个序列在水平轴上,其余的在纵轴上。
2. Scatter with Regression(回归散点图)

原假设为序列x的中位数等于m,备选假设为双边假设,
x的中位数不等于m,即
H 0 : med x m H 1 : med x m
EViews提供了三个以排序为基础的无参数的检验统计量。 方法的主要参考来自于Conover(1980)和Sheskin(1997)。 进行中位数检验,在Median右边的框内输入中位数的值, 可以输入任何数字表达式。
21
下图是GDP增长率和指数分布的Q-Q图:
22
3. Kernel Density(核密度)
这个视图标绘出序列分布的核密度估计。一个序列的 分 布 的 最 简 单 非 参 数 密 度 估 计 是 直 方 图 。 通 过 选 View/ Descriptive Statistics/Histogram and Stats可以得到直方图, 直方图对原点的选择比较敏感并且是不连续的。下图是GDP 增长率序列分布的直方图:
H0 : m H1 : m
如果不指定序列 x 的标准差,EViews将在 t – 统计量中使 用该标准差的估计值 s 。
t
x m s N
,
s
1 N xi x 2 N 1 i 1
x是 x 的样本估计值,N是x的观测值的个数。在原假设下,
如果x服从正态分布,t 统计量是自由度为N-1的t分布。
18
工作文件1_3.wf1中GDP增长率的分布图
19
2. Quantile—Quantile图
Quantile—Quantile ( QQ图)对于比较两个分布是一种简单 但重要的工具。这个图标绘出一个被选序列的分位数分布相对于 另一个序列的分位数分布或一个理论分布的异同。如果这两个分 布是相同的,则QQ图将在一条直线上。如果QQ图不在一条直线 上,则这两个分布是不同的。 当选择View/Distribution Graphs/Quantile-Quantile…. 下面的QQ Plot对话框会出 现:
绝原假设。这里我们不能拒绝原假设。
12

2. 方差检验 检验的原假设为序列 x 的方差等于 2,备选假设为双边的,
x 的方差不等于 2 ,即 H 0 : var x 2
H 1 : var x
2
2
EViews计算2统计量,计算公式如下
N 1s 2

7

Jarque-Bera 检验 检验序列是否服从正态分布。统计
量计算公式如下
N k JB 6
2 1 2 S 4 K 3
S为偏度,K为峰度,k是序列估计式中参数的个数。
在正态分布的原假设下,J-B统计量是自由度为2的 2 分 布。 J-B统计量下显示的概率值(P值)是J-B统计量超出原 假设下的观测值的概率。如果该值很小,则拒绝原假设。当 然,在不同的显著性水平下的拒绝域是不一样的。例1.1中X 的J-B统计量下显示的概率值(P值)是0.92,接受原假设, X 服从正态分布;而例1.3中GDP增长率的的J-B统计量的概率 值(P值)是0.455 ,也接受原假设, 说明GDP增长率服从正态 分布。
的S值意味着序列分布有长的左拖尾。例1.1中X的偏度为0,说明
X的分布是对称的;而例1.3中GDP增长率的偏度是0.78,说明 GDP增长率的分布是不对称的。
6

峰度(Kurtosis) 度量序列分布的凸起或平坦程度,
计算公式如下
1 yi y K ˆ N i 1
ቤተ መጻሕፍቲ ባይዱ
23
核密度估计用“冲击”代替了直方图中的“框”,所以 它是平滑的。平滑是通过给远离被估计的点的观测值以小的 权重来达到的。 一个序列 X 在点 x 的核密度估计为:
1 N x Xi f ( x) ) K( Nh i 1 h
这里,N是观测值的数目,h是带宽(或平滑参数),K是 合并为一体的核函数。
N


4
意义同S中 ,正态分布的 K 值为3。如果 K 值大于3,
分布的凸起程度大于 正态分布;如果K值小于3,序列分布相 对于正态分布是平坦的。例1.1中X的峰度为2.5,说明X的分 布相对于正态分布是平坦的;而例1.3中GDP增长率的峰度为 2.14 ,说明GDP增长率的分布相对于正态分布也是平坦的。
17
Quantile(分位数) 操作用来描绘序列的经验分位数。对 0 q 1, X 的分位数 x(q) 满足下式:
prob( x x(q) ) q ,且 prob( x x( q) ) 1 q
分位数函数是CDF的反函数,可以通过调换CDF的横纵 坐标轴得到。 All选项包括CDF,Survivor和Quantile函数。 Saved matrix name可以允许把结果保存在一个矩阵内。 Include standard errors(包括标准误差)操作标绘接近 95%的置信区间的经验分布函数。
2
,
1 N 2 2 s xi x N 1 i 1
N为观测值的个数,x 为x的样本均值。在原假设下,如果x 服从正态分布, 2 统计量是服从自由度为N-1的 2分布。
要进行方差检验,在Variance处填入在原假设下的方差值。 可以填入任何正数或表达式。
13
3. 中位数检验
第一章

序列的统计量、检验和分布
EViews提供序列的各种统计图、统计方法及过程。
当用前述的方法向工作文件中读入数据后,就可以对 这些数据进行统计分析和图表分析。 EViews可以计算一个序列的各种统计量并可用表、 图等形式将其表现出来。视图包括最简单的曲线图,一直
到核密度估计。
1
打开工作文件,双击一个序列名,即进入序列的对话 框。单击“view”可看到菜单分为四个区,第一部分为序列 显示形式,第二和第三部分提供数据统计方法,第四部分是 转换选项和标签。
16
其中,Cumulative Distribution(累积分布)操作用来描 绘序列的经验累积函数(CDF)。CDF是序列中观测值不
超过指定值 r 的概率
Fx (r ) prob( x r )
Survivor(残存)操作用来描绘序列的经验残存函数
S x (r ) prob( x r ) 1 Fx (r )
除了对极特殊的分析外,对一般分析而言是足够用的。直接
点击ok键接受缺省设置,就可以轻松的展现出每个图。
15
§1.3.1 序列分布图
本节列出了三种描述序列经验分布特征的图。
1. CDF—Survivor—Quantile图
这个图描绘出带有加或减两个标准误差带的经验累积分布 函数,残存函数和分位数函数。在序列菜单中或组菜单中选择 View /Distribution/ CDF—Survivor—Quantile…时 ( 组菜单的 Multiple Graphs中),就会出现下面的对话框:
10

如果给定x的标准差,EViews计算t 统计量:
x m t N
是指定的x的标准差。
要进行均值检验,在Mean内输入
值。如果已知标准差,
想要计算t统计量,在右边的框内输入标准差值。可以输入任何 数或标准EViews表达式,下页我们给出检验的输出结果。
11
这是检验例1.7中GDP增长率的均值,检验H0:X=10%, H1:X≠10%。表中的Probability值是P值(边际显著水平)。 在双边假设下,如果这个值小于检验的显著水平,如0.05则拒
20
可以选与如下的理论分布的分位数相比较: Normal(正态)分布:钟形并且对称的分布. Uniform(均匀)分布:矩形密度函数分布. Exponential(指数)分布:联合指数分布是一个有着一条 长右尾的正态分布. Logistic(逻辑)分布:除比正态分布有更长的尾外是一种 近似于正态的对称分布. Extreme value(极值)分布:I型极小值分布是有一条左长 尾的负偏分布,它非常近似于对数正态分布. 可以在工作文件中选择一些序列来与这些典型序列的分 位数相比较,也可以在编辑框中键入序列或组的名称来选择 对照的序列或组,EViews将针对列出的每个序列计算出QQ 图。
据的个数。
中位数 (median) 即从小到大排列的序列的中间值。是对 序列分布中心的一个粗略估计。
最大最小值 (max and min) 序列中的最大最小值。
标准差(Standard Deviation) 标准差衡量序列的离散程度。 计算公式如下
ˆ s
1 N 2 yi y N 1 i 1
5
N 是样本中观测值的个数, y 是样本均值。

偏度(Skewness) 衡量序列分布围绕其均值的非对称
性。计算公式如下
1 S N


i 1
N
yi y ˆ
3
s ( N 1) / N 是变量方差的有偏估计。如果序列的分布
是对称的,S值为0;正的S值意味着序列分布有长的右拖尾,负
相关文档
最新文档