对数正态分布参数的精确估计及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推论 1
exp( a + b 2) 的修正极大似然估计 exp( aX ) ex p
1 2
r2
Fn (
r)
,
其中
r2=
2
bn n-
a2 1
S
2,
n
2, 0<
2
bn n-
a2 1
S
<
3。
由推论 1 可得, 对数正态分布的 m 阶原点距 V m = exp
m
+
1 2
2 m2
的修正极大似然估计
V
+ m
=
ex p( mX ) ex p
i3
1 n2
+
i4
1 n3
+
i5
1 n5
,
i=
1, 2, 3, 4。
T araldsen 通过数量上的模拟表明, 当样本容量很大时, Y + 与 Y * 近似相等, | ln( Y + ) - ln( Y * ) | <
0 07, 且
F
n2
1,
(
n
- 1) 4n
2
S
2
ex p
1 2
S 2F n(
S)
1 2
S2
Fn(
S
)
收稿日期: 2008 03 27。 作者简介: 张志国( 1981- ) , 男, 黑龙江齐齐哈尔人。
2 70
辽宁科技大学学报
第 31 卷
其中: F n ( S ) =
1[ n] +
2[ n] S +
3[ n] S 2+
4 [ n] S4 , i[ n] =
i1 +
i2
1 n
+
在股票市场当中, 描述股市涨跌有众多指标, 其中最重要的是大盘收盘指数和日成交量。但大盘指 数的高低是相对的, 它只是表面现象, 而大盘的日成交量的变化才真正反映了股市买卖冷热的变化。由 2000- 2002 年上海股票交易所大盘日成交量的数据可知, 在大部分时间, 当股票的日成交量一直持续 在均值以下, 突然某一天的日成交量大于均值 1285. 29( 百万股) , 接着就会有一段时间, 有的甚至持续 几个月的时间, 股票的日成交量在均值以上, 此时股票市场资金充沛, 交易比较活跃, 对于股民来说自然 有利可图; 反之, 则表明股票市场交易不活跃, 交易相对清淡, 对于股民来说应该等待时机, 正确运做自 己手里的股票。同时, 总体的峰度为负, 表明以同方差的正态分布为标准; 总体分布中两侧极端数据较 少, 即总体分布为细尾的。这些都为投资者分析判断市场行情并作出投资决策提供了重要依据。
关键词: 对数正态分布; 修正极大似然估计; M athematica 4 0; 大盘日成交量 中图分类号: O212 1 文献标识码: A 文章编号: 1674 1048( 2008) ( 03 04) 0269 04
两参数对数正态分布是常见的一种用来描述正的有偏数据的分布, 被广泛地应用于经济、医学、生 物和材料等研究领域。Zhou 介绍了对数正态分布均值三种常见的估计方法[ 1] 。T araldsen 提出均值的 精确估计[ 2] , 并且表明此估计容易计算, 估计的性质比其他三种估计优良。本文在此基础上进一步研究 了对数正态分布参数的精确估计问题。
第 31 卷 第 3 4 期 2008 年 6 月
辽宁科技大学学报 Journal of Universit y of Science and T echnology Liaoning
V ol. 31 N o. 3 4 Jun. , 2008
对数正态分布参数的精确估计及其应用
张志国1 , 曹 洋2 , 孙 平3
n 2, 0 < S < 3
( 1)
2 主要结果
孙孝前等给出如下结论[ 3] :
定理 1
G ( X , S2 ) = ex p( aX ) F
n2
1,
b-
a2 2n
( n-
2
1) S2
=
ex p( aX )
k= 0
n2
k+
1 n
b-
-1 2
a2 k 2n
k! 2k
[(
n
-
1) S 2 ] k
为参数 exp( a + b 2) 的一致最小方差无偏估计, 其中 a, b 已知。由近似关系( 1) 得到如下结论:
bj [ a]
j
,
[
a
]
j
=
[
a+ j [ a]
]
,
是 Gamma 函数。样本均值和极大似然估计不够精确,
而一致最小方差无偏估计计算困难, 因此这三种估计方法都不够优良。 2 2 修正极大似然估计 Y +
T araldsen 提出均值的精确估计 Y + [ 2] , 表达式为
Y+ =
ex p X +
2 72
辽宁科技大学学报
第 31 卷
2004, 331( 3 4) : 617- 638. [ 5] ZHI H, SHEN H. A better estimate of log normal means on pharmacokinetic data[ J] . Clinical Pharmacolog y & T herapeutics,
3. College of S cience, Nort heast U n iversit y, S henyang 110003, China)
Abstract: T he four est imators of m ean of t w o paramet ers log normal distribut in w ere analyzed, in w hich t he modif ied M LE given by Gunnar T araldsen was t he excellent est imat or. On t he basis of this, t he modified M L E of t he m exponent original m at rix , t he m exponent cent ral mat rix and kurtosis w ere discussed. M oreover, it is proposed t hat t he median, mode and skew ness do not exist the modified ML E. And Shanghai St ock Exchange is artificially analyzed by Mathematica 4 0, the result show s t hat it is com pletely consistent w it h theoret ical derivat ion. Key words: log normal dist ribution; modified max imum likelihood estimat or; M at hemat ica 4 0; daily t urn over of larg e cap
[ 1] ZHO U X H. Estimat ion of the log nor mal mean[ J] . Statistics in M edicine, 1998, 17( 19) : 2251- 2264. [ 2] T ARAL DSEN G. A precise est imator for the log normal mean[ J] . Statistical M ethodolog y, 2005, 2( 2) : 111- 120. [ 3] 孙孝前, 陈学华. 对数正态分布参数的 U M V U E[ J] . 铁道师院学报, 1998, 15( 4) : 20- 24. [ 4] AN T ON IOU I , IV AN OV Vi V , IVA NOV V a V , et al. On the log normal distr ibution of stock market data[ J] . P hysica,
由推论 1 也可得出如下结论: 推论 2 总体的中位数、众数和偏度虽然也具有 exp( a + b 2 ) 的形式, 但是没有修正极大似然估
计。
证明 总体的中位数为 ex p( ) , 由推论 1 得
r2 =
2bn n-
a2 1
S2
=
-1 n-
1
S
2
<
0
第34期
张志国, 等: 对数正态分布参数的精确估计及其应用
Precise estimation and application of log normal distribution parameters
ZH A N G Zhi guo, CA O Yang, S UN Ping
( 1. School of Scien ce, U niversity of S cience an d Technology Liaoning, A nshan 114051, China; 2. Anshan T echnician College, Anshan 114001, China;
r2
Fn
(
r)
其中:
r2=
n n-
1
( m-
j) 2+
j-
m2 n
S 2, 0<
n n- 1
( m-
j) 2+
j-
m2 n
S< 3。
另外, 也得到对数正态分布的峰度
K=
U4
U
2 2
-
3=
exp( 4
2) -
ex p( 3
2) -
3exp( 2
2) -
6
的修正极大似然估计。由推论 1 分别令 a= 0, b = 2, 3, 4 可得。
4结语
讨论了对数正态总体的 m 阶原点矩和 m 阶中心矩以及总体峰度的修正极大似然估计问题, 并应 用到上海股票市场的大盘日成交量, 得到了一些有价值的结论。在实际的应用当中, 有时两参数的对数 正态分布并不能对数据进行充分的描述, 因此还可以应用三参数对数正态分布处理股票市场的大盘日 成交量。
参 考 文 献:
=
k= 0
ex p
32 2wk.baidu.com
+
k= 1
( - 1) 2kk 22k- 1
1
C [ k- 1 2 k- 2
exp (
2 ) ] 3 2- k + 2exp
2
2+
k=
1
( - 1) 2 k- 1 k 22 k- 2
C
k- 1 2 k-
2
[
ex
p(
2 ) ] 1 2- k
由推论 1, 当 a=
0, b =
1 2
i
,
S2
=
1 n-
n
1i=
(
1
X
i-
X ) 2。
1 1 三种均值估计 Zhou 总结了均值三种常见的估计方法[ 1] , 即样本均值 Y ; 极大似然估计
Y^ =
ex p X +
1 2
nn
1S 2
一致最小方差无偏估计
Y * = ex p( X ) F
n2
1, (
n - 1) 4n
2
S2
其中: F [ a, b ] = j= 0 j !
271
矛盾; 同理, 总体的众数 ex p( 矛盾。总体的偏度
- 2 ) , 其中
r2 =
2bn n-
a2 1
S2
=
-
2n n-
1
1
S
2
<
0
S=
U3
U
3 2
2
=
[ exp(
2 ) + 2] [ exp(
2 ) - 1] 1 2 =
[ ex p( 2 ) + 2]
C
k 1
2
(
-
1) k [ exp(
2 ) ] 1 2- k
-
k< 0 时
矛盾。
r2 =
2bn n-
a2 1
S2
=
2n
1 2
-
k
n- 1
S2 <
0
3 股票市场中的应用
A nt oniou, Zhi, Shen, 胡晓华等分别应用对数正态分布分析了相关数据[ 4- 6] , 其中, 胡晓华等利用 M at lab6 1 对上海股票交易所大盘日成交量( 单位: 百万股) , 时间为 2000- 2002 年 6 月 23 日两年半时 间, 共 584 个交易日进行统计分析, 表明股市大盘日成交量服从或近似服从对数正态分布。本文利用 M at hematica4 0 计算得到对数正态分布均值估计 Y = 1 290 0, Y^ = 1 285 32, Y * = Y + = 1 285 29; 峰 度估计 K^ = - 8 225< 0。仿真结果与前面的理论分析结果完全一致。
1 2
r2
Fn
(
r)
其中: r 2 = ( mS ) 2 , 0< mS < 3。
同时得到, 对数正态分布的 m 阶中心距 U m = exp( m
m
)
(-
1)
j
C
j m
exp
j= 0
( m- j ) 2+ j 2
2
的修正极
大似然估计
U+m =
m
(-
1
)
j
C
j m
ex
p(
mX ) exp
j= 0
1 2
( 1. 辽宁科技大学 理学院, 辽宁 鞍山 114051; 2. 鞍山技师学院, 辽宁 鞍山 114001; 3. 东北大学 理学院, 辽宁 沈阳 110003)
摘 要: 分析了两参数对数正态分布 均值四种常见的估计方法, 其中 Gunnar T ar aldsen 提出的 修正极大 似然
估计优于其他三种估计。在此基础上讨论了总体 m 阶原点矩和 m 阶中心矩以及峰度 的修正极大 似然估计, 而且 提出总体的中位数、众位数和偏度不存在修正的极大 似然估计, 并用 M athematica 4 0 对上海股票市 场的 大盘日成交量进行仿真分析, 结果表明与理论推 导完全一致。
1 预备知识
假设随机变量 Y > 0 服从两参数的对数正态分布, 记做 Y ~ L N ( , 2) , Y 1 , , Y n 是来自总体容
量为 n 的一个样本, 令 X 1 = ln( Y 1 ) ,
, X n = ln( Y n ) 。记 Y =
1 n
n i= 1
Yi,
X
=
1 n
n i= 1
X
2004, 75( 2) : 42. [ 6] 胡晓华, 虞敏. 上海股市成交量服从( 或近似服从) 对数正态分布[ J] . 应用概率统计, 2005, ( 1) : 101- 105. [ 7] 卯诗松, 王静龙, 濮小龙. 高等数理统计[ M ] . 北京: 高等教育出版社, 1998: 95, 96. [ 8] 范金成, 梅长林. 数据分析[ M] . 北京: 科学出版社, 2002: 3, 4.