基于模糊结构元理论的模糊值函数拟合及其应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于模糊结构元理论的模糊值函数拟合及其应用
陈斌,吴丹
辽宁工程技术大学工商管理学院,辽宁葫芦岛(125105)
E-mail :binchen869@
摘 要:最小二乘和代数插值都是传统的函数拟合的常用方法。

然而,在观测数据波动十分复杂混乱时,这种方法却不太适用。

本文利用模糊结构元线性生成模糊值函数的方法,对股票成交量的散点数据进行拟合,同时用一个函数来描述这种变化趋势的不确定性程度。

关键词:模糊结构元;模糊值函数拟合;代数插值 中图分类号:O159
1.引 言
L.A.Zader 教授1965年发表《模糊集合》论文并建立了模糊集合论[1]以来,模糊数学这门学科迅速发展起来。

在定义了模糊数的基础上,人们定义了模糊函数理论:函数是实数集到实数集上的映射,函数的取值为实数。

如果规定一个法则,使函数的取值为模糊数,则称为模糊函数(或模糊值函数)[2]。

最小二乘和代数插值都是传统函数拟合的常用方法。

然而,在观测数据波动十分复杂混乱时,任何精确函数的拟合都将失去意义。

郭嗣琮教授[3]-[5]提出了模糊结构元的概念,给出了模糊数和模糊值函数的结构元表示,建立在此基础上的模糊值函数拟合方法比传统的方法能更好地反映变量之间的关系,揭示复杂数据的运动规律。

2.基本概念及定理
定义1.1 设E 为实数域R 上的模糊集,隶属函数记为)(x E ,R x ∈。

如果)(x E 满足下述性质:
a) 1)0(=E ,()0)01(0
1=−−=+E E ;
b) 在区间[]0,1−上)(x E 是单增右连续函数,在区间[]1,0上)(x E 是单增左连续函数; c) 当1−<∝<−x 或∝+<x 1时,)(x E =0。

则称模糊集E 为R 上的模糊结构元[6]。

根据定义,模糊结构元是R 上的正规凸模糊集,即是一个模糊数,并且是有界闭模糊数。

它是表示模糊零概念的特殊模糊数,可以具有多种形态。

定义1.2 设E 为R 上的模糊结构元,若满足:
对于)1,1(−∈∀x 0)(>x E ,在区间[)0,1−上)(x E 是连续且严格单调增的,在区间(]1,0上是连续且严格单调降的。

则称E 为正则模糊结构元。

定义1.3 设模糊集E 具有隶属函数
⎪⎩⎪
⎨⎧∈−−∈+=其他,

,, 0 ,]1,0( 1,
]0,1[1)(x x x x x E
称E 为三角结构元,隶属函数如图1所示。

三角结构元是一个正则的模糊结构元。

)(x E
图1三角结构元
Fig1 Triangle structured element
定理1(局部映射原理) 设E 是R 上的任意模糊结构元,具有隶属函数)(x E ,又设
函数)(x f 在区间[]1,1−上是单调有界的,)(ˆx f 是)(x f 的延拓集值函数,则)(ˆE f 是R 上的有界闭模糊数,且)(ˆE f
的隶属函数为))((1
x f E −,这里)(1
x f
−是关于变量x 和y 的轮换对称函数(若)(x f 在区间[]1,1−上是连续严格单调的,则)(1
x f −是)(x f 的反函数)。

定义1.4 设y x x f y x g )()(),(ω+=,其中)(x f 和)(x ω在X 上有界,且)(x ω非负。

易知),(y x g 是关于在[]1,1−上的单调有界函数,则
E x x f x
F )()()(~
ω+=
是X 上的一个模糊值函数,称为由模糊结构元E 线性生成的模糊值函数。

)(~
x F 的隶属函数可以由模糊结构元的隶属函数表示为
)
()
(()()
(~x x f y E y x F ωµ−=,Y y ∈∀。

3.模糊值函数拟合
3.1 模糊回归分析的拟合方法
以一元线性回归为例,设随机变量y 与变量x 间存在着某种相关关系,观测数据为
).,(),,(),,(2211n n y x y x y x L
进一步假设对于x 的每一个值,随机变量服从正态分布,即),(~2
σbx a N y +,其中b a ,及
σ都是不依赖x 的未知参数,即回归方程为
x b a
y ˆˆ~+= 利用传统方法可以估计出参数为
∑∑==−−−=−=n
i i
n
i i i
x x
y y x x
b x b y a
1
2
1
)()
)((ˆ,ˆˆ
同时求出2
σ的无偏估计为
∑=−−=n
i i y y n 1
22
)ˆ(21ˆσ 其中x 和y 分别为观测数据i x 和),2,1(n i y i L =的算术平均值。

2
ˆσ
反映了变量y 的平均分散程度。

构造模糊值函数为
E x b a
x y 2ˆˆˆ)(~σ++= 其中E 是一个对称正则的模糊结构元,建议采用正态模糊数,即模糊结构元的隶属函数为
⎪⎩⎪
⎨⎧−∈−=其他
,0 ],1,1[ ],)(exp[)(2y m
y y E 3.2 代数插值的拟合方法
在模糊回归方法中,由于2ˆσ
被估计为一个定数,因此,模糊值函数E bx a x y 2
ˆ)(ˆσ++=是定常模糊值函数,函数)(ˆx y
在任何x 处的模糊程度都是一致的,因此用以描述波动十分复杂的曲线时,无法刻画出不同的x 点处数据分散的不确定性程度。

此时,利用代数插值方法来估计模糊值函数更为合适。

设观测数据(如时间序列)为},,2,1|),{(n k y x k k L =,其中n x x x L <<21。

为找出离散数据的中心趋势,先利用数据的滑动平均法求出其滑动平均序列。

例如,建立数据的三步滑动平均序列为
)ˆ,ˆ(11y x
,)ˆ,ˆ(22y x ,…,)ˆ,ˆ(22−−n n y x , 其中
3ˆ21++++=i i i i x x x x
,3
ˆ2
1++++=i i i i y y y y 。

(3.1)
根据数据)}ˆ,ˆ{(i i y x
表现的趋势及数据量的大小,适当构造一个插值函数 011
1)(a x a x
a x a x f k k k
k +++=−−L (3.2)
作为所要构造的模糊值函数的核函数。


3
ˆˆˆ)(21i i i i i i i y y y y y
y x d −+−+−=
++, (3.3)
)(x d i 的大小反映了原始数据在各局部位置上与滑动平均值的偏离。

构造新的序列
}2,,2,1|))(,ˆ{(−=n i x d x
i i L ,并根据该序列构造一个插值函数 0111)(b x b x b x b x p p p p ++++=−−L ω (3.4)
通过计算求得系数k
b b b ˆ,,ˆ,ˆ10L ,记 0111
ˆˆˆˆ)(ˆb x b x b x b x p p p p ++++=−−L ω 选取一个对称正则模糊结构元E 。

根据由模糊结构元线性生成模糊值函数的意义,取
E x x f
x F )(ˆ)(ˆ)(~ω+= 作为模糊插值函数。

4.应用实例
4.1对大盘交易量指数的分析
股票成交量是一种供需的表现,当股票供不应求时,人潮汹涌,都要买进,成交量自然
放大;反之,股票供过于求,市场冷清无人,买气稀少,成交量势必萎缩。

而将人潮加以数值化,便是成交量。

广义的成交量包括成交股数、成交金额、换手率;狭义的也是最常用的是仅指成交股数。

可以说,成交量的大小直接表明了多空双方对市场某一时刻的技术形态最终的认同程度。

成交量在股票操作中如此重要,但是由于成交量的单位一般为万手,那么股票成交量的走势图波动会十分厉害,直接拟合刻画此走势曲线函数将失去意义。

表1 上海股票市场成交量数据
Tab.1 V olume data of the shanghai stock market
时间 9:30 9:35 9:40 9:45 9:50 9:55 10:00 10:05 10:10 成交量 1143150
576270 840386
906166833348749126
806400
783148 911368
时间 10:15 10:20 10:2510:3010:3510:40 10:45 10:50 10:55 成交量 903916 605536 561188
517376
655312
589376
627236
540112 586560 时间 11:00 11:05 11:10 11:15 11:20 11:25 11:30 成交量
484112 489408 540584
513184
439240
392384
360200
这里我们以2007年4月13日上9:30到11:30的上海股票市场股票成交量(单位:万手)为研究对象,每隔五分钟取点数据。

根据式(3.1),先利用数据的滑动平均法求出其滑动平均序列,用Matlab 软件计算结果并绘图[7][8]。

图2观测数据与滑动平均值
Fig2 The observation data and sliding average value
从图2可以看出,数据既隐含于平面观测散点形成的区域之中,又使得数据波动变得平滑。

适当构造一插值函数,求得式(3.2)中的系数为:
3ˆa
=0.579759711,2ˆa =-109.799417626,1ˆa =1612.111930581,0ˆa =832786.896292115。

即拟合函数为:
292115832786.8960581x 1612.11193626x 109.7994171x 0.57975971)(23++−=x f
则此函数可以作为所要构造的模糊值函数的核函数。

构造新序列}2,,2,1|))(,ˆ{(−=n i x d x i i L ,根据该序列构造插值函数)(x ω,由式(3.3)
和(3.4),通过计算求得系数:
3ˆb =-0.309365494,2ˆb =65.460644129,1ˆb =-4604.421202759,0
ˆb =152641.462827028。

即拟合函数为
827028152641.4622759x 4604.42120-29x 65.460644194x -0.3093654)(ˆ23++=x ω
由定义1.3,选取一个三角结构元E ,取
E x x f
x F )(ˆ)(ˆ)(~ω+= 作为模糊插值函数。

图3给出了由模糊结构元线性生成的模糊值函数的几何解释,由曲线)()(x x f ω+和
)()(x x f ω−所形成的带状区域是模糊值函数E x x f
x F )(ˆ)(ˆ)(~ω+=的承集,即0>λ所对应的区间值函数。

)(x f 是模糊值函数)(~
x F 的核函数。

)(x ω是一个正值函数,它反映出插
值函数在任何点x 处因变量y 的不确定性程度,如图3中,散点高度差分布越大的地方,
)(x ω也越大。

因此,形象地描述了成交量指数随时间变化不确定性程度的波动,为股票市
场的技术分析提供了有效的信息。

图3模糊值函数拟合 Fig3 Fuzzy function fitting
4.2 板快归类
我们可以任意取一支股票A 的走势数据,根据前面提到的方法做出它的模糊插值函数
E x x f
x F )(ˆ)(ˆ)(~ω+= 由定义1.4得其隶属函数为:
.),)
()
(()()
(~Y y x x f y E y x F ∈∀−=ωµ
这里Y取异于股票A的任一股票,从而根据隶属函数我们可以得到和A走势相近的若干支股票,即与A信息实现较好拟合的那些股票,并与A组成同一板块。

同理取多元数据,可以更精确地得到这些股票的板块归类。

5.结论
尽管基于传统的函数拟合方法可以在拟合一般数据散点中达到不错的效果,可是应用于混乱和大波动的数据却不尽人意。

本文从模糊结构元理论出发,采用模糊结构元线性生成模糊值函数的方法,对股票成交量的散点数据进行拟合,并直观地刻画出散点所呈现出来的数据不确定性程度,为数据分析人员提供可靠的参考信息。

参考文献
[1] L.A.Zadeh.Fuzzy Sets[J].Information and Control.1965,8:338-353.
[2] 郭嗣琮,陈刚.信息科学中的软计算方法[M].沈阳:东北大学出版社,2001.
[3] 郭嗣琮.模糊分析中的模糊结构元方法(Ⅰ)(Ⅱ) [J].辽宁工程技术大学学报,2002,21(5): 670-673;
21(6):808-810.
[4] 郭嗣琮.模糊实数空间与[-1,1]上同序单调函数类的同胚[J].自然科学进展,Vol.14,11(2004): 1318- 1321.
[5] 郭嗣琮. [-1,1]上同序单调函数的同序变换群与模糊数运算[J].模糊系统与数学,3(2005): 105-110.
[6] 郭嗣琮.基于结构元理论的模糊数学分析原理[M].沈阳:东北大学出版社,2004.
[7] 马兴义.Matlab 6应用开发指南[M].北京:机械工业出版社,2001.
[8] 萧树铁.数学实验[M].北京:高等教育出版社,2004.
Fuzzy Function Fitting and Application Based on Fuzzy
Structured Element Theory
Chen Bin, Wu Dan
Institute of Business Administration,Liaoning Technical University, Huludao, Liaoning (125105)
Abstract
Both least-square method and algebra interpolation method are traditional function fitting methods in common use. However, this two methods are not suitable when the observation data fluctuate extremely complex and chaotic. This paper use the method of fuzzy structured element linearity producting fuzzy value function to fit scatter data of stock volume, and use one function to describe the uncertain degree of the change tendency.
Keywords: fuzzy structured element; fuzzy function fitting; algebra interpolation
作者简介:
陈斌,男,1983年生,硕士研究生,主要研究方向为时间序列及在数据分析中的应用、最优化算法;
吴丹,女,1983年生,硕士研究生,主要研究方向混沌时间序列的决策分析、运筹学。

相关文档
最新文档