正态云的数学性质
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归曲线
主曲线
正态云模型云滴的期望曲线
该期望曲线函数为: − (E ( X )− Ex )2
y = e 2 En2
正态期望曲线性质
z μ=3,σ=5
驻点
拐点
-2 3 8
此结论可以推广到高维论域空 间里的概念,其定量实现——云滴X 与确定度Y的联合分布(X, Y)的期 望曲面(超曲面)呈现为高斯形态。
正态云模型是产生泛正态分布的算法,它利用 三个独立的数字特征:期望Ex、熵En和超熵He, 通过二阶正态分布在论域空间生成泛正态分布的云 滴,由高斯隶属函数计算得出云滴的确定度,构造 出定性概念及其定量表示之间的转换算法。
当He=0时,云滴分布为正态分布。
重要说明:
对于一个严格意义的正态分布的随机变量, 如果期望已知,则方差的共轭先验分布为倒伽玛 分布,这种先验分布显示了期望与方差的相关性。
=
1
− ( x−Ex)2 − ( y−En)2
e 2y2
2He2 dy
−∞ 2 He y
此函数没有解析形式。
云滴的统计特性
云滴X 的期望 E(X)=Ex ;
方差D(X) = ∫ ∫ +∞ (
x
−
Ex
) 2dx
−∞
+∞ 1 −∞ 2πHe
y
exp ⎜⎜⎝⎛ −
( x − Ex ) 2 2y2
−
( y − En ) 2 2 He 2
模糊集合中常用的隶属函数形态
1、线性隶属函数 2、三角型隶属函数 3、凸形隶属函数 4、梯型隶属函数 5、岭型隶属函数 6、高斯隶属函数
隶属函数中会出现拐点吗?
高斯隶属函数的普适性
¾大量模糊概念,用高斯隶属函数刻画, 接近人类认知;
¾在众多的模糊控制文献中,高斯隶属函 数使用最频繁;
¾其他隶属函数常常和高斯隶属函数有相 当的吻合。
雾化过程分析
z 通过研究X的概率分布可知,X的分布函数 没有解析形式
∫ f X (x) =
fEn' (x) ×
f
X
(
x
|
En'
)
=
∞ −∞
1 2πHe
|
− ( x−Ex)2 − ( y−En)2
e 2y2
2He2 dy
y|
超熵变大的过程
z 当He逐渐增大的时候,云滴开始离散,云 滴的凝聚性变差了
云滴分布规律
7
5 正态云的数学性质四
思考
在云发生器算法中,通常选用较小 的超熵He生成云滴,如He较大(概 念的共识差,离散性强),会产生 什么样的分布形态?
如果一个概念缺少共识,反映其数字特 征的超熵会变得很大,云的整体轮廓不再清 晰可见,云逐渐“雾化”。但雾化过程中, 始终可保持云滴在靠近中心部分占优势。
在正态云中,Ex、En、He是三个独立的数 字特征,通过设计特定结构算法,生成定性概念 的随机量化值,并得出云滴的随机确定度,创造 出崭新的随机变量形态,形成定性定量转换模型, 云模型没有用解析的形式表述。
两类主要不确定性
随机性——概率论 模糊性——模糊集合论
云模型的贡献是通过概率测度空间研究模糊 性对随机性的关联性!
云模型揭示了这样的认知机理:
尽管概念蕴涵有不同范畴,尽管不同人、 不同时期对同一概念有不同认识,定性概念 转换成大量的定量云滴,云滴表现出不同的 确定度,但是要形成普遍的共识,它们在不 同人中反映出的云滴确定度的统计认知规律 是一致的,用不同语言值表示的不同定性概 念之间存在共同的认知机理。
4 正态云的数学性质三
y ∈(0,1)
而当 y ≥ 1 时,FYi (y) = 1;当y ≤ 0
( ) 云模型反映
时,FYi y 的=概0。念的三个数
字特征无关
因此,
fYi
(
y)
=
⎧ ⎪ ⎨ ⎪⎩0
− ,
1 π ln 1
y
,
0
< y <1 else
f(y)
云滴确定度的Yi 概率密度函数曲线
y
这一性质反映了不同语言值 表示的不同定性概念的不确定性, 存在认知上的共同规律性——确 定性。
fX (x) =
1 2π En'
exp⎛⎜⎜⎝
−
(
x − Ex)2 2En'2
⎞⎟⎟⎠
而En’的概率密度为:
fEn' (x) =
1 2π
Heຫໍສະໝຸດ Baidu
exp⎜⎜⎝⎛
−
(x − En)2 2He2
⎟⎟⎠⎞
4
故 X 的概率密度函数为:
f X (x) = f En' (x) × f X (x En' )
∫ π ∞
是否可以通过弱化形成正态分布的条件, 即假定产生某随机变量的诸随机因素间不完 全独立,个别随机因素对该随机变量的作用 不那么微小,通过一个参数来衡量该随机变 量分布偏离正态分布的程度,从而将正态分 布弱化为“泛正态分布”?
1
泛正态分布的产生条件没有正态分布苛 刻,它比正态分布复杂,但是比联合分布简 便可行。
云心上的云滴个数与云心长度之比称为 云心线密度。
z 随着He的增大,云心线密度与云线密度均 减小,但二者之比却增大。即云心区的云 滴离散速度较慢。体现了雾化过程中,期 望附近云滴仍然保持了相当的稳定性。
云长度
云心长度
云心相对线密度(凝聚离散系数):云心线密度/云线密度
9
综合分析:
He增加(雾化)
云心线密度
当
lim
He→∞
y2
→
y1
, 两条函数曲线趋向重合。
50 49
雾化的临界点
z 正态云模型在He=En/3时出现临界状态, He较小时,呈泛正态分布;He增大时,云 开始雾化。
为了进一步考察超熵变大时, 云雾化过程中的云滴分布性 质,我们定义了云的线密度 等概念。
z 定义 云C(X)中, x轴上全体云滴个数与 长度之比称为云的线密度。区间(Ex-δ , Ex+δ)称为云心,2δ称为云心长度;
假设云心长度为常数2δ,则云心线密度为
NP{ X − Ex ≤ δ}/ 2δ
≈ NP{ En' ≤ δ } 3
≈ N[Φ(δ − 3En ) − Φ( − δ − 3En)]/ 2δ
产生的一个样本。
当 y ∈ (0,1) 时,
FYi (y) = P{Yi
} ≤ y
=
P
⎪⎨⎧e
−( X −Ex)2 2(En'i )2
≤ y⎪⎬⎫ =
⎪⎩
⎪⎭
P⎧⎨−
− 2 ln y ≤ X − Ex ≤
−
2
ln
y
⎫ ⎬
⎩
En'i
⎭
Q
( ) X ~ N Ex, En'i2
∴
X − Ex ~ N (0,1)
一维云模型云滴的期望曲线
研究数据集分布的几何规律性,寻 找数据集的“中间”结构——“脊梁 骨”,用一条光滑曲线代替数据集,几 何上非常直观。
研究数据集分布的几何规律性,寻找数据集的 “中间”结构——“脊梁骨”,用一条光滑曲线代 替数据集,几何上非常直观。常用的寻求期望曲线 的方法有主曲线和回归曲线等。
性质三
定性概念的定量实现——云滴X, 与其确定度Y的联合分布( X,Y )的期 望曲线(或期望曲面、期望超曲面) 呈现为高斯形态。
6
云滴及其确定度的联合概率分布(X,Y )
所有云滴X及其确定度Y 形成的二维 随机变量(X,Y )的概率分布非常复杂, 没有解析形式。但是具有明显的几何特 征,可以通过期望曲线方法来研究它。
z 根据正态云发生器的实现算法,由于 P{En-3He<En’<En+3He}=0.997,所以当En3He>0时,99.7%的云滴落在外曲线y1内曲线y2 之间
48
8
云的雾化点
z He=En/3时,由于内曲线的指数趋向负无 穷大,函数值趋于0,云图开始雾化。
He>En/3时云图的变化
z 内曲线y2开始加宽,随着He的继续增大 ,
降低-速度慢
云线密度
降低-速度快
云心相对线密度(云心 增加 线密度/云线密度)
简要证明如下:
设正态云为(Ex,En,He),云滴总数为 N。由切比 雪夫不等式:
P{ X − Ex < 4 En2 + He2 } ≥ 15 ≈ 1 16
即云长度可近似为:8 En2 + He2 故云线密度为 N / 8 En2 + He2
正态云模型算法回顾
1. 生成以En为中心值,He2为方差的一个正态 随机数En’;
2. 生成以Ex为中心值,En’ 2为方差的一个正态
随机数 x ;
3. 计算:
y = e−
( x − Ex 2 ( En '
)2 )2
4. x 是论域中的一个云滴, y是其确定度;
5. 重复步骤1-4直至产生需要数目的云滴。
正态分布的普适性和高 斯隶属函数的普适性,共同 奠定了正态云模型的普适性。
3
云模型的数理统计基础
9 云模型利用三个数字特征设计特定的算法, 构造出一个服从泛正态分布的随机变量 ——云滴。
9 云模型本质是基于概率测度空间的云滴及其 确定度的分布模型。云模型对模糊性和随机 性的关联性,建立了简单但是较为合理的映 射关系。
背景:利用统计方法确定隶属度和隶属函 数的合理性
从概率测度角度看,云模型的定 义域是N 维量化论域空间。
云滴是该论域空间中的一个随机 变量,服从泛正态分布;云滴对概念 的确定度,也是一个随机变量。
概率论中的正态分布及普适性
正态分布广泛存在于自然现象与 社会现象中,实际中遇到的许多随机 现象都服从或者近似服从正态分布。
3 正态云的数学性质二
性质二
对一个有共识的定性概念,所有定 量实现(即云滴)的确定度为随机变量Y, 其概率密度是一个固定的形式,与云模 型反映的概念的三个数字特征无关。
根据正态云发生器算法,所有云滴的确定度构成的
随机变量Y,每一个确定度可以看做是由随机变量
Yi
=
− (x − Ex )2
e 2 (En 'i )2
模糊性和随机性,曾经被认为是完全不 同的两类不确定性,分别进行处理。
可能性理论: 一个人早餐吃5个鸡蛋的可能性为1,但吃5
个鸡蛋的概率为0。
随机性和模糊性毫无关联! 模糊性对排中律的背叛:
A+ A≠1
2
在更多情况下,随机性和模糊性相关。
“17岁是青年人吗?”
统计得到“是”的概率越大,则“17岁”隶 属于“青年”的程度也越大。
正态云的数学性质
1. 正态云数学性质的一般性理解 2. 正态云数学性质一 3. 正态云数学性质二 4. 正态云数学性质三 5. 正态云数学性质四
1 正态云数学性质的一般性理解
正态分布产生条件 ——中心极限定理
如果某一随机变量是由大量相互独立的随 机因素的综合影响所形成的,而其中每一个 别因素在总影响中所起的作用都是微小的, 这种随机变量往往近似的服从正态分布。
云模型的数理统计基础
对某一定性概念,云滴在靠近期望值出现 的概率较大,且该云滴能代表此定性概念的 确定度也较大;云滴在远离期望值处出现的 概率较小,该云滴能代表该概念的确定度也 较小。
用模糊性对随机性关联的映射函数来计算 确定度,恰好可说明上述现象。
为什么不用更少或者更多的 数字特征构造云模型?
z 用三个数字特征进行定性定量转换是最小集 合,不可能再少;
z 还有更高阶的熵,例如用超超熵去反映超熵 的不确定性,是可以无限深追的,但人类使 用自然语言思维不会涉及过多的数学运算;
z 也可以构造“均匀——正态”等其他云模型
2 正态云的数学性质一
对任一定性概念,其所有定 量实现——云滴组成的随机变量, 在论域空间呈泛正态分布。
云滴在论域空间的概率分布
记所有云滴组成的随机变量为X,由云 发生器的算法,X的概率密度为:
En'i
故
( ) ∫ −2ln y
FYi y = − −2ln y
1
−t2
e 2 dt
2π
5
云滴确定度的Yi 概率密度函数为:
fYi ( y) = FYi (y)'
=
1
( ) −(−2ln y) −2ln y '
e2
−
2π
2
( ) −(−2ln y) − −2ln y ' e2
2π
=1 −π ln y
2He2
−∞ 2π
2
= En2 + He2
性质一 正态云算法产生的云滴,是一个期望
为Ex,方差为 En2 + He2 的随机变量,呈现 泛正态分布。参数He是偏离正态分布程度 的度量,可以用来反映在论域空间影响概 念诸因素的不均匀、不独立现象。
若He=0,云滴为正态分布;若En=0, He=0,云滴则总是出现在期望点Ex上,没 有不确定性。
⎟⎟⎠⎞dy
= ∫ ∫ 1
+∞
y
exp{− (y − En)2 }dy
+∞
1
(x − Ex)2 exp{− (x − Ex)2 }dx
2π He −∞
2He2
−∞ 2π y2
2y2
=
∫ ∫ 1 +∞y2 exp{− (y − En)2 }dy +∞ 1 t 2 exp{− t 2 }dt
2π He −∞
《不确定性人工智能》课件之四
正态云的数学性质
Mathematical Properties of Normal Clouds
李德毅
deyi_li@nlsde.buaa.edu.cn
2009年3月16日
思考
如何理解自然语言中概念对量的规定性及 其不确定性?如何理解用正态云表示的定性 概念的内涵与外延?反映概念不确定性的数 字特征,与这个概念的语义、语境有关还是 无关?如果人们对一个概念很发散,云会变 为雾吗?