多专家决策算法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(j ) 第 i 个专家决策为 y (i j ) , 第 i 个专家在第 k 个子决策域的权值为 w ik , 算法做出的决策为 r ( j ) , 实际输出为 z ( j ) . ( j)
算法1描述如下. 算法1. ( 1) 初始化令 w ik = 1, 1≤ i≤ n, 1 ≤k ≤m . ( 2) 对第 j 次决策, 设 x ( j ) ∈X q , 有
1 引言
多专家决策算法是一种学习机制, 它根据一组专家提供的预测, 给出一个综合的预测, 并根据实际值不断调整策略, 使之能够在最坏情况下尽量接近“ 最佳” 的专家预测 . 对于这个问题 , 已经提出了一些有效的算法 . 比较典型的有 L it t lest one 和 Warm ut h 提出的加权多数算法 ( Weight ed M ajo rity Algor it hm, 简称 WM 算法) [ 1] , Vovk 提出的聚集算法( Ag gregat ing Al gorit hm , 简称 AA 算法 ) [ 2, 3] , Cesa Bianchi 等人提出的 P 算法等. 这些算法对时序的预测问题取得了很好的效果. 时序的预测问题可描述为 : 已知 n 个专家 , 设对时间序列 t = 1, 2, … , t, 第 i 个专家做出的决策序列为: y i = y i 1, y i 2, …, y it ; 算法给出的决策序列为: r = r 1, r 2, …, r t , 而实际的输出序列为: z = z 1 , z 2 , …, z t . 一个好的决策算法应根据实际的输出不断调整策略 , 使算法给出的决
p m
( 3)
其中, w k init 和 w k fin 分别为第 k 个子决策域中 n 个专家的初始与最终权值之和 . 证明. 考虑决策域 X k , 设 p 次决策中有 p k 次落入 X k , 该 p k 次决策排序为 k 1, k 2, …, k g , kh , …, k v , 则有
p
∑ûr
j= 1
( j)
- z
û≤
w k init 1 ln k fin b∑ w k= 1
m
( 10) 证毕 .
如果划分的子决策域较多, 而修正次数较少 , 由于权值修正范围系数对修正范围的限制 , 只有少数决策域的权值比的对数 ln( w k init / w k fin ) 不为 0. 随着修正次数的增加 , 误差的增加也将是缓慢的 . 修正次数达到一定值之后, 算法给出的决策将接近于“ 最佳” 的专家决策. 定理2. 对每个子决策域存在“ 最佳” 专家的情况, 当算法 1的决策次数 p →∞且权值修正范围系数 a →∞ 时 , 算法的决策将在每个子决策域都与“ 最佳” 的专家决策一致 . 证明. 当权值修正范围系数 a→∞时 , 每次权值的修正仅限于一个子决策域内 . 考虑子决策域 k 内的决策: w (ikj + 1) = w (ikj ) ( 1 - b õ ûy (i j ) - z ( j ) û)
( 7)
ln( 1 - bûr ( j ) - z ( j ) û) ≤- b ûr ( j ) - z ( j ) û 因此对落入子决策域 X k 的所有决策有
kv
( 8)
∑ûr
j = k1
( j)
w kinit - z ( j ) û ≤ 1 ln b w k fin
( j)
( 9)
对所有的 p 次决策:
n (j)
r ( j) = 对所有权值 w
( j) ik
∑w
i= 1 n i= 1
( j) iq
y (i j ) ( 1)
( j) iq
∑w
进行调整如下 :
w (ikj ) = w (ikj ) õ G ik , 1 ≤ i ≤ n, 1 ≤ k ≤ m . 其中, Gik = 1- b õûy - z
[ 4]
784
计算机研究与发展
1999年
策尽量接近“ 最佳” 的专家决策. 本文研究的是更为普遍的情况, 即不是针对时间序列 , 而是对任意的输入 x 和 n 个专家给出的决策 y = y 1, y 2 , … , y n, 算法给出决策 r , 并根据实际输出 z 调整策略, 使算法能随着调整次数的增加给出越来越接近 “ 最佳” 的决策 . 多专家决策问题的特点是: ( 1) 已有多个专家可做出决策 , 这里“ 专家” 也可以是任意一种决策系统 . 但事先并不知道哪个专家是“ 最好” 的, 而且在不同的条件下专家的表现也可能是不同的 ; ( 2) 实际可供学习的例子很少 . 在这种情况下 , 需要大量训练类的学习算法如回归算法、神经网络学习算法、进化算法等都是不适用的 , 只有充分利用已有专家做出的决策. 因此本文在 WM 算法的基础上, 发展了多专家决策算法 . WM 算法的基本思想是为每个专家赋一个权值 , 根据各专家决策的加权和做出决策 , 并根据实际输出对权值做出调整 , 使算法的决策尽量接近“ 最佳” 的专家决策. 显然 , WM 算法仅适用于时序情况, 对本文的决策问题是很不够的 . 本算法的基本思想是划分决策区域 , 每个专家在不同的决策域有不同的权值. 为此 , 必须解决决策区域的细分与实例数目有限的矛盾, 并提供相应的算法. 本文第2部分给出 2个算法 , 算法1 给出最接近“ 最优专家” 的决策, 算法2 给出最接近“ 实际最优” 的决策 . 在第3部分中给出应用结果 .
2 算法描述
多专家决策问题 M 可表示为一个三元组 M = ( X , Y , Z ) . 其中 X 为决策域, Y 为专家决策空间 , Z 为实际输出空间 . 多专家决策就是对任意的输入 x ∈X , 根据 n 个专家的决策 y i ∈ Y , i = 1, 2, … , n, 给出决策 r ∈ Y , 并根据实际输出 z ∈ Z 与决策 r 的差异对策略进行调整, 使以后的决策更接近于实际输出. 算法将决策域划分成 m 个子决策域 X k , k = 1, 2, … , m , 有 X = X 1 ∪ X 2 ∪…∪ X m 且 X p ∩ X q = U , 其中 p ≠q . 算法为每个专家的每个决策域分配一个权值, w ik ≥0, 1≤ i≤ n, 1 ≤k ≤m . 设第 j 次决策时输入为 x ,
原稿收到日期 : 1998-10-22; 修改稿收到日期 : 1999-03-25. 本课题得到国家自然科学基金 ( 项目编号 59578026) 资助 . 田盛丰 , 男 , 1944年 11 月生 , 教授 , 主要研究方向为人工智能、模式识别 . 蔺永华 , 女 , 1976年生 , 硕士研究生, 主要从事人工智能研究 .
Abstract T he object o f t he m ul ti-expert decision -making is t o make an integ rated decision on t he basis of decisio ns present ed by several ex pert s , w hich is near t he “ best ”by adapt ing decision st rat egy according to ex amples. T he alg orit hm s intro duced in t his paper divide t he w ho le decision area into sev eral subareas and assign a w eig ht t o ev ery ex pert in each subarea. In t his w ay , t he algor it hms m ake t he best decision in each subarea. T he validit y of t he alg orit hms is proved. T he decision m ade by algo rithm 1 m ay appr oach t he best decision present ed by so me ex pert s in each decision area , and alg orit hm 2 at t empts to m ake a decision w hich is mo re appro ximat e to actual value t han t hat made by t he best expert , w hen all decisions made by expert s dev iat e fr om t he actual value. Key words decisio nm aking, algor it hm, machine learning
kv kv
( 5) û) ≤ sk
( 1)
sk 和
( p + 1)
≤ sk
( kv + 1)
≤ sk
( k 1)
∏( 1 j = k1
bûr
kv
( j)
- z
( j)
∏( z
( j)
û)
( 6)
ln 由于
w k fin ≤ ∑ln( 1 - b ûr ( j ) - z ( j ) û) w k in it j = k1
n n
sk( kg + 1) =
( kg+ 1) ∑w ik = i= 1
∑w
i= 1
( kg) ik
( 1 - b õ ûy (i kg) - z ( kg) û)
7期
田盛丰等 : 多专家决策算法
n ( kg)
785
( kg)
= sk = sk 因此有
- b ∑w ik ûy i
( kg) i= 1
(j) i ( j)
( 2)
ûõe
- ad
kq
.
上式中, b 为权值修正系数 . 设各专家的决策值与实际值的误差上限为 E u , 则 b 的取值应满足 0< b< 1/ E u. d kq 为子决策域 k 和子决策域 q 的距离函数 . a 为权值范围修正系数 , a > 0, a 值越小 , 每次修正时 , 权值修正的范围越大. 下面的定理确定算法的误差上限. 定理1. 设算法1 进行了 p 次决策, 则总误差 E 满足 E= w k init ûr ( j ) - z ( j ) û ≤ 1 ∑ln ∑ b w k fin j= 1 k= 1
( kg)
- z s
û ( 4)
( kg)
- b ûr
( kg) ( kg ) k
s
- z
( kg) ( kg) k
û
= s (k kg) ( 1 - b ûr ( kg ) - z ( kg) û) s (k kh ) ≤ s(k kg+ 1 ) = s(k kg) ( 1 - b ûr ( kg) - z ( kg ) û)
THE MULTI -EXPERT DECISION -MAKING ALGORITHMS
T IAN Sheng -F eng and L IN Yong Hua
( D ep art ment of Comp ut er S cience and T echnology , N orther n J iaotong Uni v ersity , B eij ing 100044)
第 36 卷第 7期 1999 年 7月
V o l. 36, N o . 7
JOURNA L OF COM PU T ER RESEARCH & DEVEL OPM ENT
July 1999
多专家决策算法
田盛丰蔺永华
( 北方交通大学计算机科学技术系北京 100044)
摘要多专家决策问题是在多个专家提出决策的基础上得出一个综合的决策 , 并根据实例调整策略 , 使得到的决策达到“ 最佳” . 文中介绍的算法将整个决策域划分成若干个子决策域 , 并在各子决策域为每个专家赋予权值 , 从而为每个子决策域确定最佳决策 . 文中提出了两种决策算法 , 并证明了它们的有效性 . 算法 1得到的决策可在各个子决策域都接近最佳专家决策 , 算法 2则力图在各专家决策都偏离实际值的情况下 , 提出比最佳专家决策更接近实际值的决策 . 关键词决策 , 算法 , 机器学习中图法分类号 T P 18