多专家决策算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(j ) 第 i 个专家决策为 y (i j ) , 第 i 个专家在第 k 个子决策域的权值为 w ik , 算法做出的决策为 r ( j ) , 实际输出为 z ( j ) . ( j)
算法1描述如下. 算法1. ( 1) 初始化 令 w ik = 1, 1≤ i≤ n, 1 ≤k ≤m . ( 2) 对第 j 次决策, 设 x ( j ) ∈X q , 有
1 引 言
多专家决策算法是一种学习机制, 它根据一组专家提供的预测, 给出一个综合的预测, 并根据实际值不 断调整策略, 使之能够在最坏情况下尽量接近“ 最佳” 的专家预测 . 对于这个问题 , 已经提出了一些有效的算 法 . 比较典型的有 L it t lest one 和 Warm ut h 提出的加权多数算法 ( Weight ed M ajo rity Algor it hm, 简称 WM 算法) [ 1] , Vovk 提出的聚集算法( Ag gregat ing Al gorit hm , 简称 AA 算法 ) [ 2, 3] , Cesa Bianchi 等人提出的 P 算 法 等. 这些算法对时序的预测问题取得了很好的效果. 时序的预测问题可描述为 : 已知 n 个专家 , 设对时间 序列 t = 1, 2, … , t, 第 i 个专家做出的决策序列为: y i = y i 1, y i 2, …, y it ; 算法给出的决策序列为: r = r 1, r 2, …, r t , 而实际的输出序列为: z = z 1 , z 2 , …, z t . 一个好的决策算法应根据实际的输出不断调整策略 , 使算法给出的决
p m
( 3)
其中, w k init 和 w k fin 分别为第 k 个子决策域中 n 个专家的初始与最终权值之和 . 证明. 考虑决策域 X k , 设 p 次决策中有 p k 次落入 X k , 该 p k 次决策排序为 k 1, k 2, …, k g , kh , …, k v , 则有
p
∑ûr
j= 1
( j)
- z
û≤
w k init 1 ln k fin b∑ w k= 1
m
( 10) 证毕 .
如果划分的子决策域较多, 而修正次数较少 , 由于权值修正范围系数对修正范围的限制 , 只有少数决策 域的权值比的对数 ln( w k init / w k fin ) 不为 0. 随着修正次数的增加 , 误差的增加也将是缓慢的 . 修正次数达到一 定值之后, 算法给出的决策将接近于“ 最佳” 的专家决策. 定理2. 对每个子决策域存在“ 最佳” 专家的情况, 当算法 1的决策次数 p →∞且权值修正范围系数 a →∞ 时 , 算法的决策将在每个子决策域都与“ 最佳” 的专家决策一致 . 证明. 当权值修正范围系数 a→∞时 , 每次权值的修正仅限于一个子决策域内 . 考虑子决策域 k 内的决 策: w (ikj + 1) = w (ikj ) ( 1 - b õ ûy (i j ) - z ( j ) û)
( 7)
ln( 1 - bûr ( j ) - z ( j ) û) ≤- b ûr ( j ) - z ( j ) û 因此对落入子决策域 X k 的所有决策有
kv
( 8)
∑ûr
j = k1
( j)
w kinit - z ( j ) û ≤ 1 ln b w k fin
( j)
( 9)
对所有的 p 次决策:
n (j)
r ( j) = 对所有权值 w
( j) ik
∑w
i= 1 n i= 1
( j) iq
y (i j ) ( 1)
( j) iq
∑w
进行调整如下 :
w (ikj ) = w (ikj ) õ G ik , 1 ≤ i ≤ n, 1 ≤ k ≤ m . 其中, Gik = 1- b õûy - z
[ 4]
784
计算机研究与发展
1999年
策尽量接近“ 最佳” 的专家决策. 本文研究的是更为普遍的情况, 即不是针对时间序列 , 而是对任意的输入 x 和 n 个专家给出的决策 y = y 1, y 2 , … , y n, 算法给出决策 r , 并根据实际输出 z 调整策略, 使算法能随着调整次数的增加给出越来越接近 “ 最佳” 的决策 . 多专家决策问题的特点是: ( 1) 已有多个专家可做出决策 , 这里“ 专家” 也可以是任意一种决策系统 . 但事 先并不知道哪个专家是“ 最好” 的, 而且在不同的条件下专家的表现也可能是不同的 ; ( 2) 实际可供学习的例 子很少 . 在这种情况下 , 需要大量训练类的学习算法如回归算法、 神经网络学习算法、 进化算法等都是不适用 的 , 只有充分利用已有专家做出的决策. 因此本文在 WM 算法的基础上, 发展了多专家决策算法 . WM 算法 的基本思想是为每个专家赋一个权值 , 根据各专家决策的加权和做出决策 , 并根据实际输出对权值做出调 整 , 使算法的决策尽量接近“ 最佳” 的专家决策. 显然 , WM 算法仅适用于时序情况, 对本文的决策问题是很 不够的 . 本算法的基本思想是划分决策区域 , 每个专家在不同的决策域有不同的权值. 为此 , 必须解决决策区 域的细分与实例数目有限的矛盾, 并提供相应的算法. 本文第2部分给出 2个算法 , 算法1 给出最接近“ 最优专 家” 的决策, 算法2 给出最接近“ 实际最优” 的决策 . 在第3部分中给出应用结果 .
2 算法描述
多专家决策问题 M 可表示为一个三元组 M = ( X , Y , Z ) . 其中 X 为决策域, Y 为专家决策空间 , Z 为实 际输出空间 . 多专家决策就是对任意的输入 x ∈X , 根据 n 个专家的决策 y i ∈ Y , i = 1, 2, … , n, 给出决策 r ∈ Y , 并根据实际输出 z ∈ Z 与决策 r 的差异对策略进行调整, 使以后的决策更接近于实际输出. 算法将决策域划分成 m 个子决策域 X k , k = 1, 2, … , m , 有 X = X 1 ∪ X 2 ∪…∪ X m 且 X p ∩ X q = U , 其中 p ≠q . 算法为每个专家的每个决策域分配一个权值, w ik ≥0, 1≤ i≤ n, 1 ≤k ≤m . 设第 j 次决策时输入为 x ,
原稿收到日期 : 1998-10-22; 修改稿收 到日期 : 1999-03-25. 本课题得到国家自然科学基金 ( 项目编号 59578026) 资助 . 田 盛丰 , 男 , 1944年 11 月生 , 教授 , 主要研究方向为人工智能、 模式识别 . 蔺永华 , 女 , 1976年生 , 硕士研究生, 主要从事人工智能研究 .
Abstract T he object o f t he m ul ti-expert decision -making is t o make an integ rated decision on t he basis of decisio ns present ed by several ex pert s , w hich is near t he “ best ”by adapt ing decision st rat egy according to ex amples. T he alg orit hm s intro duced in t his paper divide t he w ho le decision area into sev eral subareas and assign a w eig ht t o ev ery ex pert in each subarea. In t his w ay , t he algor it hms m ake t he best decision in each subarea. T he validit y of t he alg orit hms is proved. T he decision m ade by algo rithm 1 m ay appr oach t he best decision present ed by so me ex pert s in each decision area , and alg orit hm 2 at t empts to m ake a decision w hich is mo re appro ximat e to actual value t han t hat made by t he best expert , w hen all decisions made by expert s dev iat e fr om t he actual value. Key words decisio nm aking, algor it hm, machine learning
kv kv
( 5) û) ≤ sk
( 1)
sk 和
( p + 1)
≤ sk
( kv + 1)
≤ sk
( k 1)
∏( 1 j = k1
bûr
kv
( j)
- z
( j)
∏( z
( j)
û)
( 6)
ln 由于
w k fin ≤ ∑ln( 1 - b ûr ( j ) - z ( j ) û) w k in it j = k1
n n
sk( kg + 1) =
( kg+ 1) ∑w ik = i= 1
∑w
i= 1
( kg) ik
( 1 - b õ ûy (i kg) - z ( kg) û)
7期
田盛丰等 : 多专家决策算法
n ( kg)
785
( kg)
= sk = sk 因此有
- b ∑w ik ûy i
( kg) i= 1
(j) i ( j)
( 2)
ûõe
- ad
kq
.
上 式 中, b 为 权值 修 正 系数 . 设 各 专 家的 决 策 值与 实 际 值的 误 差 上 限 为 E u , 则 b 的 取 值 应 满 足 0< b< 1/ E u. d kq 为子决策域 k 和子决策域 q 的距离函数 . a 为权值范围修正系数 , a > 0, a 值越小 , 每次修正 时 , 权值修正的范围越大. 下面的定理确定算法的误差上限. 定理1. 设算法1 进行了 p 次决策, 则总误差 E 满足 E= w k init ûr ( j ) - z ( j ) û ≤ 1 ∑ln ∑ b w k fin j= 1 k= 1
( kg)
- z s
û ( 4)
( kg)
- b ûr
( kg) ( kg ) k
s
- z
( kg) ( kg) k
û
= s (k kg) ( 1 - b ûr ( kg ) - z ( kg) û) s (k kh ) ≤ s(k kg+ 1 ) = s(k kg) ( 1 - b ûr ( kg) - z ( kg ) û)
THE MULTI -EXPERT DECISION -MAKING ALGORITHMS
T IAN Sheng -F eng and L IN Yong Hua
( D ep art ment of Comp ut er S cience and T echnology , N orther n J iaotong Uni v ersity , B eij ing 100044)
第 36 卷 第 7期 1999 年 7月
V o l. 36, N o . 7
JOURNA L OF COM PU T ER RESEARCH & DEVEL OPM ENT
July 1999
多专家决策算法
田盛丰 蔺永华
( 北方交通大学计算机科学技术系 北京 100044)
摘 要 多专家决策问题是 在多个专家提出决 策的基础上 得出一个 综合的决策 , 并根 据实例调整 策略 , 使得到的 决策达到“ 最佳” . 文中介绍的算法将整个决策域划分成若 干个子决策域 , 并在各子决策 域为每个专家赋予权 值 , 从 而为每个 子决策域确定最佳 决策 . 文中提 出了两种决 策算法 , 并证明了 它们的有效 性 . 算 法 1得 到的决策 可在各个 子决策域都接近最佳专家决策 , 算法 2则力图在各 专家决策都偏离实 际值的情况下 , 提出比最佳专家 决策更接近实 际值的决策 . 关键词 决策 , 算法 , 机器学习 中图法分类号 T P 18
相关文档
最新文档