离散和连续空间中的最优搜索理论

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Initial probability density function:

(1)Uniform density

1/V n

(2)Gaussian density

mu, sigma

(3)Truncated Gaussian density

Normalization constant c=1/int A(p0(s)ds)

目标运动模型:

采用Transition density function 表示: dX/dt=V(X,t) (V表示目标的速度向量)

在正态分布等假设下,X(t)满足:

(*) dX=beta(X,t)dt+a(X,t)1/2dW

其中dW是一个维纳过程(Wiener process),有时也叫做布朗运动(Brownian motion),定义为: dW是具有正态分布且满足E(dW)=0和E[(dW)2]=dt,并且在不相交的时间区间上有相互独立的增量的随机过程.

方程(*)只是随机运动目标的近似模型,特别是当deta t很小时不成立.因为当deta t - ->0时,增量独立的假设不正确.为了弥补这个缺点,可以引入下面的加速度模型,或采用一个更一般的随机过程.但是对于大部分的应用来说,由(*)式所定义的运动模型只需经过少许修正就可使用.

两个特例:

1.逃避运动目标(evading target)

假定目标在向量场Z p(t)X(t)的方向以最大的速度逃离

2.随机漫游(random tours)

第二类的运动目标模型是基于目标的运动加速模型.

探测函数模型:

1.Visual detection model (视觉探测模型), 一个通用的视觉探测函数模型构造为:假定目标

位置在平面上的X点,而搜索者的位置在空间Z点处,探测函数b与目标所在平面和搜索者与目标位置所在直线的立体角(solid angle)成比例

2.Radar detection model (雷达探测模型), 应用探测统计学理论

3.Cookie cutter model (圆盘探测模型), 对称之为对时间依赖的圆盘模型(TDCC,

time-dependent cookie cutter)----当搜索者和目标之间的距离小于R时,探测概率为1,而在其他情况下探测概率等于0

扫描宽度(sweep width):它表示的是一个距离的大小,在这个距离以外搜索者探测到目标的概率与在这个距离以内搜索者探测不到目标的概率恰好相等

最简单情况:假设搜索者站在原点不动,而目标以速度v沿着平行于y轴的直线移动.设探测函数为b(x1,x2,t,z),则在时间t1和t2之间,搜索者探测的目标的概率为…

公式略

这个积分值F[x1]称为视能(sighting potential)

现在假设目标的运动路线是源于x点且平行于y轴的射线,到t时刻搜索者探测不到目标的概率u(x,t),表示搜索时间开始于t…

令p(x)=1-u(x,infinity), 这样p(x)就是最终在x点一侧的半直线上探测到目标的概率.因此得: p(x)=1-e-F[x]

通常称为侧向值域曲线(lateral range curve).现在给出扫描宽度W的定义如下:

W=int-infity+infinity p(x)dx

因为p(x)关于原点对称,很容易看出这样定义的扫描宽度W满足:

int0W/2[1-p(x)]dx=int W/2infinity p(x)dx

上面的等式说明前面对扫描宽度W的理解是正确的

对视觉探测的情况…

搜索者运动模型和搜索资源模型

简单情况下搜索者是静止的,dZ/dt=0. 更普遍情况下,搜索者的运动分基于速度的运动模型和基于加速度的运动模型.

定义:搜索资源分配函数

本书新颖之处:

1.以前的论著中均假设搜索目标的位置的初始概率分布函数是已知的,本书研究了在离散

空间中当目标的初始分布函数未知的情况下的最优搜索问题

2.分析讨论了非正则探测函数的最优搜索问题

3.研究了把随机运动的移动目标最优搜索问题转化为随机系统的最优控制问题进行研究

的方法,并利用最优化原是推导出随机移动目标搜索问题的Hamilton-Jacobi-Bellman (HJB)方程,将随机系统的最优搜索问题转为拟线性确定性系统的求解.这种方法对于解决十分困难的移动目标最优搜索问题指出了一条新途径.

对于静止目标的最优搜索问题即搜索资源的最优分配问题开展研究的先驱是B.O. Koopman.在探测函数具有指数函数形式的假定下研究了如何最大化发现目标的概率,并提出了在连续目标空间中且搜索资源连续可分的情况下进行查找的资源分配方法.Koopman证明了资源E1+E2的最优分配是资源E1的最优分配与资源E2的条件最优分配之和(在E1的分配完成后没能找到目标的条件对资源E2的最优分配).因此他得出结论:如果资源E1的分配策略已定,则搜索者在分配资源E2时并不能从资源E1的使用没能找到目标这个附加信息中获得任何好处.

Gluss推广了Koopman的模型,使之包含了惩罚性开销在内.

连续空间中的Koopman模型

假定搜索目标是隐藏在一个一维空间中的点:

g(x)>=0;

g(x)dx=Prob[x<=X<=x+dx]

int-infinity infinity g(x)dx=1 - ->此条件隐含着目标必定隐藏在这个给定的一维空间内的假定.当然我们也可以假定目标隐藏在此空间中的概率为alpha(alpha<=1).这样一来就包含了我们不知道是否搜索目标真的在我们所查找的空间内的情况,这种情况在实际实用(如石油勘探)中是可能出现的.

在区间x和x+dx中所投入的搜索资源可以用phi(x)dx表示.这里的phi(x)是一个尚待确定的非负并且连续的函数,称之为资源分配函数.如果我们所掌握的可供配置的总资源是有限的,设其等于K,于是我们得到:

int-infinity infinity phi(x)dx=K

在搜索目标确实位于点x的条件下,使用了搜索资源phi(x)以后成功地发现目标的概率记为b[phi(x)],这个概率叫做探测概率或探测函数,其特点如下:

b(0)=0, b’(phi)>=0, lim phi->infinity b(phi)=1

De Guenin进一步假设这个探测函数b(phi)是个正则函数,即: b’(.)是个单调递减函数,并且有b’(0)>0以及b’(infinity)=0.所以搜索者在x和x+dx之间成功发现目标的概率等于:

g(x)b[phi(x)]dx,

于是在整个空间中的搜索过程的成功发现目标的总概率为:

P(phi)= int-infinity infinity g(x)b[phi(x)]dx.

所以在这种情况下,最优搜索问题等价于确定函数phi(x)使得P(phi)达到最大化,并且满足下面的约束条件:

phi(x)>=0; int-infinity infinity phi(x)dx=K.

De Guenin的主要结果阐述在下面的定理中:

定理2.1 phi(x)使用P(phi)达到最大值的必要条件是在任一满足条件phi(x)>0的点x,有

g(x)b’phi[phi(x)]=C

这里C是任一常数.

Algorithm De Guenin略…

最小期望成本模型

不同的优化准则:

1.成功发现目标的概率最大化,而且总的搜索成本开销不超过事先的预算值K

2.用于查找和发现目标的时间期望值达到最小化- ->Staroverov

N个笼子:

<1> 目标不在笼j中,则找到目标的概率为0

<2> 目标在笼j中,则找到目标的概率为p

假定搜查不同笼子时得到的搜索结果是相互独立的.

我们可以将搜索所有笼子的过程表示为如下的一个序列:

a=(a1,a2,…,a j,…)

对应于每一个搜索过程a我们引入一个随机变量tao a,它的含义是在本次搜索中发现目标的时刻, Staroverov通过研究相关的正单调递减序列得到的一些代数结果,给出了:

E[tao a*]=inf a E[tao a];

其中E表示数学期望算子.因此a*是满足第二种优化优化准则的过程.

满足第二种优化准则的最优化搜索资源分配策略是由Gilbert首先提出并研究的:两个盒子,时间损失- ->Gluss,N个盒子搜索问题,特例:这些盒子是排成一列的- ->时间损失为常数的N 个盒子- ->具有转换损失的离散搜索模型,并得到了使用检测时间期望值最小化的最优搜索所满足的条件.