(目标管理)基于粒子滤波器的非线性或非高斯分布情况下的在线数据贝叶斯目标追踪
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(目标管理)基于粒子滤波器的非线性或非高斯分布情况下的在线数据贝叶斯
目标追踪
基于粒子滤波器的非线性或非高斯分布情况下的于线数据贝叶
斯目标追踪的讲解
个人翻译作品
By梧桐
QQ:340287132
原文
ATutorialonParticleFiltersforOnline
Nonlinear/Non-GaussianBayesianTracking
M.SanjeevArulampalam,SimonMaskell,NeilGordon,andTimClapp
基于粒子滤波器的非线性或非高斯分布情况下的于线数据贝叶
斯目标追踪的讲解
摘要——如今许多应用领域中,为了提高物理系统中基础动力的建模精度,人们纷纷引入非线性和非高斯性情况的处理方法,促使该技术地位日益重要。加之,无论是计算仓储费用仍是对变化的信号特征作出迅速判断,于线数据的处理的方法均起着关键性的作用。因此本文将着重针对粒子滤波器中的非线性和非高斯分布情况下的目标追踪问题,讨论最优和次优贝叶斯算法的实际应用。粒子滤波器的思想是源自序列蒙特卡罗方法,它用粒子来表示概率密度函数。这种方法能够应用到任何形式的状态空间模型中,且且涵盖了壹切卡尔曼滤波方法能处理的情况。而且滤波器形式多样,例如SIR,ASIR,以及RPF,但它们均引用了名为序列性重要化采样算法(SIS)的通用框架。下文中,通过讨论,对比以及引用典型事例,我们将对标准的卡尔曼滤波器进行详细阐述。
关键词:贝叶斯算法,非线性和非高斯分布,粒子滤波器,序列蒙特卡罗方法,目标追踪
简介
科学生活中面对许多问题时,均需要对系统状态进行估算,即利用含有噪声的观测量,对非线性系统的状态做出实时估计的问题。本文中,我们将主要研究动态模型系统中的状态空间法,而重点是离散时间公式的讨论。因此,系统随时间演化的过程中,我们会使用不同的公式和之对应。动态状态估算中,离散时间公式既简便又实用。
离散时间公式主要着眼于系统状态向量的运算。状态矢量是用于描述系统调查过程中所需要的壹切关联信息的合集,比如研究目标追踪时,目标的运动特征。再之,于经济计量学上的资金流,利率,通货膨胀等信息。观测矢量代表同状态矢量关联的干扰观测值。壹般来讲,观测向量比状态向量维数低(但也且非绝对)。状态空间公式便于解决多变量数据和非
线性及非高斯分布的情况,且且为传统的时间序列方法提供了极大的优势。公式【41】对此进行了详细的解释。另外,于【26】中,列举出各类应用非线性和非高斯分布的状态空间模型。
处理动力系统问题时,至少需要俩个模型才能对其作出分析和推理。第壹个表达状态随时间变化的动态方程(系统模型),第二个表表述观测向量和状态向量之间关系的量测方程(量测模型)。假设俩种模型于概率形式上可行。理想状态下,时间空间的概率方程和得到新测量值后对信息的更新需求仍然适用贝叶斯算法。那么这就为动态状态估算时提供了严密的通用框架。
于动态状态估算中运用贝叶斯算法时,有人曾尝试建立壹个后验概率密度函数处理任何信息,包括接收到的所有测量值。自从后验概率函数出现之后,能够说它是壹切估算问题的全解。原则上来讲,通过后验概率函数能够得到系统的最优估算方法,以及精确估算的测量方法。可是很多问题中,估算非常频繁,每接收到壹份测量值均需要进行壹次估算。于这种情况下,最方便的解决方法是递推滤波器。这种滤波器能够对接收到的测量值进行有序处理,而非分批处理。这样就能有效避免存储完整数据集后才处理,或者每接收新的测量值就要对已存于的所有数据重新计算。递推滤波器有预测和修正俩个必要步骤。预测阶段,系统模型会对下壹个测量值的后验概率函数进行期望值计算。由于系统状态通常会受未知因素干扰(随机噪声),预测时会对状态后验概率函数进行编译,变形,以及扩展。修正运算是使用最新的测量值则对期望值的后验状态函数进行修改。之上俩步均建立于贝叶斯理论之上,即按照新数据中的额外信息对目标状态进行及时修正。
本文的第二部从非线性目标追踪问题的描述和最优贝叶斯算法展开。于某些特定条件下,最优贝叶斯算法非常实用。而另外俩种算法,卡尔曼滤波器算法和网格点算法将于本文第三部分进行阐述。最优算法此时不易实现。第四部分则概括了几种最优算法的近似算法,其中包括扩展卡尔曼滤波算法,网格点逼近算法和粒子滤波算法。然后于第六部分,文章通过壹个简单的标量实例,。。。。最后第七部分为总结部分。本文是壹篇指导性文章:因此。。。
II.非线性目标追踪
为了定义目标追踪,设目标状态运动序列为
函数方程为
此处,为非线性概率函数,是独立分布的噪音序列。分别为状态规模和噪音向量处理,为自然数集。目标的追踪是对进行递推估算。
函数方程为
其中,为非线性概率函数,是独立分布的噪音序列,分别为状态规模和噪音向量处理,的变量为时间K。
设所需后验概率函数于时间K-1为可求。那么预测阶段就通过方程式(3)使用系统模型(1)求的于时间K时前壹后验概率函数的值。
其后于时间为K时,测量值可求,此时根据贝叶斯定理对前壹数据进行修正(修正阶段)。
而其归壹化常数函数为
III.最优算法
A.卡尔曼滤波方法
当系统方程为线性函数。过程噪声。观测噪声以及系统状态的先验概率密度函数为高斯分布时。递推的贝叶斯会计问题能够大大减化。于这种条件下,由于高斯分布的壹、二阶矩包含了概率分布的全部信息,只须估计系统状态的条件均值及协方差阵。就能够递推计算后
验概率密度函数.其实现过程就是卡尔曼滤波算法。此时。系统方程为:
卡尔曼滤波算法由公式(3)和(4)推出,通常用壹下函数表示其递推关系。
其中
及表示变量X服从均值为m,方差为P的高斯密度。
B.网格点算法
当状态空间为离散态且包含状态限量时,网格点算法引入了最优递增算法中的密度函数。设状态空间于时间K-1包含离散状态。那么于每个状态下,为其引入假定状态概率,且用表示到时间K-1为止的测量值,函数即。如此于K-1时刻的后验概率密度函数即为
其中为狄拉克测量函数。将函数(17)替换到(3)和(4)的预测和修正方程式中,分别为其中
IV.次优算法
而实际应用中,许多情况下上文中的假设且不成立,因此尔曼滤波算法和网格点算法且不实用,此时,只能采用近似的次优滤波算法。本部分我们将介绍3种非线性贝叶斯近似算法:
a)扩展的卡尔曼算法(EKF)
b)近似网格点算法
c)粒子滤波算法
A.扩展的卡尔曼算法EKF
于非线性函数中,(1)和(2)不能写成(6)和(7)的形式,我们就用壹个区域线化等式来描述非线性情况。EKF即是基于次思想的近似算法,是壹个高斯近似算法函数
其中
此处和为非线性函数,和是之前非线性函数中的区域化线性函数(例如,矩阵算法)。
EKF方法于线性化过程中。仅对泰勤级数展开作壹阶截短,因而其相应的均值,方差估计仅仅有壹阶精度;而且,该方法忽略了系统状态及噪声的随机分布特性,仅仅于当前状态、估计值点上作线性变换。这些均对转换后变量均值、方差估计引入了较大的误差,甚至导致滤波器发散。
B.近似网格点算法
如果状态空间是连续的,但不属于“集合单元”,那么能够用网格点算法近似计算其后的密度值。设后验概率密度函数于K-1时的函数值近似为
那么预测和修正函数则为
其中
此处,表示
V.粒子滤波算法
A.序列化重要性抽样算法(SIS)
序列化重要性抽样算法是壹种蒙特卡洛算法。这种算法是过去几十年由大连续蒙特卡洛算法演变而来的。为了展示算法的细节,用表示壹个含后验概率密度的随机估量。其中支持点关联加权,而表示到时间K为止所有的状态量。Weight壹个固定值,表达式为。那么于K时的后验密度即近似表示为
因此我们就有了得到壹个计算真后验的离散加权的逼近算法。。加权选用重要性采样原理。这个原理的依据是设是壹个难以采样的系统的概率密度函数。此外,令为样本,且能够从假设中轻易产生,称为重要密度。那么对的加权近似密度算法就为
其中