连续隐马尔科夫链模型简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.1 连续隐马尔科夫链模型(CHMM)

在交通规划和决策的角度估计特定出行者的确切的出行目的没有必要,推测出行者在一定条件下会有某种目的的概率就能够满足要求。因此本文提出一种基于无监督机器学习的连续隐马尔科夫链模型(CHMM)来识别公共自行车出行链借还车出行目的,根据个人属性、出行时间和站点土地利用属性数据,得到每次借还车活动属于某种出行目的的概率,进一步识别公共自行车出行链最可能的出行目的活动链。

4.1.1连续隐马尔科夫链模型概述

隐马尔可夫链模型(Hidden Markov Model,HMM)是一种统计模型,它被用来描述一个含有隐含未知状态的马尔可夫链。隐马尔可夫链模型是马尔可夫链的一种,其隐藏状态不能被直接观察到,但能通过观测向量序列推断出来,每个观测向量都是通过状态成员的概率密度分布表现,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。

本文将隐马尔科夫链和混合高斯融合在一起,形成一个连续的隐马尔科夫链模型(CHMM),并应用该模型来识别公共自行车出行链借还车活动目的。连续隐马尔科夫链模型采用无监督的机器学习技术,用于训练的数据无需是标记的数据,该模型既不需要标记训练数据,也没有后续的样本测试,如提示-回忆调查。相反,该模型仅利用智能卡和总的土地利用数据。后者为隐藏活动提供额外的解释变量。出行链内各活动的时间和空间信息是从IC卡数据获得,相关土地利用数据是根据南京土地利用规划图和百度地图POI数据获得。

在本文的研究中,一个马尔可夫链可以解释为出行者在两个连续活动状态之间的状态转换,确定一个状态只取决于它之前的状态,一个状态对应一个出行者未知的借还车活动[48-50]。本研究坚持传统的马尔可夫过程的假设,将它包含进无监督的机器学习模型。“隐藏马尔可夫”源于一个事实,即一系列出行链的活动是不可观察的。

对于CHMM,高斯混合模型负责的是马尔可夫链的输入端,每一个活动模式下的隐藏状态都有属于一个特征空间的集群输出概率,每个集群是观察不到的,隐藏状态集群的数量必须事先给出。一些研究者称这些集群为二级隐状态[51]。

有两种选择可以用来处理隐藏的集群:第一种,每个状态可以被假定为有一组独立的集群,尽管这个假定有利于找到每种状态独自的概率,但是有计算时间的负担;另一种模型规定允许所有隐状态共享一组集群。本研究采用后者的理论,既节省计算时间又简化了模型的假设条件。

基于CHMM的公共自行车出行链出行目的识别过程如下。首先,从IC卡数据中提取公共自行车出行链。第二,确定潜在借还车活动的数量。在这个阶段,没有关于隐藏目的与实际活动的映射信息。第三,确定可能的集群数。第四,为样本链的活动链中所有隐藏活动收集特征数据。第五步是对CHMM参数估计算法的实现。第六步是通过模型估计参数来描述集群的特征和映射的每个状态概率分布。最后,应用训练好的CHMM模型,推算出公共自行车出行链最有可能的借还车活动目的序列。

4.1.2连续隐马尔科夫链模型构建

本文设计的CHMM是由状态和观测变量构造的,假设每条观测序列,都是由其隐藏状态按照一定规则顺序而产生的,形成如图4- 1所示的三层层级结构:

图4- 1 CHMM的结构示意图

在公共自行车出行链出行目的识别的研究中,先从数据中提取出行链得到观测序列,观测序列包含时间地点出行者属性等变量。为了整合这些变量,从这些变量中提取公共自行车骑行模式,将观测样本序列转化为出行模型集群序列,然后再识别产生出行模式序列背后隐藏的出行目的序列。在本研究中,一个特征向量是由7个特征变量组成的:公共自行车使用者的年龄、用车出行时段、借/还车类型以及4种公共自行车站点的土地利用特征。首先根据每个集群的特征向量提取出公共自行车出行模式,然后应用CHMM来确定隐藏状态间的转移概率,

以及每个状态连接到每个出行模式群集的成员概率。

在建立模型之前应预先确定一个状态变量可能存在的值的数量。式(4-1)表示一个初始状态属于一种出行活动的概率集合。

π={πi }={P(x 1=i)},i =1,...,N (4-1)

其中x 1表示出行链的活动序列的初始状态变量,N 是可以由一个状态变量得到的可能的活动数量,i 代表第i 个活动,来自于可能的活动集合,πi 是第一个状态为第i 个活动的概率,π是一个初始概率向量。

式(4-2)表示两个连续状态之间的转移概率矩阵。在本模型中,出行链被转换为一个状态序列,遵循马尔可夫过程。也就是说,出行链内的活动状态被假定为仅依赖先前活动的状态。

A ={a ij }={P(x t =j|x t−1=i)},i =1,...,N,j =1,...,N (4-2)

其中x t 代表活动链出行序列的第t 个状态,a ij 是当先前的第(t-1)个状态给出为活动i 时,第t 个状态选择活动j 的概率。A 是包含转移概率的N*N 矩阵。

式(4-3)代表输出概率b i (o t ),o t 将在状态i 中被观察到,它采取高斯混合模型的形式。

b i (o t )=∑g ik K k=1 f (o t |μik ,∑ik ),i =1,...,N (4-3)

其中o t 是序列的第t 个状态的一个观测特征变量,K 是在一个特征空间里的隐藏集群数目,g ik 是一个观察来自第k 个集群时的当前状态是活动i 的成员概率(活动i 属于集群k 的概率),μik 是活动i 第k 个集群的特征向量的平均值。∑ik 是第i 个活动的第k 个集群的方差-协方差矩阵,f (o t |μik ,∑ik )是高斯概率密度公式。

为了简洁起见,式(4-4)表示每个状态都被假定为共享一组公共集群。高斯混合模型的N ×K 权重矩阵(G )可以解释为式(4-5),被称为成员概率矩阵。

μik =μk ∑ik =∑k ,i =1,...,N.k =1,...,K (4-4)

G ={g ik } = {P(m t = k|x t = i)},i =1,...,N,k =1,...,K (4-5) 其中m t 代表序列第t 个隐藏状态的特征空间里的隐藏集群。

如前所述,训练CHMM 的样本是从多元高斯分布生成的特征向量。根据观测值估计的参数由一个矢量集合表示。必须建立出行链观测序列的似然函数来估

相关文档
最新文档