贝叶斯数据分析—基于R与Python的实现最新版讲义PDF版BayesP3

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

期性的和不可约的- 而且 π 是平稳分布- 那么- 当 M → ∞ 时-
1 M
i=1 M
?(t(i))
−→
1π[?(s)]
=
?(t)π(t)/t.
这就是所谓遍历定理X 因此可通过模拟有平稳分布 π 的马尔
可夫链用蒙特卡罗积分近似 ?(t)π(t)/tX
吴喜之
X X X XXXX XXXX XXXX X X X X X
吴喜之
X X X XXXX XXXX XXXX X X
X XX
LQp2K#2` k- kyky Rj f Rje
如果对于任意两个状态 tB, tD ∈ X - b × b 矩阵 S ≡ [SBD] = T t(F) = tD|t(F−1) = tB 对所有 F 保持不变- 而且
B SBD = 1- 则称该马尔可夫链是时齐 U?QKQ;2M2QmbV 的X S 称
似, [(θ) ≈ +QMbi + 1(θ − θˆ)2¨[(θˆ). 2
这和有均值 θˆ 及精度 −¨[(θˆ) 的正态分布的对数概率密度函数
一样X 对于后验分布
7(θ|t)

ℓ(θ|θ)T(θ)-

[(θ) = +QMbi + HQ; ℓ(θ|t) + HQ; T(θ). 在一些正则条件下- 共轭后
为一次转移概率矩阵X
对于任意初始状态分布 π0 = (π1(0), π2(0)i, . . . , πb(0))- 在 i 次转移
之后在各个状态的概率为向量 π0 SS · · · S = π0Si. 很容易验证- 当 i 很大时- 概率向量 π0Si 收敛到一个稳定的值 π乘X积而矩且阵该S值i和的初元始素概S率iBD 为π从0 无状关态- 即tB 经HBK过i→i∞步π转0S移i =到π状. 态 tD 的
拉普拉斯近似
吴喜之
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
LQp2K#2` k- kyky
X XX X X XX
8 f Rje
JS 估计只是找到后验分布的最大值X 拉普拉斯近似还计算 极大值附近的局部曲率到二阶项X 拉普拉斯近似适用于分布 7 满足 7(t)2/t < ∞ 的情况X 记光滑单峰的 T/77 的对数为 [(θ) = HQ; 7(θ)- 拉普拉斯建议近
T t(B)|t(B−1), t(B−2), . . . , t(1) = T t(B)|t(B−1) , ∀B.
式中的 T t(B)|t(B−1) 称为从状态 t(B−1) 到状态 t(B) 的转移概率X
上式意味着随机过程处于某状态的概率仅仅依赖前一个状态-
与之前的历史无关- 这就是马尔可夫性X
X X X XXXX XXXX XXXX X X X X X
M
θˆJG1 = `; Kt T(t|θ) = `; Kt T(tB|θ)
θ
θ
B=1
M
M
= `; Kt HQ; T(tB|θ) = `; Kt HQ; T(tB|θ);
θ
B=1
θ
B=1
θˆJS
=
`; Kt
θ
T(t|θ)T(θ) T(t)
=
`; Kt T(t|θ)T(θ)
θ
M
吴喜之
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
X XX
LQp2K#2` k- kyky Rd f Rje
J2i`QTQHBb 算法
吴喜之
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
T(θ|t)

(2π)−
K 2
||
1 2
2tT
1 − (θ

θˆ)⊤(θ

θˆ)
,
2
这里 = [BD] 是 6Bb?2` 信息阵X 于是有
ຫໍສະໝຸດ Baidu
HQ;
T(θ|t)

HQ;
T(θˆ)
+
T(t|θ)
+
K 2
HQ;


1 2
HQ;
||
当−2样T(本t|θ量) 大+ 的K 时HQ;候M -称HQ为; T贝(θ叶|t)斯≈信T息(t准|θ)则−UK"2 AH*Q;VXM. 其中
验分布趋于正态分布X
吴喜之
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
LQp2K#2` k- kyky
X XX X X XX
e f Rje
一般来说- 如果 θ = (θ1, θ2, . . . , θK)- t = (t1, t2, . . . , tM)- 当 M ≫ K 时- 后验分布 T(θ|t) 可近似为
第 d 章 贝叶斯推断中的一些算法
吴喜之
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
LQp2K#2` k- kyky
X XX X X XX
k f Rje
最大后验概率法
吴喜之
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
LQp2K#2` k- kyky Ry f Rje
如 s 为有分布 π 的随机变量- 想要计算函数 ?(t) 的期望 1π[?(t)] 时- 需要计算积分
1π[?(t)] = ?(t)π(t)/t.
该积分可能不容易求- 特别是当 s 是高维变量时更难X 但可以 从分布 π 中抽样, t(1), t(2), · · · , t(M) ∼ π,- 然后可以得到积分的
X X X XXXX XXXX XXXX X X
X XX
LQp2K#2` k- kyky R8 f Rje
J*J* 方法综述
吴喜之
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
X XX
LQp2K#2` k- kyky Re f Rje
对于贝叶斯推断- J*J* 模拟一个自选初始点 θ(0) 的离散时间 马T(θ尔(B)可) ≈夫T链(θ-|t产).生由一于串马相尔依可的夫随性机- θ变(B)量的{分θ(布B)}仅JB=1仅- 有和近θ(似B−1分) 有布关X J*J* 在状态空间 θ ∈ Θ 产生了一个马尔可夫链 {θ(1), θ(2), . . . , θ(J)}- 其每个样本都假定来自稳定分布 T(θ|t)即我们感兴趣的后验分布X 使用马尔可夫链的关键是设计合适的转移矩阵- 以便生成的链 达到与目标分布匹配的稳定分布X 此即后面若干方法的要点X J*J* 方法是通过智能跳跃执行的无记忆搜索X 智能跳跃用来 确保不可约性和非周期性X
URV 不可约性, 所有状态以正概率连接的X
UkV 非周期性, 链不应该被困在循环中X 如果从状态 tB 可达到 tD 的概率为 πD 对于所有的 D 成立- 那么
π = (π1, π2, . . . , πb) 为不变的X 如果不可约链有一平稳分布- 则 分布是唯一的X 如果马尔可夫链 t(1), t(2), · · · , t(M) ∼ π 是非周
吴喜之
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
X XX
LQp2K#2` k- kyky RN f Rje
J2i`QTQHBb@>biBM;b 算法
吴喜之
X X X XXXX XXXX XXXX X X X X X
概率X 易得 π = πS. 概率 π 称为平稳概率X 这显然是 S⊤ 的
特征值问题X
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
X XX
吴喜之
LQp2K#2` k- kyky R9 f Rje
为保证与初始概率分布无关的不变性- 转移矩阵 S 须满足,
拉普拉斯近似取代了旨在将函数与最大化的积分问题- 但须计
算模的位置- 使用函数优化器要比积分相同的函数更快X X X X X X X X X X X X X X X X X X X X X
X X X XXXX XXXX XXXX X X
X XX
吴喜之
LQp2K#2` k- kyky d f Rje
马尔可夫链蒙特卡罗方法
计算接受概率 α = KBM
1, T(t∗)
T(t(i−1) )
从 lMB7Uy-RV 中抽取随机数 m B7 m α- 接受候补并设置 t(i) = t∗ 2Hb2 t(i) = t(i−1)
为了使转移算子收敛到一个平稳的分布或目标分布- 马尔可夫链存在理论上的约束c t(i) → t(i+1) 的转移概率必须等于反向转移 t(i−1) → t(i) 的概率X 此可逆性属性通常称为详 细平衡 U/2iBH2/ #HM+2VX 使用 J2i`QTQHBb 方法在建议的转移概率分布 [(t|t(i−1)) 对称时 可以确保可逆性X 正态分布、*m+?v 分布、i 分布和均匀分布都有这种对称性X
X XX
LQp2K#2` k- kyky R3 f Rje
J2i`QTQHBb 方法收集 J 个样本的形式代码,
R b2i i = 0 k 从初始状态上的先验分布 π(0) 生成初始状态 t(0) j `2T2i- mMiBH i = J
b2i i = i + 1 从 [(t|t(i−1)) 生成候补状态 t∗
M
= `; Kt T(tB|θ)T(θ) = `; Kt HQ; T(tB|θ)T(θ).
θ
B=1
θ
B=1
如果先验分布是个常数- θˆJG1 和 θˆJS 相等X 如果后验分布的模可以以封闭的数学形式给 出 U比如使用共轭先验时V- 则可以用分析方法得到 JS 估计X 如果不能得到封闭形式- 或
者太复杂- 则可用共轭梯度法或牛顿法等数值优化法- 这通常需要采用两阶导数X 如果不
用导数- 可使用改进的 1J 算法- 也可以使用模拟退火的蒙特卡罗方X法X XX X X X X X X X X X X X X X X X X X
X X X XXXX XXXX XXXX X X
X XX
吴喜之
LQp2K#2` k- kyky 9 f Rje
吴喜之
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
LQp2K#2` k- kyky
X XX X X XX
3 f Rje
蒙特卡罗积分
马尔可夫链 J*J* 方法综述 J2i`QTQHBb 算法 J2i`QTQHBb@>biBM;b 算法 :B##b 抽样 >KBHiQMBM 蒙特卡罗方法
LQp2K#2` k- kyky
X XX X X XX
j f Rje
在贝叶斯统计中- 最大后验概率 UKtBKmK TQbi2`BQ`B- JSV 估计是对后验分布的模的估
计X JS 可根据经验数据获得未观测量的点估计X JS 估计可以看作 JG 估计的正则化 方法X 对于 t = t1, t2, . . . , M- JG 估计和而 JS 估计分别为
近似
1π[?(t)]

1 M
M B=1
?(t(B)).
这就是蒙特卡罗积分 UJQMi2 *`HQ BMi2;`iBQMVX 根据大数定理-

M → ∞-
有,
1 M
M B=1
?(t(B))
−→T
1π[?(t)].
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
吴喜之
X X X XXXX XXXX XXXX X X X X XXXX XXXX XXXX X X
LQp2K#2` k- kyky
X XX X X XX
N f Rje
蒙特卡罗积分
吴喜之
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
X XX
X XX X X XX
吴喜之
LQp2K#2` k- kyky RR f Rje
马尔可夫链
吴喜之
X X X XXXX XXXX XXXX X X X X X
X X X XXXX XXXX XXXX X X
X XX
LQp2K#2` k- kyky Rk f Rje
J*J* 是用马尔可夫链生成样本 t(B) 的方法- 它的构造使样本 t(B) 模拟从目标分布 T(t) 中提取样本X 用 J*J* 不能直接从 T(t) 中提取样本- 但可以估计 T(t) 到一个标准化常数的程度X 假定有限状态空间 X = {t1, t2, . . . , tb}- 令 t(B) 为马尔可夫链第 B 个状态- 这里 t(B) ∈ X 只能有 b 个离散值X 满足下面性质的随 机过程 t(B) 被称为马尔可夫链,
相关文档
最新文档