第三章鞅与停时
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.3. Doob 可选定理及鞅的收敛
⎧ X ,τ ≥ n 设 τ 为取非负整数值的停时, 令 X nτ = X min( n ,τ ) = ⎨ n , 称为随机过程 X n ⎩ X τ ,τ < n
在 τ 处停止过程。 引理 3.3.1:设 {X n , Fn } 是鞅,则 X nτ , Fn 也是鞅。
则 A ∈ Fσ ⇒ A I {σ ≤ τ }∈ Fτ , 从而若 σ ≤ τ 则 Fσ ⊂ Fτ 。 定理 3.1.2: 设 σ ,τ 为停时,
3.2 离散指标鞅 设 (Ω, F , P) 为概率空间, {Fn } 为一列单调增的子 σ -域(代数),即 Fn ⊂ Fn +1 , 随机变量序列 {X n } 称为对于 {Fn } 是适应的(adapted),若对任意 n ,σ ( X n ) ⊂ Fn , 即 X n 是 Fn 可测的。对于随机变量序列 {X n },总可以找到与之适应的单调增的一 此 σ -域 Fn 称为一个 “筛选” (filtration)。 例如取 Fn = σ ( X 0 , X 1 ,L X n ) 。 列 σ -域 Fn , 我们用偶序对 ( X n , Fn ) 表示。 称 {X n }对于 {Fn } 是 若 X n 对于单调增的 Fn 是适应的, 可预料的(predictable),若对任意 n , X n 是 Fn −1 可测的。 定义 3.2.1:适应随机过程 {X n , Fn , n ≥ 0} ,称为是鞅(martingale),如果对任意 n ,
{X n , Fn }
是 鞅 ,
t1 ≤ t 2 ≤ L ≤ t n ≤ L 为 非 降 有 界 停 时 , 则 X tn , Ftn 是 鞅 。 ( X tn
{
}
称 为 optional
sampling process)
r 给定区间 [a, b] ,序列 X = ( X 1 , L X n ) 上穿 [a, b] 区间的次数记为 N ([ an,)b ] 。若 r X = ( X 1 , L X n ) 为随机序列,则 N ([ an,)b ] 也是随机变量。
= EX 0 ;
2 若 {X n , Fn } 为 鞅 , 且 对 任 意 n , EX n < ∞ ,则对任意 l ≤ m ≤ n ,
E ( X n − X m )X l = 0 ;此外对任意 m ≤ n ,
2 2 E ( X n − X m ) 2 Fm = E X n Fm − X m 。
(
) (
)
定理 3.2.1:Doob-Meyer 下鞅分解定理(sub-martingale decomposition theorem) 设 {X n , Fn , n ≥ 0} 是下鞅, 则 X n 可以唯一分解为 X n = M n + An , 其中 M n 为鞅,An 是可预料的增过程( A0 = 0 )。 证明: 令 a n = E ( X n Fn −1 ) − X n −1 ≥ 0 , 令 A0 = 0 ,An = ∑ a k 为 Fn −1 可测的, 故 An 是
s >t
设 A 为闭集,令 τ A = min{t ∈ T X (t ) ∈ A} (约定空集时为 + ∞ ),表示过程首次进入
A 的时刻,τ A 称为首中时(hitting time),则 τ A 对于 σ -域 Ft 是停时;若 A 为开集,
首中时 τ A = inf {t ∈ T X (t ) ∈ A}(约定空集时为 + ∞ ),对于 σ -域 Ft 不是停时,但对 于 σ -域 Ft + 是停时;令 τ 表示过程最后离开 A 的时刻,则 τ 不是停时。
1
Dynkin “random time independent of the future”
性质: 1. 常值时间 c 为停时,此外若 τ 为停时, c ≥ 0 为常数,则 τ + c 为停时; 2. 设 τ 1 ,τ 2 为停时,则 τ 1 ∧ τ 2 = min (τ 1 ,τ 2 ) , τ 1 ∨ τ 2 = max (τ 1 ,τ 2 ) 为停时; 3. 设 τ 1 ,τ 2 为停时,则 τ 1 + τ 2 为停时; 4. 设 τ 1 ≤ τ 2 ≤ L ≤ τ n ≤ L 为停时,则 τ = lim τ n 为停时。
证明:由于 τ ≤ σ
⎛ K E ( X K Fσ ) = E ⎜ ⎜ ∑ X K I {σ =i} Fσ ⎝ i =1
K i =1
(
)
(
)
= ∑ I {σ =i} E ( X K Fi ) = ∑ I {σ =i} X i = X σ
i =1
同理 E ( X K Fτ ) = X τ 。注意到 Fτ ⊂ Fσ 。故
′ Fn −1 ) = M n −1 − M n ′ −1 , 令 一 方 面 M n − M n ′ = An ′ − An 为 Fn −1 可 测 , 故 E (M n − M n ′ Fn −1 ) = M n − M n ′ ,因此 E (M n − M n
3
′ = M n −1 − M n ′ −1 = L = M 0 − M 0 ′ = A0 ′ − A0 = 0 。 Mn − Mn
k =1 n
可 预 料 的 增 过 程 。 令 M n = X n − An , 易 证 M n 是 鞅 。 往 证 分 解 唯 一 性 。 若
′ + An ′ ,则 Mn − Mn ′ 为鞅,故 ′ = An ′ − An 。 一 方 面 M n − M n X n = M n + An = M n
2
E X n < ∞ 且 E ( X n +1 Fn ) = X n 。若 E ( X n +1 Fn ) ≥ X n ,则称为下鞅(sub-martingale);
若 E ( X n +1 Fn ) ≤ X n ,则称为上鞅(super-martingale)。 显然, X n 为鞅当且仅当它既是下鞅又是上鞅;若 X n 为下鞅等价于 − X n 为 上鞅。 例 3.2.1 : 设 Y0 , Y1 , L 为 任 随 机 变 量 , X 为 随 机 变 量 且 E X < ∞ 。 令
E ( X σ Fτ ) = E E ( X K Fσ ) Fτ = E ( X K Fτ ) = X τ 。
一般来说,停时有界的条件是不可缺少的。但如果 {X n } 一致可积,则对任何两 个停时 τ ≤ σ
(
)
a.s. ,都有 E ( X σ Fτ ) = X τ 。
定 理 3.3.2 : (Doob optional sampling theorem) 设
τ = n} 依赖于前 n 局 一个随机时间, Fn 是赌到第 n 局时赌博者所能掌握的信息,{
的结果,故 { τ = n}∈ Fn , τ 为停时。 例 3.1.2:设随机过程 X (t ), t ∈ T 样本路径连续,Ft = σ ( X ( s ) : s ≤ t ) ,Ft + = I Fs 。
第三章 鞅与停时
3.1 停时(可选时) 设 (Ω, F , P ) 为基本概率空间,参数集 T 或为 R+ = [0, ∞) 或为 Z + = {0,1,2L} , 令 Ft , t ∈ T 为一簇上升的 σ -域,即对一切 s, t ∈ T , s < t , Fs ⊂ Ft ⊂ F 。 定义 3.1.1:取值于 R+ = R+ U {+ ∞}或 Z + = Z + U {+ ∞} 上的随机变量 τ 称为(相对 于 σ - 域 Ft ) 停 时 ( 可 选 时 ) (stopping time or optional time) , 如 果 对 每 个 t ∈ R+ , {w : τ ( w) ≤ t} = { τ ≤ t}∈ Ft (或者对每个 n ∈ Z + , { τ ≤ n}∈ Fn )。 对于离散时间的停时有另外一个刻划:τ 为停时若对每个 n ∈ Z + ,{ τ = n}∈ Fn 。 以 τ 表示某个随机现象发生的时刻,事件 { τ ≤ t} 表示该随机现象在 t 以前已 经发生, Ft 表示到时刻 t 所已知的信息,若 τ 为停时,即 { τ ≤ t}∈ Ft ,表明该随机 现象(相对于 σ -域 Ft )是“可观察”的。 例 3.1.1: 某人在赌博时决定当胜局累计 100 次时停止赌博, 停止赌博的时刻 τ 是
n→∞
也就是以概率 1 赌徒最终要输光。 3.4 连续指标鞅 设 (Ω, F , P) 为概率空间, {Ft } 为一族单调增的子 σ - 代数,即若 s < t ,则
Fs ⊂ Ft ;对任意 t , X (t ) 为 Ft 可测的,则称随机过程 X (t ) 对于 {Ft } 是 适应的
(adapted)。 定义 3.4.1:随机过程 {X (t ), Ft , t ≥ 0} 称为鞅,若对任意 t , E X (t ) < ∞ ,且对任意
s < t , E ( X (离散指标鞅的一些定理可以平移到连续指标鞅的情形。
5
n
处有限的随机变量记为 X ∞ ,使得 P (lim X n = X ∞ ) = 1 。从而若 {X n , Fn } 为非负鞅,
n →∞
则以概率 1 的有 lim X n 存在且有限。
n→∞
例 3.3.1:(赌徒输光问题)一个赌徒参加公平的赌博,即若 X n 是赌徒在 n 局之后 的赌金, Fn = σ ( X 0 , X 1 ,L X n ) 为赌徒在 n 局后所掌握的信息,则 {X n , Fn }是鞅。 现假设不能赊钱,且每一局至少赢或输 1 元。令 N = min{n : X n = X n +1 },表示赌 徒被强迫退出时已赌的局数。由于 {X n , Fn } 为非负鞅,由收敛定理,以概率 1 的 有 lim X n 存在且有限。又由于若 N > n ,则 X n +1 − X n ≥ 1 ,因此 P ( N < ∞) = 1 。
{
}
定理 3.3.1: Doob 可选停止定理(optional stopping theorem ) 设 {X n , Fn } 是鞅,若
τ ≤σ
a.s. 为两个有界停时,则 E ( X σ Fτ ) = X τ 。 a.s. 为有界停时,设一个上界为 K 。
K ⎞ K ⎟ = E X I F = E X K I {σ =i} Fi ∑ ∑ = σ σ K i { } ⎟ i =1 ⎠ i =1 K
Fn = σ (Y0 , LYn ) , X n = E ( X Y0 , LYn ) = E ( X Fn ) ,则 X n 相对于 Fn 为鞅。
基本性质:
1) 2) 3) 4)
{X n , Fn } , {Yn , Fn }为鞅,则对任意常数 a, b , {aX n + bYn , Fn } 为鞅; {X n , Fn } 为鞅,则对任意 m ≤ n , E (X n+1 Fm ) = X m ; {X n , Fn } 为鞅,则对任意 n , EX n
n →∞
定义 3.1.2:停时 τ 的 τ 前事件 σ -域 Fτ 定义为 Fτ = {A ∈ F: AI{ τ ≤ t}∈ Ft , t ∈ T }。 Fτ 直观上的含义:若随机事件 A 在时间 τ 前就知道是否发生,现在到了时间 t , 若 τ ≤ t ,则当然应该知道随机事件 A 是否发生。
τ = t}上, Fτ = Ft 。 定理 3.1.1: τ 是 Fτ 可测的,且在 {
引理 3.3.1:Doob 上穿不等式(up-crossing inequality) 设为 {X n , Fn } 下鞅,则
4
r E ( X n − a) + − E ( X 1 − a) + EN ([ an,)b ] ( X ) ≤ b−a 定理 3.3.3:Doob 下鞅收敛定理 设 {X n , Fn } 下鞅且 sup E X n < ∞ ,则存在几乎处
⎧ X ,τ ≥ n 设 τ 为取非负整数值的停时, 令 X nτ = X min( n ,τ ) = ⎨ n , 称为随机过程 X n ⎩ X τ ,τ < n
在 τ 处停止过程。 引理 3.3.1:设 {X n , Fn } 是鞅,则 X nτ , Fn 也是鞅。
则 A ∈ Fσ ⇒ A I {σ ≤ τ }∈ Fτ , 从而若 σ ≤ τ 则 Fσ ⊂ Fτ 。 定理 3.1.2: 设 σ ,τ 为停时,
3.2 离散指标鞅 设 (Ω, F , P) 为概率空间, {Fn } 为一列单调增的子 σ -域(代数),即 Fn ⊂ Fn +1 , 随机变量序列 {X n } 称为对于 {Fn } 是适应的(adapted),若对任意 n ,σ ( X n ) ⊂ Fn , 即 X n 是 Fn 可测的。对于随机变量序列 {X n },总可以找到与之适应的单调增的一 此 σ -域 Fn 称为一个 “筛选” (filtration)。 例如取 Fn = σ ( X 0 , X 1 ,L X n ) 。 列 σ -域 Fn , 我们用偶序对 ( X n , Fn ) 表示。 称 {X n }对于 {Fn } 是 若 X n 对于单调增的 Fn 是适应的, 可预料的(predictable),若对任意 n , X n 是 Fn −1 可测的。 定义 3.2.1:适应随机过程 {X n , Fn , n ≥ 0} ,称为是鞅(martingale),如果对任意 n ,
{X n , Fn }
是 鞅 ,
t1 ≤ t 2 ≤ L ≤ t n ≤ L 为 非 降 有 界 停 时 , 则 X tn , Ftn 是 鞅 。 ( X tn
{
}
称 为 optional
sampling process)
r 给定区间 [a, b] ,序列 X = ( X 1 , L X n ) 上穿 [a, b] 区间的次数记为 N ([ an,)b ] 。若 r X = ( X 1 , L X n ) 为随机序列,则 N ([ an,)b ] 也是随机变量。
= EX 0 ;
2 若 {X n , Fn } 为 鞅 , 且 对 任 意 n , EX n < ∞ ,则对任意 l ≤ m ≤ n ,
E ( X n − X m )X l = 0 ;此外对任意 m ≤ n ,
2 2 E ( X n − X m ) 2 Fm = E X n Fm − X m 。
(
) (
)
定理 3.2.1:Doob-Meyer 下鞅分解定理(sub-martingale decomposition theorem) 设 {X n , Fn , n ≥ 0} 是下鞅, 则 X n 可以唯一分解为 X n = M n + An , 其中 M n 为鞅,An 是可预料的增过程( A0 = 0 )。 证明: 令 a n = E ( X n Fn −1 ) − X n −1 ≥ 0 , 令 A0 = 0 ,An = ∑ a k 为 Fn −1 可测的, 故 An 是
s >t
设 A 为闭集,令 τ A = min{t ∈ T X (t ) ∈ A} (约定空集时为 + ∞ ),表示过程首次进入
A 的时刻,τ A 称为首中时(hitting time),则 τ A 对于 σ -域 Ft 是停时;若 A 为开集,
首中时 τ A = inf {t ∈ T X (t ) ∈ A}(约定空集时为 + ∞ ),对于 σ -域 Ft 不是停时,但对 于 σ -域 Ft + 是停时;令 τ 表示过程最后离开 A 的时刻,则 τ 不是停时。
1
Dynkin “random time independent of the future”
性质: 1. 常值时间 c 为停时,此外若 τ 为停时, c ≥ 0 为常数,则 τ + c 为停时; 2. 设 τ 1 ,τ 2 为停时,则 τ 1 ∧ τ 2 = min (τ 1 ,τ 2 ) , τ 1 ∨ τ 2 = max (τ 1 ,τ 2 ) 为停时; 3. 设 τ 1 ,τ 2 为停时,则 τ 1 + τ 2 为停时; 4. 设 τ 1 ≤ τ 2 ≤ L ≤ τ n ≤ L 为停时,则 τ = lim τ n 为停时。
证明:由于 τ ≤ σ
⎛ K E ( X K Fσ ) = E ⎜ ⎜ ∑ X K I {σ =i} Fσ ⎝ i =1
K i =1
(
)
(
)
= ∑ I {σ =i} E ( X K Fi ) = ∑ I {σ =i} X i = X σ
i =1
同理 E ( X K Fτ ) = X τ 。注意到 Fτ ⊂ Fσ 。故
′ Fn −1 ) = M n −1 − M n ′ −1 , 令 一 方 面 M n − M n ′ = An ′ − An 为 Fn −1 可 测 , 故 E (M n − M n ′ Fn −1 ) = M n − M n ′ ,因此 E (M n − M n
3
′ = M n −1 − M n ′ −1 = L = M 0 − M 0 ′ = A0 ′ − A0 = 0 。 Mn − Mn
k =1 n
可 预 料 的 增 过 程 。 令 M n = X n − An , 易 证 M n 是 鞅 。 往 证 分 解 唯 一 性 。 若
′ + An ′ ,则 Mn − Mn ′ 为鞅,故 ′ = An ′ − An 。 一 方 面 M n − M n X n = M n + An = M n
2
E X n < ∞ 且 E ( X n +1 Fn ) = X n 。若 E ( X n +1 Fn ) ≥ X n ,则称为下鞅(sub-martingale);
若 E ( X n +1 Fn ) ≤ X n ,则称为上鞅(super-martingale)。 显然, X n 为鞅当且仅当它既是下鞅又是上鞅;若 X n 为下鞅等价于 − X n 为 上鞅。 例 3.2.1 : 设 Y0 , Y1 , L 为 任 随 机 变 量 , X 为 随 机 变 量 且 E X < ∞ 。 令
E ( X σ Fτ ) = E E ( X K Fσ ) Fτ = E ( X K Fτ ) = X τ 。
一般来说,停时有界的条件是不可缺少的。但如果 {X n } 一致可积,则对任何两 个停时 τ ≤ σ
(
)
a.s. ,都有 E ( X σ Fτ ) = X τ 。
定 理 3.3.2 : (Doob optional sampling theorem) 设
τ = n} 依赖于前 n 局 一个随机时间, Fn 是赌到第 n 局时赌博者所能掌握的信息,{
的结果,故 { τ = n}∈ Fn , τ 为停时。 例 3.1.2:设随机过程 X (t ), t ∈ T 样本路径连续,Ft = σ ( X ( s ) : s ≤ t ) ,Ft + = I Fs 。
第三章 鞅与停时
3.1 停时(可选时) 设 (Ω, F , P ) 为基本概率空间,参数集 T 或为 R+ = [0, ∞) 或为 Z + = {0,1,2L} , 令 Ft , t ∈ T 为一簇上升的 σ -域,即对一切 s, t ∈ T , s < t , Fs ⊂ Ft ⊂ F 。 定义 3.1.1:取值于 R+ = R+ U {+ ∞}或 Z + = Z + U {+ ∞} 上的随机变量 τ 称为(相对 于 σ - 域 Ft ) 停 时 ( 可 选 时 ) (stopping time or optional time) , 如 果 对 每 个 t ∈ R+ , {w : τ ( w) ≤ t} = { τ ≤ t}∈ Ft (或者对每个 n ∈ Z + , { τ ≤ n}∈ Fn )。 对于离散时间的停时有另外一个刻划:τ 为停时若对每个 n ∈ Z + ,{ τ = n}∈ Fn 。 以 τ 表示某个随机现象发生的时刻,事件 { τ ≤ t} 表示该随机现象在 t 以前已 经发生, Ft 表示到时刻 t 所已知的信息,若 τ 为停时,即 { τ ≤ t}∈ Ft ,表明该随机 现象(相对于 σ -域 Ft )是“可观察”的。 例 3.1.1: 某人在赌博时决定当胜局累计 100 次时停止赌博, 停止赌博的时刻 τ 是
n→∞
也就是以概率 1 赌徒最终要输光。 3.4 连续指标鞅 设 (Ω, F , P) 为概率空间, {Ft } 为一族单调增的子 σ - 代数,即若 s < t ,则
Fs ⊂ Ft ;对任意 t , X (t ) 为 Ft 可测的,则称随机过程 X (t ) 对于 {Ft } 是 适应的
(adapted)。 定义 3.4.1:随机过程 {X (t ), Ft , t ≥ 0} 称为鞅,若对任意 t , E X (t ) < ∞ ,且对任意
s < t , E ( X (离散指标鞅的一些定理可以平移到连续指标鞅的情形。
5
n
处有限的随机变量记为 X ∞ ,使得 P (lim X n = X ∞ ) = 1 。从而若 {X n , Fn } 为非负鞅,
n →∞
则以概率 1 的有 lim X n 存在且有限。
n→∞
例 3.3.1:(赌徒输光问题)一个赌徒参加公平的赌博,即若 X n 是赌徒在 n 局之后 的赌金, Fn = σ ( X 0 , X 1 ,L X n ) 为赌徒在 n 局后所掌握的信息,则 {X n , Fn }是鞅。 现假设不能赊钱,且每一局至少赢或输 1 元。令 N = min{n : X n = X n +1 },表示赌 徒被强迫退出时已赌的局数。由于 {X n , Fn } 为非负鞅,由收敛定理,以概率 1 的 有 lim X n 存在且有限。又由于若 N > n ,则 X n +1 − X n ≥ 1 ,因此 P ( N < ∞) = 1 。
{
}
定理 3.3.1: Doob 可选停止定理(optional stopping theorem ) 设 {X n , Fn } 是鞅,若
τ ≤σ
a.s. 为两个有界停时,则 E ( X σ Fτ ) = X τ 。 a.s. 为有界停时,设一个上界为 K 。
K ⎞ K ⎟ = E X I F = E X K I {σ =i} Fi ∑ ∑ = σ σ K i { } ⎟ i =1 ⎠ i =1 K
Fn = σ (Y0 , LYn ) , X n = E ( X Y0 , LYn ) = E ( X Fn ) ,则 X n 相对于 Fn 为鞅。
基本性质:
1) 2) 3) 4)
{X n , Fn } , {Yn , Fn }为鞅,则对任意常数 a, b , {aX n + bYn , Fn } 为鞅; {X n , Fn } 为鞅,则对任意 m ≤ n , E (X n+1 Fm ) = X m ; {X n , Fn } 为鞅,则对任意 n , EX n
n →∞
定义 3.1.2:停时 τ 的 τ 前事件 σ -域 Fτ 定义为 Fτ = {A ∈ F: AI{ τ ≤ t}∈ Ft , t ∈ T }。 Fτ 直观上的含义:若随机事件 A 在时间 τ 前就知道是否发生,现在到了时间 t , 若 τ ≤ t ,则当然应该知道随机事件 A 是否发生。
τ = t}上, Fτ = Ft 。 定理 3.1.1: τ 是 Fτ 可测的,且在 {
引理 3.3.1:Doob 上穿不等式(up-crossing inequality) 设为 {X n , Fn } 下鞅,则
4
r E ( X n − a) + − E ( X 1 − a) + EN ([ an,)b ] ( X ) ≤ b−a 定理 3.3.3:Doob 下鞅收敛定理 设 {X n , Fn } 下鞅且 sup E X n < ∞ ,则存在几乎处