一类零模正则复合优化问题的多阶段 凸松弛法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Keywords
Zero-Norm Regularization, MPEC Problem, Exact Penalty, Multi-Stage Convex Relaxation
一类零模正则复合优化问题的多阶段 凸松弛法
吕佩雯
华南理工大学,广东 广州
收稿日期:2019年1月14日;录用日期:2019年1月26日;发布日期:2019年2月2日
0
= ∑ i=1φ θi∗ 。
n
( )
{vf ( x ) + ∑ φ (θi ) + ρ (1 − θi ) xi } x∈R ,θ ∈[ 0,e ]
min n
i =1
n
(4)
其中 ρ > 0 是罚参数。 下面的定理将说明问题(4)是问题(3)的全局精确罚, 即它们有相同的全局最优解集[4]。 ∗ ′ (1) 1 − t φ− ∗ ∗ = S ∗ 。这里 S ρ 定理 1:令 φ ∈ Φ 。对所有 ρ > ρ = ,有 S ρ 是与 ρ 相关的问题(4)的全 vL f 1− t
n
3. 多阶段凸松弛法
ˆ ,对于 φ ∈ Φ 且 ρ > ρ 时,可由求解罚问题(5)得到。 从上一节可知,求解零模正则化问题的解估计 x
当给定 v > 0 时,阀值 ρ > 0 是容易计算得到的。对一个给定的 ρ > ρ ,虽然罚问题(5)是非凸的,但是这 种结构使得它比零模正则化问题更好解决。特别的,当变量 θ 选定时,问题(5)退化为关于 x 的凸的极小 化问题;当变量 x 选定时,问题(5)退化为关于 θ 的凸的极小化问题,后面将看到这样的问题是有闭式解
ˆ [5]。 的。基于此,本文将通过使用多阶段凸松弛法交替求解问题(5)来得到解估计 x ˆ) 算法 1. (GEP-MSCRA 求解 x
Step 0:取 φ ∈ Φ , v > 0 和初始点 θ 0 ∈ [ 0, te ] 。置 k := 1 。
x∈R
n
Step 1: 令 v k −1= e − θ k −1 并计算下面的极小化问题:x k ∈ arg min f ( x) + λ ∑ i=1 vik −1 xi 。
(
)
局最优解集, S ∗ 是问题(3)的全局最优解集。
ˆ 可在 ρ > ρ 时,由求解问题(4)得到,即: 由定理 1,零模正则问题(1)的解估计量 x
ˆ) ∈ ˆ, θ (x
{vf ( x ) + ∑ φ (θi ) + ρ (1 − θi ) xi } ,其中 ρ > ρ 。 x∈R ,θ ∈[ 0,e ]
2. 零模正则复合优化问题
2.1. 零模正则问题
设 R n 是赋予了内积 ⋅, ⋅ 及诱导范数 ⋅ 的有限维向量空间。考虑零模正则规划:
µ 2 ˆ ∈ arg minν ψ ( Ax ) + c, x + x x + x 2 x∈R n
0
(1)
T
为以后的逻辑回归研究作铺垫[1] [2]。记 f ( x ) := ψ ( Ax ) + c , x + µ 2 x ,则函数 f 是全局 Lipschitz 连续
n ˆ ∈ arg min vf ( x ) + ρ x 1 − ∑ ϕ ∗ ( ρ xi ) ,其中 ρ > ρ x x∈R n i =1
(6)
DOI: 10.12677/orf.2019.91008
67
运筹与模糊学
吕佩雯
这意味着下面的函数是 x 0 的等价 DC 替代: Θ ( x ) = : ρ x 1 − ∑ i=1ϕ ∗ ( ρ xi ) 。
(
)
问题(1)可以重写为一个等价 MPEC 问题。 不难验证: 对任意给定的 x ∈ R n 下面将说明对任意 φ ∈ Φ , 和φ ∈Φ ,
n x 0 = min ∑ φ (θi ) : x 1 − θ , x = 0, 0 ≤ θ ≤ e θ ∈R n i =1
(2)
因此问题(1)等价于:


本文从零模函数的变分刻画入手,将这类带有组合性质的优化问题等价转化为具有拟双线性结构且全局 Lipshitz连续的优化模型,以此设计了求解零模正则化复合优化问题的多阶段凸松弛方法,并对该方法
文章引用: 吕佩雯. 一类零模正则复合优化问题的多阶段凸松弛法[J]. 运筹与模糊学, 2019, 9(1): 65-71. DOI: 10.12677/orf.2019.91008
th th nd
Abstract
This article starts from the variational characterization of zero-norm, then changes such a combination optimization problem to an equivalent model which has bi-linear structure and global Lipschitz continuous. This article also designed multi-stage convex relaxation methods to solve the zero-norm regularized composite optimization problem, and analyzed the convergence for it.
n min ν f ( x ) + ∑ φ (θi ) : e − θ , x = 0, 0 ≤ θ ≤ e n n x∈R ,θ ∈R i =1
(3)
假设问题(1)有非空全局最优解集且最优值为 ϖ ∗ ,由文献[4]可得如下引理:
优解,那么 x∗ 是问题(1)的全局最优解且 x∗
0≤t ≤1
( )
∗ v = : min {φ ( t ) + ρω (1 − t )} 满足: t∈[ 0,1]
1 −1 ∗ 令 t 为 ( ∂φ ) ∩ ∗ t ,1) 中的最小元素,由下面引理(参考文献[4]引理 5)可知这样的 t 存在: 1− t 1 引理 1:令 φ ∈ Φ ,存在 t0 ∈ 0,1) 使得 1 − t ∗ ∈ ∂φ ( t0 ) ,且对任意给定的 ω ≥ 0 和 ρ > 0 ,最优值
吕佩雯
进行了收敛性分析。
关键词
零模正则化,MPEC问题,精确罚,多阶段凸松弛
Copyright © 2019 by author(s) and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/
注 1:由函数 ϕ 的定义, θ k 是(8)的最优解当且仅当 θik ∈ ∂ϕ ∗ ρ xik , i = 1,
n
{
}
(7)
若 k = 1 ,由 x1 的取值选取参数 ρ > ρ 并使 λ = ρ v −1 。
θ k ∈ arg min 计算下面的极小化问题: Step 2:
θ ∈[ 0,e]
{∑
n i =1
φ (θi ) − ρθi xik 。
}
(8)
Step 3:置 k ← k + 1 ,返回(S. 1)步。
Open Access
1. 引言
在过去几十年,高维回归在基因学、金融、图像处理、气候科学、传感器网络等领域有着广泛应用。 经典的高维线性回归模型假设预测变量的维数 n 总是大于样本的数量 m,尽管有效的预测变量的维数 s 总是远小于 n 的。零模正则化在统计、机器学习、信号与图像处理、稀疏模型选择和误差修正、金融工 程及量子计算等领域中有着广泛的应用。这种非凸正则为稀疏恢复提供了一种有效的方法。然而,在高 维的问题中却很难分析。
DOI: 10.12677/orf.2019.91008
66
运筹与模糊学
吕佩雯
v∗ = 1, ′ (1) , +∞ ) ; 若ρω ∈ (φ− ∗ ρω (1 − t0 ) 1 ′ (1) ; , 若ρω ∈ , φ− v ≥ ∗ ∗ ′ (1) 1 − t φ− 1 − t ∗ 1 若ρω ∈ 0, v ≥ ρω (1 − t0 ) , . 1 t∗ −
( x , max ( sign ( x ) , t e)) 是问题(3)的全局最优解且最优值等于 ϖ ;相反的,若 ( x ,θ ) 是问题(3)的全局最
∗ ∗ ∗
引理 2:令 φ ∈ Φ ,零模正则问题(1)等价于问题(3)。当 x∗ 是问题(1)的全局最优解时,

∗ ∗
问题(3)的可行集中包含着如下互补约束: e − θ ≥ 0 , x ≥ 0 且 e − θ , x = 0 。这说明零模正则化问题 也是一个带有互补约束的数学规划问题(MPEC),但是 MPEC 在优化中也是一类很难的问题。虽然(3)的 目标函数比原问题(1)简单,但却含有非凸互补约束 e − θ , x = 0 ,这将比非凸目标函数更难处理。为解 决这个非凸约束,考虑问题(3)的罚问题:
Operations Research and Fuzziology 运筹与模糊学, 2019, 9(1), 65-71 Published Online February 2019 in Hans. http://www.hanspub.org/journal/orf https://doi.org/10.12677/orf.2019.91008
ˆ ,并证明 x ˆ 本文将从问题(1)的等价 MPEC 问题和这个 MPEC 问题的全局精确罚问题中得到解估计 x
可以通过求解一个精确罚问题得到。令 Φ 代表闭适当凸函数 ϕ : R → ( −∞ , +∞ ] 且 [ 0,1] ⊆ int ( domφ ) 的函数
arg min φ ( t ) , φ t ∗ = 0 且这样的 t ∗ 是唯一的。 = 族,其中 φ 满足下面的条件: φ (1) = 1 , 1 > t ∗:
2
T T T m×n = A: 其中 ν > 0 是正则项系数, ψ : R m → ( −∞, +∞ ] 为连续可微强凸函数, a1 , a2 , , am ∈ R 为设计矩 阵, c 为已知向量, µ > 0 为任意小的常数, x ∈ R n 为系数向量, x 0 为向量 x 中非零元个数。该模型将
Leabharlann Baidu
GEP-MSCRA for a Kind of Zero-Norm Regularized Composite Optimization Problem
Peiwen Lv
South China University of Technology, Guangzhou Guangdong Received: Jan. 14 , 2019; accepted: Jan. 26 , 2019; published: Feb. 2 , 2019
的,记其 Lipschitz 常数为 L f [3]。由于零模函数的不连续性和非凸性质,(1)这种问题通常是 NP 难的, 难以求得其全局最优解。一个常用的处理方法是使用凸松弛技术,这种方法通过解一个或一系列在数值 上易于处理的凸优化问题来产生一个理想的局部最优解或至少一个可行解。
2.2. 零模问题的等价 Lipschitz 替代
min n
i =1
n
n
(5)
R n × [ 0, e ] 上也是 Lipschitzian 连续的。对任意 φ ∈ Φ ,定义相应的函数 φ= : R → ( −∞, +∞ ] :若 t ∈ [ 0,1] ,
由于 [ 0,1] ⊆ int ( domϕ ) ,函数 ∑ i=1φ (θi ) 在 [ 0, e ] 上是 Lipschitzian 连续的,所以问题(5)在其可行集
ϕ ( t ) = φ ( t ) ;若 t ∉ [ 0,1] , ϕ ( t ) = +∞ 。问题(5)可以重新写为更简便的形式:
{vf ( x ) + ρ x∈R ,θ ∈R
min n
n
x 1 +∑ 。 φ (θi ) − ρθi xi
i =1
n
}
由共轭函数的定义和以上讨论,可以得到:
相关文档
最新文档