基于深度卷积神经网络的弱监督图像语义分割
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract:Image semantic segmentation is an important visual recognition task and its goal is to estimate
pixel-level object class labels on images.This problem has been recently handled by deep convolutional neural networks(DCNNs).However,learning DCNNs demand a large number of annotated training data
to learn segmentation.A comprehensive overview of weakly super vised approaches f or semantic segmenta一 收稿 日期 :2018-08-03 本刊网址 :http:∥nyzr.njupt.edu.cn 基金项 目:国家 自然科学基金(61876093,618812413048,61671 ̄3,617o1252,61762021)和江苏省 自然科学基金(BK20181393,BK2016090B)资助项 目 通 讯 作 者 :郑 宝 玉 ,男 ,教 授 ,博 士 生 导 师 ,E—mail:zhy@ njupt.edu.an 引 用 本 文 :郑 宝 玉 ,王雨 ,吴 锦雯 ,等.基 于深度 卷 积神经 网络 的弱 监督 图像 语义 分割 [J].南京 邮 电大学 学报 (自然科 学 版 ),2018,38(5):1—12.
V01.38 No.5 Oct.2018
基 于深 度卷 积神 经 网络 的弱 监 督 图像 语 义 分 割
郑 宝玉 一,王 雨 ,吴 锦 雯 ,周 全
,,1.南京邮电大学 通信 与信息工程学 院,江苏 南京 210003 、
I 2.南京邮电大学通信与网络7-程研究中心,江苏 南京 210003 l 3.中国地质大学(武汉)信息工程学院 ,湖北 武汉 430074 /
W eakly supervised learning based on deep convolutional neural networks for im age sem antic segm entation
ZHENG Baoyu ,WANG Yu ,WU Jinwen。,ZHOU Qua.
while segm entation annotations in existing data sets are limited in term s of both quantity a百度文库d diversity due to the heavy annotation cost. W eakly supervised approaches tackle this issue by leveraging weak annota- tions,such as im age·level labels and bounding boxes,which are either readily available in existing large-
摘 要 :图像 语义 分 割是计 算机 视 觉领域 重 要识别 任 务 ,其 目标 是估 计 图像 中的像 素 级 目标 类标 签 。 最近 ,深度 卷 积神 经 网络 (Deep Convolutional Neural Networks,DCNNs)已经 成为解 决 图像 语 义分 割 的主流 方法 。然 而 ,学 习 DCNNs需 要大量 的 已标注 训 练数据 (Ground Truth,GT),而现 有数 据集 中 的 GT在 数量 和 多样 性 方面 因标 注成本 巨大 而受到 诸 多限 制。 弱监 督 方 法则考 虑 利用 图像 级 标 签 和物体 框 之 类的 弱标 注信 息解决 图像 语义 分 割 中的标 注 问题 。 相 比于 全 监督 的像 素级 图像标 注 , 图像 分 类 的 GT(图像 级标 签 )和 目标 检 测 的 GT(物体 框 )更容 易获 得 ,因而可 以直 接借 用 为 弱标 注 信 息训练 分 类模 型。 弱监督 语义 分 割的 主要挑 战在 于 标注 信 息 的 不 完整 性 ,即缺 失 了物体 精 确 的 边界 信 息。 文 中对 基于 DCNNs的弱监督 语 义分 割方 法进行 了全 面 的 阐述 ,描述 了如何克 服这 些 限 制并 讨论 了提 高其 性 能的可 能研 究方 向。 关键词 :语 义分 割 ;深度 卷积 神经 网络 ;弱监督语 义分 割 ;图像标 注 中 图分 类 号 :TN919.8;TP391 文 献标 志码 :A 文 章编 号 :1673-5439(2018)05-0001-12
College of Telecommunications& Information Engineering.Nanjing University of Posts and Telecommunications Nanjing 210003,China Engineering Research Center for Communication and Network,Nanjing University of Posts and Tel Nanjing 210003,China College of Information Engineering,China Univer sity of Geosciences(Wuhan),Wuhan 430074,China
第 38卷 第 5期 2018年 1O 月
南 京 邮 电 大 学 学 报 (自然 科 学 版 )
Journal of Nanjing University of Posts and Telecommunications(Natural Science Edition)
doi:10.14132/j.cnki.1673—5439.2018.05.001
scale data sets for image classification and object detection.The main challenge in weakly supervised se— mantic segmentation is the incomplete annotations,missing accurate object boundary information required
pixel-level object class labels on images.This problem has been recently handled by deep convolutional neural networks(DCNNs).However,learning DCNNs demand a large number of annotated training data
to learn segmentation.A comprehensive overview of weakly super vised approaches f or semantic segmenta一 收稿 日期 :2018-08-03 本刊网址 :http:∥nyzr.njupt.edu.cn 基金项 目:国家 自然科学基金(61876093,618812413048,61671 ̄3,617o1252,61762021)和江苏省 自然科学基金(BK20181393,BK2016090B)资助项 目 通 讯 作 者 :郑 宝 玉 ,男 ,教 授 ,博 士 生 导 师 ,E—mail:zhy@ njupt.edu.an 引 用 本 文 :郑 宝 玉 ,王雨 ,吴 锦雯 ,等.基 于深度 卷 积神经 网络 的弱 监督 图像 语义 分割 [J].南京 邮 电大学 学报 (自然科 学 版 ),2018,38(5):1—12.
V01.38 No.5 Oct.2018
基 于深 度卷 积神 经 网络 的弱 监 督 图像 语 义 分 割
郑 宝玉 一,王 雨 ,吴 锦 雯 ,周 全
,,1.南京邮电大学 通信 与信息工程学 院,江苏 南京 210003 、
I 2.南京邮电大学通信与网络7-程研究中心,江苏 南京 210003 l 3.中国地质大学(武汉)信息工程学院 ,湖北 武汉 430074 /
W eakly supervised learning based on deep convolutional neural networks for im age sem antic segm entation
ZHENG Baoyu ,WANG Yu ,WU Jinwen。,ZHOU Qua.
while segm entation annotations in existing data sets are limited in term s of both quantity a百度文库d diversity due to the heavy annotation cost. W eakly supervised approaches tackle this issue by leveraging weak annota- tions,such as im age·level labels and bounding boxes,which are either readily available in existing large-
摘 要 :图像 语义 分 割是计 算机 视 觉领域 重 要识别 任 务 ,其 目标 是估 计 图像 中的像 素 级 目标 类标 签 。 最近 ,深度 卷 积神 经 网络 (Deep Convolutional Neural Networks,DCNNs)已经 成为解 决 图像 语 义分 割 的主流 方法 。然 而 ,学 习 DCNNs需 要大量 的 已标注 训 练数据 (Ground Truth,GT),而现 有数 据集 中 的 GT在 数量 和 多样 性 方面 因标 注成本 巨大 而受到 诸 多限 制。 弱监 督 方 法则考 虑 利用 图像 级 标 签 和物体 框 之 类的 弱标 注信 息解决 图像 语义 分 割 中的标 注 问题 。 相 比于 全 监督 的像 素级 图像标 注 , 图像 分 类 的 GT(图像 级标 签 )和 目标 检 测 的 GT(物体 框 )更容 易获 得 ,因而可 以直 接借 用 为 弱标 注 信 息训练 分 类模 型。 弱监督 语义 分 割的 主要挑 战在 于 标注 信 息 的 不 完整 性 ,即缺 失 了物体 精 确 的 边界 信 息。 文 中对 基于 DCNNs的弱监督 语 义分 割方 法进行 了全 面 的 阐述 ,描述 了如何克 服这 些 限 制并 讨论 了提 高其 性 能的可 能研 究方 向。 关键词 :语 义分 割 ;深度 卷积 神经 网络 ;弱监督语 义分 割 ;图像标 注 中 图分 类 号 :TN919.8;TP391 文 献标 志码 :A 文 章编 号 :1673-5439(2018)05-0001-12
College of Telecommunications& Information Engineering.Nanjing University of Posts and Telecommunications Nanjing 210003,China Engineering Research Center for Communication and Network,Nanjing University of Posts and Tel Nanjing 210003,China College of Information Engineering,China Univer sity of Geosciences(Wuhan),Wuhan 430074,China
第 38卷 第 5期 2018年 1O 月
南 京 邮 电 大 学 学 报 (自然 科 学 版 )
Journal of Nanjing University of Posts and Telecommunications(Natural Science Edition)
doi:10.14132/j.cnki.1673—5439.2018.05.001
scale data sets for image classification and object detection.The main challenge in weakly supervised se— mantic segmentation is the incomplete annotations,missing accurate object boundary information required