基于非经典感受野多尺度机制的图像分析方法
基于多感受野与多尺度融合的草莓病害分割算法

櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄[14]HeKM,ZhangXY,RenSQ,etal.Deepresiduallearningforimagerecognition[C]//2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR).LasVegas,NV,USA.IEEE,2016:770-778.[15]彭 宁.基于改进的FasterR-CNN的车牌识别技术研究[D].哈尔滨:哈尔滨理工大学,2021.[16]周 婕,马明栋.基于改进的ResNet网络的人脸表情识别[J].计算机技术与发展,2022,32(1):25-29.[17]PanSJ,YangQ.Asurveyontransferlearning[J].IEEETransactionsonKnowledgeandDataEngineering,2010,22(10):1345-1359.[18]王艳玲,张宏立,刘庆飞,等.基于迁移学习的番茄叶片病害图像分类[J].中国农业大学学报,2019,24(6):124-130.[19]孙 俊,朱伟栋,罗元秋,等.基于改进MobileNet-v2的田间农作物叶片病害识别[J].农业工程学报,2021,37(22):161-169. [20]刘 冰.面向小样本的特定标识检测[D].天津:中国民航大学,2019.[21]邵仁荣,刘宇昂,张 伟,等.深度学习中知识蒸馏研究综述[J].计算机学报,2022,45(8):1638-1673.[22]HintonG,VinyalsO,DeanJ.Distillingtheknowledgeinaneuralnetwork[EB/OL].2015:arXiv:1503.02531.https://arxiv.org/abs/1503.02531.pdf.[23]FrankleJ,CarbinM.TheLotteryTicketHypothesis:FindingSparse,TrainableNeuralNetworks[DB/OL].USA:CornellUniversity,2018.[2023-07-24].arXiv:1803.03635.亢 洁,刘 佳,刘文波,等.基于多感受野与多尺度融合的草莓病害分割算法[J].江苏农业科学,2024,52(4):206-215.doi:10.15889/j.issn.1002-1302.2024.04.031基于多感受野与多尺度融合的草莓病害分割算法亢 洁,刘 佳,刘文波,夏 宇,李亦轩,王佳乐(陕西科技大学电气与控制工程学院,陕西西安710021) 摘要:针对草莓病害在区域分割时存在背景复杂、目标较小导致难以被有效分割等问题,提出一种基于多感受野与多尺度融合的草莓病害分割算法。
Dil-UNet++:基于UNet++的多尺度融合视网膜血管分割网络模型

Dil-UNet++:基于UNet++的多尺度融合视网膜血管分割
网络模型
米文辉;李鹤;佘海州
【期刊名称】《计算机科学与应用》
【年(卷),期】2024(14)1
【摘要】视网膜血管的精确分割是眼部疾病临床诊断的关键步骤,针对眼底视网膜血管结构复杂、形态多样、边缘末端细微导致分割难度高的问题,提出了一种基于UNet++新的眼底视网膜血管分割网络模型(Dil-UNet++),该方法在传统的UNet++网络基础上使用多层空洞卷积模块来实现特征提取,使网络获得大小可变的特征提取感受野,获得了更好的特征提取性能;同时在网络跳跃连接部分增加注意力机制模块提高了分割目标相关的通道权重和空间权重;并使用卷积模块代替最大池化模块实现下采样,来避免特征传递时血管细节特征丢失。
在分割DRIVE视网膜血管图像数据集上的训练与验证结果表明,该模型在Dice系数、准确度和精确度分别达到87.65%、96.99%和92.82%,证明了该网络模型的有效性,从而为眼底视网膜血管图像分割提供了新的方法。
【总页数】14页(P54-67)
【作者】米文辉;李鹤;佘海州
【作者单位】沈阳航空航天大学沈阳;沈阳工学院抚顺
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于不同尺度增强融合的视网膜血管分割算法
2.基于U-Net的多尺度特征增强视网膜血管分割算法
3.MS-UNet++:基于改进UNet++的视网膜血管分割
4.基于多路径输入和多尺度特征融合的视网膜血管分割
5.基于双解码器结构的多尺度注意力特征融合网络的视网膜血管分割
因版权原因,仅展示原文概要,查看原文内容请购买。
基于多尺度分析的图像检索技术研究

基于多尺度分析的图像检索技术研究近年来,随着互联网技术的快速发展和图像处理技术的不断提高,图像检索技术已经成为了热门的研究领域。
在图像检索技术中,基于多尺度分析的图像检索技术是较为常见和有效的一种方法。
本文将从以下几个方面阐述基于多尺度分析的图像检索技术。
一、多尺度分析的概念和原理多尺度分析是指在不同的尺度下对同一对象进行观测和分析,以获取不同粒度的信息。
多尺度分析通过对图像进行尺度变换,从而达到对图像的不同特征进行提取和描述的目的。
这种方法可以有效地解决图像中的平移、旋转和缩放等问题,从而提高图像检索的准确率。
二、基于多尺度分析的图像特征提取基于多尺度分析的图像特征提取是图像检索技术中的关键环节之一。
目前,常用的基于多尺度分析的图像特征提取方法包括尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)、速度不变特征变换(Speeded Up Robust Feature,SURF)和局部二值模式(Local Binary Pattern,LBP)等。
这些方法不仅能有效地提取图像的局部特征,还能对图像的旋转、缩放和光照等问题进行处理,从而提高图像检索的准确率。
三、基于多尺度分析的图像匹配基于多尺度分析的图像匹配是图像检索技术中的另一个关键环节。
在图像匹配过程中,常用的方法包括基于SIFT的特征匹配、基于SURF的特征匹配和基于LBP的特征匹配等。
这些方法通过对提取的图像特征进行匹配,从而实现对图像的匹配。
同时,基于多尺度分析的图像匹配也可以通过RANSAC(Random Sample Consensus)算法对匹配结果进行筛选,从而提高匹配的准确率。
四、基于多尺度分析的图像检索系统设计基于多尺度分析的图像检索系统的设计主要包括图像预处理、特征提取、特征匹配和检索评价等部分。
其中,图像预处理主要是对原始图像进行降噪、滤波和缩放等处理,以便于后续的特征提取和匹配。
基于权重池的多尺度图像质量评估方法

2021573随着数字成像和通信技术的迅速普及,图像质量评估(IQA)已成为许多应用程序中的重要问题,例如图像获取、传输、压缩、恢复和增强,且在通信、处理和显示系统的评估、控制、设计和优化中具有广泛的应用。
由于主观IQA方法无法在许多情况下(例如实时和自动化系统)简便,常规地使用,因此有必要设计客观IQA算法以自动、有效地测量图像质量。
同时,客观的预计评估结果应在统计上与人类观察者保持一致。
“一致”是指算法的质量评估应与人类的判断密切相关,无论图像的失真类型,图像的内容或失真的强度如何。
随着计算机技术基于权重池的多尺度图像质量评估方法朱惠娟,宗平,丛玉华南京理工大学紫金学院计算机学院,南京210046摘要:图像质量评估往往以人类的主观评估为最终衡量标准,然而人工评估耗时繁琐,又无法应用在对图像或者视频序列进行实时质量评估的系统中,因此一种旨在模仿人类主观性的预测图像质量算法具有重要的价值。
针对上述问题,设计了一种用于局部图像质量评估的卷积神经网络,通过将特征学习和回归都集成到一个优化过程中,从而形成一种更有效的图像质量评估模型。
根据人类的视觉习惯,利用眼动仪的视点分布图生成基于视觉重要性的权重池,利用高斯比例混合模型构造基于图像信息内容的权重池,实验证明权重池的设计可以获得最佳的整体性能。
对原始图像进行低通滤波和下采样,下采样过程中采用权重系数衰退策略,利用多尺度的图像进行加权质量综合评估,实验结果证明多尺度评估方式有效地改进了评估模型。
提出的方法在LIVE等数据库上可以达到优秀的性能,且具有不错的泛化能力。
关键词:图像质量评估;权重池;感受野;多尺度评估文献标志码:A中图分类号:TP183doi:10.3778/j.issn.1002-8331.2008-0365Multi-scale Image Quality Assessment Method Based on Weight PoolZHU Huijuan,ZONG Ping,CONG YuhuaCollege of Computer Science,Nanjing University of Science and Techonlogy Zijin College,Nanjing210046,ChinaAbstract:Image quality assessment often takes human subjective evaluation as the final measurement standard.However, manual assessment is time-consuming and cumbersome,and it cannot be applied to real-time images or video sequences. In the quality assessment system,therefore,a predictive image quality algorithm that aims to imitate human subjectivity has important value.In response to the above problems,this paper designs a convolutional neural network for local image quality assessment,which forms a more effective image quality assessment model by integrating feature learning and regression into an optimization process.According to human visual habits,this paper uses the eye tracker’s viewpoint distribution map to generate a weight pool based on visual importance.Experiments show that the design of the weight pool can achieve the best overall performance.The original image is low-pass filtered and down-sampled.The weight coefficient decay strategy is used in the down-sampling process,and the multi-scale image is used for weighted quality comprehensive assessment.The results prove that the multi-scale assessment method effectively improves the assessment model.The method in this paper can achieve excellent performance on the LIVE database and has good generalization ability.Key words:image quality assessment;weight pool;receptive field;multi-scale assessment基金项目:江苏省高校自然科学研究面上项目(18KJB520023);国家自然科学基金(61170035,61272420,81674099,61502233);南京理工大学紫金学院2019年度一般科研项目(2019ZRKX0401005,2019ZRKX0401006)。
基于非经典感受野动态特性的轮廓检测模型

1 基于感受野动态特性的轮廓本文提出的基于非经典感受野动态特性轮廓检
测模型总体框架如图 1 所示 .
FR ( x, y ) = h ( Ê ( x, y, λ, σ ( x, y ) ) - α ⋅ sup ( x, y ) ),(1)
摘 要:轮廓检测是计算机视觉的重要任务之一,并广泛地用于医学,工程,交通等领域 . 针对这些领域的检测需
求,本文受非经典感受野动态特性的启发提出一种仿生型轮廓检测模型:在模拟初级视皮层 (V1 区) 神经元的经
典感受野响应时,用改进的神经元激活函数 sigmoid 提取局部尺度信息,然后用局部最优尺度代替现有模型中的全
然而上述轮廓检测模型在模拟感受野的响应计算中设定了全局尺度 (定值),即每个像素点对应的尺度
收稿日期:2018-01-04 基金项目:广西自然科学基金项目 (2015GXNSFAA139293);广西教育厅科研项目 (YB2014207);广西高校中青年教师基础能力提升项目
(2017KY0358);广西科技大学科学基金 (校科自 20161307);广西科技大学研究生教育创新计划项目 (GKYC201706) 资助 . *通信作者:林川,教授,硕士生导师,研究方向:模式识别与图像处理,E-mail:gxustlc@.
局感受野尺度,并将提取的局部最优尺度信息对非经典感受野抑制进行调制 . 基于 RuG40 和伯克利图像数据库的实
验结果表明,本文的轮廓检测模型较同类模型获得了较高的性能评测指数,有效地提高了轮廓检测的性能 .
关键词:轮廓检测;非经典感受野;动态特性;局部最优尺度
中图分类号:TP317.4
DOI:10.16375/45-1395/t.2018.02.012
78
基于多尺度残差和注意力机制的图像去雾算法

基于多尺度残差和注意力机制的图像去雾算法
陈辉;牛丽丽;付辉;张天佑;席磊
【期刊名称】《兰州理工大学学报》
【年(卷),期】2024(50)2
【摘要】雾的存在严重降低了图像的质量,阻碍了后续对图像的进一步处理.针对已有去雾算法特征提取不充分等问题,提出了一种端到端的基于多尺度空洞残差块和多尺度注意力机制的图像去雾算法.首先,通过三个小尺度的卷积核进行卷积运算提取雾图的浅层特征,可以在得到较大感受野的同时降低参数量.然后,将其输入多个由多尺度残差空洞卷积特征提取模块和多尺度注意力机制模块串联组成的网络模块,多尺度空洞卷积残差特征提取模块可以提取不同感受野的雾图特征并进行不同维度的特征融合,有效解决特征尺度单一问题;多尺度注意力机制模块可合理分配不同特征的权重,并抑制无关的冗余信息.最后,把雾图中的雾特征筛减便得到去雾图的特征图,再通过卷积操作恢复出无雾图像.通过在SOTS测试集上测试,得到了比其他几种经典方法更好的视觉效果,且在PSNR和SSIM上的表现也优于其他几种经典方法.【总页数】8页(P69-76)
【作者】陈辉;牛丽丽;付辉;张天佑;席磊
【作者单位】兰州理工大学电气工程与信息工程学院;甘肃省科学院自动化研究所【正文语种】中文
【中图分类】TP273
【相关文献】
1.基于残差密集块与注意力机制的图像去雾网络
2.结合多尺度融合特征和残差注意力机制的联合三维人脸重建及密集对齐算法
3.基于残差注意力机制的图像去雾算法
4.基于多尺度注意力残差网络的图像阴影去除算法
5.基于多尺度特征融合和残差混合注意力的点云配准算法
因版权原因,仅展示原文概要,查看原文内容请购买。
基于多尺度感受野网络和注意力机制的场景识别方法研究

基于多尺度感受野网络和注意力机制的场景识别方法研究张能欢1,王永滨2(1.中国传媒大学协同创新中心,北京100024;2.中国传媒大学计算机与网络空间安全学院,北京100024)摘要:场景识别在人机交互、内容检索、智能场景拍照等领域有着越来越强的应用需求。
以往的识别方法大多采用多特征融合,比如对象特征、全局布局特征和上下文特征,来得到特征的多样性和互补性,但我们认为由于场景图像的拍摄距离、拍摄视角更具有多样性,导致场景识别相对于其他图像识别任务来说,对感受野的自适应性需求更强。
传统的卷积神经网络每一层都是一个固定的感受野,导致感受野的变化不够灵活。
在本文中,我们提出了一个多尺度感受野网络来改进网络的感受野,并加入了注意力机制来进一步提取更具有语义区分度的场景特征。
最后,我们在三个标准的场景识别数据集上进行了充足的实验,结果表明我们提出的方法是有效的且具有良好的性能。
关键词:场景识别;感受野;多尺度;注意力机制中图分类号:TP309文献标识码:A文章编号:1673-4793(2020)05-0009-07DOI:10.16196/ki.issn.1673-4793.2020.05.002Scene recognition via multi-scale receptive fieldnetwork with attention mechanismZHANG Neng-huan,WANG Yong-bin(1.Collaborative Innovation Center,Communication University of China,Beijing100024,China;2.School of Computer Science,Communication University of China,Beijing100024,China)Abstract:Scene recognition is ever more important in many computer vision applications such as human -computer interaction,content retrieval,and intelligent scene matching photography.Previous works mostly employ multi-feature fusion,such as object features,global layout information,and context fea-tures,to achieve the diversity and complementary of features.We consider that compared with other image recognition tasks,due to the diversity of shooting distance and shooting view,multi-scale receptive field is more helpful to enhance feature discriminative power for scene recognition.However,the traditional convolutional neural network has a fixed receptive field of each layer,the change of receptive field is not flexible enough.In this paper,we propose a Multi-ScaleReceptive Field Network to effectively improve the receptive field in the network,and employ the attention mechanism to capture the discriminative re-gions and semantic features for scene recognition.Extensive experimental evaluation on three standard benchmarks demonstrates the efficacy of our approach compared to other state-of-the-art methods.Key words:scene recognition;receptive field;multi-scale;attention mechanism基金项目:国家重点研发计划“融媒体技术支撑及服务模式研究”(2019YFB1406201)作者简介:张能欢(1990-),女(汉族),安徽六安人,中国传媒大学博士研究生.E-mail:nhzhang@cuc.edu.cn1引言给我们一张图像,场景识别能预测出该图像内容的场景所在地,比如是办公室、操场还是书店。
一种基于图像切线方向感受野的轮廓检测方法

一种基于图像切线方向感受野的轮廓检测方法傅瑞罡;王平;高颖慧【期刊名称】《重庆理工大学学报(自然科学版)》【年(卷),期】2014(028)004【摘要】轮廓检测是实现基于形状的目标识别任务的关键,然而由于图像背景中存在大量的无关干扰成分,因此要从自然场景中自动地检测出目标的轮廓是非常困难的.人类可以很容易地从环境中识别物体,这得益于人类的视觉感知机制.根据此机制,建立了基于图像切线方向感受野的轮廓检测方法.本方法用Gabor函数模拟感受野中心神经元的响应,非经典感受野的建模充分考虑了邻域刺激与相对位置、距离、朝向之间的关系.本方法与传统的基于人类视觉感知机制方法的最大不同在于图像点的切线方向选择对应朝向的中心神经元,物理意义明确.实验结果表明:该方法能更有效地抑制纹理边缘并减少轮廓自身的破坏,具有更好的检测准确性和稳定性.【总页数】6页(P83-88)【作者】傅瑞罡;王平;高颖慧【作者单位】国防科学技术大学电子科学与工程学院ATR重点实验室,长沙410073;国防科学技术大学电子科学与工程学院ATR重点实验室,长沙410073;国防科学技术大学电子科学与工程学院ATR重点实验室,长沙410073【正文语种】中文【中图分类】TP301【相关文献】1.基于图像轮廓的一种角点检测方法 [J], 刘兴杰;万韬阮;朱耀麟;武桐;2.基于视通路多感受野朝向性关联的轮廓检测方法 [J], 李康群;范影乐;甘海涛;武薇3.一种基于图像切线方向感受野的轮廓检测方法 [J], 傅瑞罡;王平;高颖慧;4.一种基于颜色拮抗感受野的轮廓检测模型 [J], 吴璟莉;刘袁静5.基于图像轮廓的一种角点检测方法 [J], 刘兴杰;万韬阮;朱耀麟;武桐因版权原因,仅展示原文概要,查看原文内容请购买。
基于RFB和超网络的跨尺度多层次真实失真图像质量评价方法

现代电子技术Modern Electronics Technique2024年5月1日第47卷第9期May 2024Vol. 47 No. 90 引 言随着数字图像在各个领域的广泛应用,图像质量评价成为计算机视觉和图像处理领域中备受关注的重要问题之一。
图像质量评价不仅在图像采集、传输和存储等环节中具有重要意义,而且在计算机视觉任务中起到了至关重要的作用,如图像增强、目标检测和识别等。
传统的图像质量评价方法主要基于均方差和结构相似性指数等,这些方法在特点场景下能够提供较好的性能,但在处理复杂场景和多样性图像时表现欠佳。
尤其在人类感知与计算机视觉之间存在较大差异的情况下,传统方法的不足逐渐显露出来。
近年来,随着深度学习技术的迅猛发展,基于深度学习的图像质量评价算法取得了显著的成就。
然而,现基于RFB 和超网络的跨尺度多层次真实失真图像质量评价方法周怀博1,2, 贾惠珍1,2, 王同罕1,2(1.东华理工大学 信息工程学院, 江西 南昌 330013;2.东华理工大学 江西省放射性地学大数据技术工程实验室, 江西 南昌 330013)摘 要: 为了能在真实失真图像质量领域实现高效的跨尺度学习,提出一种双分支特征提取方法。
首先,利用对比学习方法自监督地提取跨尺度、跨颜色空间的图像内容感知特征;随后,采用基于扩张感受野和超网络的策略,将多层次特征信息与跨尺度信息进行循环交互融合,以获取更贴近人类感知的图像质量特征。
基于公开真实失真数据库的实验结果表明,所提算法在真实失真图像质量评价上取得了优越性能,而且,通过两个尺度的实验结果展示了该算法实现了更高效的跨尺度学习,从而为图像多尺度深度网络的应用提供了较好基础。
关键词: 图像质量评价; 无参考; 真实失真; 跨尺度学习; 多特征融合; 双分支特征提取中图分类号: TN911.73⁃34; TP391 文献标识码: A 文章编号: 1004⁃373X (2024)09⁃0047⁃06Multi⁃scale and multi⁃level authentic distorted image quality assessmentbased on RFB and hyper networksZHOU Huaibo 1, 2, JIA Huizhen 1, 2, WANG Tonghan 1, 2(1. School of Information Engineering, East China University of Technology, Nanchang 330013, China;2. Jiangxi Engineering Laboratory on Radioactive Geoscience and Big Data Technology, East China University of Technology, Nanchang 330013, China)Abstract : An innovative dual⁃branch feature extraction method is proposed to achieve efficient cross⁃scale learning in the domain of authentic distorted image quality assessment. The method undergoes a two⁃phase training process. In the first phase, cross⁃scale and cross⁃color⁃space image content perception feature is extracted by a self⁃supervised contrast learning approach. In the second phase, a strategy based on dilated receptive fields and hypernetworks is employed to establish a cyclic feature fusion, which circularly interacts and integrates multi ⁃level feature information with cross ⁃scale information to obtain image quality features closer to human perception. On the basis of the validation on the publicly available authentic distorted image databases, the experimental results demonstrate that the proposed algorithm has achieved superior performance in the quality assessment of authentic distorted images. The experimental results show that the proposed algorithm can realize more efficient cross ⁃scalelearning, which provides a good foundation for the application of multi⁃scale deep network of image processing.Keywords : image quality assessment; no⁃reference; authentic distortion; cross⁃scale learning; multi⁃feature fusion; doublebranch feature extractionDOI :10.16652/j.issn.1004⁃373x.2024.09.009引用格式:周怀博,贾惠珍,王同罕.基于RFB 和超网络的跨尺度多层次真实失真图像质量评价方法[J].现代电子技术,2024,47(9):47⁃52.收稿日期:2024⁃01⁃07 修回日期:2024⁃01⁃26基金项目:国家自然科学基金项目(62266001);国家自然科学基金项目(62261001)47现代电子技术2024年第47卷在的深度学习方法中基于卷积神经网络(Convolutional Neutral Network, CNN )的图像质量评价算法[1]对于全局信息的获取有一定的局限性。
基于多尺度Transformer的多视图三维形状分析方法

基于多尺度Transformer的多视图三维形状分析方法卫鑫;孙剑【期刊名称】《工程数学学报》【年(卷),期】2024(41)1【摘要】基于多视图的三维形状分析方法是三维计算机视觉领域中的重要研究分支,通过整合三维形状在多个视角下的二维图像的特征来完成三维形状的识别、检索等任务。
然而,如何有效地探索不同视角之间的关联性,并运用这些关联性来聚合多视图图像的特征仍然是三维形状分析中一个亟待解决的核心问题。
受到最近兴起的Transformer网络在关系建模问题上成功应用的启发,研究工作引入了一种创新的多尺度Transformer架构,提出了基于多尺度Transformer的多视图三维形状分析方法(Multi-View Multi-Scale Transformer,MVMST)。
此方法能够有效地学习不同视角之间的关联性,将多视图图像的特征聚合为一个具有强大表达能力的整体描述符。
与以往方法使用感受野为全局的Transformer建模多视图特征的关系不同,该方法受到多尺度学习方法的启发,使用多尺度的Transformer来建模不同尺度下的多视图图像特征之间的关系,并设计了一个多尺度融合模块将多个尺度下经过Transformer处理的特征进行融合,得到一个相比单一尺度更加有效的多尺度表示。
多个视图的多尺度表示最终经过视角池化模块融合成三维形状的一个整体描述符。
研究了在多个合成和真实扫描三维形状分类数据集上进行了实验,结果表明所提出的方法在三维形状分类任务上表现出令人满意的性能。
【总页数】11页(P164-174)【作者】卫鑫;孙剑【作者单位】西安交通大学数学与统计学院【正文语种】中文【中图分类】TP183【相关文献】1.基于多视图网络三维形状检索的通用扰动攻击2.基于一维方法和三维方法的模型尺度及实船尺度船舶阻力预报3.基于Transformer的多视图三维重建4.基于动态编解码的多视图三维重建方法5.基于CNN和TransFormer多尺度学习行人重识别方法因版权原因,仅展示原文概要,查看原文内容请购买。
深度学习模型中的多尺度特征抽取方法研究

深度学习模型中的多尺度特征抽取方法研究深度学习模型在计算机视觉领域取得了巨大的成功,其中多尺度特征抽取方法的研究对于提高图像识别、目标检测和语义分割等任务的性能至关重要。
在本文中,我们将探讨深度学习模型中的多尺度特征抽取方法,并介绍一些常用的技术和算法。
深度学习模型中的多尺度特征抽取方法旨在通过在不同尺度上提取图像的特征,从而更好地捕捉图像中的细节和上下文信息。
这种方法可以帮助模型更好地理解图像,并提高模型在复杂场景下的鲁棒性。
一种常用的多尺度特征抽取方法是金字塔结构。
金字塔结构通过在不同尺度上对图像进行多次下采样或上采样,从而得到一系列尺度不同的图像。
然后,对每个尺度的图像进行特征提取,并将这些特征进行融合,以得到最终的特征表示。
金字塔结构可以有效地捕捉图像中不同尺度的信息,但其计算量较大,且容易引入冗余信息。
为了解决金字塔结构的问题,研究者提出了一种称为金字塔池化的方法。
金字塔池化方法通过在不同尺度上进行池化操作,从而得到一系列尺度不同的特征图。
这些特征图可以用于后续的分类或检测任务。
金字塔池化方法能够有效地减少计算量,并保持较好的特征表达能力。
除了金字塔结构和金字塔池化方法,还有一些其他的多尺度特征抽取方法被广泛应用于深度学习模型中。
例如,空洞卷积是一种通过在卷积操作中引入空洞采样来扩大感受野的方法。
这种方法可以在不增加参数和计算量的情况下,有效地提取多尺度的特征。
此外,注意力机制也被广泛用于深度学习模型中的多尺度特征抽取。
注意力机制可以根据图像的内容和上下文信息,自适应地调整特征图的权重。
通过引入注意力机制,模型可以更加关注重要的特征,并抑制无关的背景信息,从而提高模型的性能。
总结起来,深度学习模型中的多尺度特征抽取方法是提高图像识别、目标检测和语义分割等任务性能的关键因素。
金字塔结构、金字塔池化、空洞卷积和注意力机制等方法都可以有效地提取多尺度的特征。
未来,我们可以进一步研究和改进这些方法,以进一步提高深度学习模型在计算机视觉领域的应用性能。
基于多尺度的混合注意力机制图像超分辨率重建

基于多尺度的混合注意力机制图像超分辨率重建作者:黄慧玲来源:《消费电子》2023年第10期【关键词】多尺度;注意力机制图像;超分辨率重建超分辨率重建是计算机视觉和图像处理领域一个经典的问题,旨在从低分辨率的图像中重建出具有清晰的纹理、边缘和高质量视觉感官的高分辨率图像。
在计算机视觉领域中被认为是一个经典的病态逆问题[1]。
高分辨的图片经过模糊、扭曲和下采样等多种操作后,可得到一张低分辨率图像。
然而从低分辨率图像重建到高分辨率这个过程中,存在无限多种高分辨率图像对应,是不可逆的。
目前基于深度学习超分辨重建方法研究热度最高,这类算法利用机器学习方法从大量训练数据中学习低分辨率和高分辨率图像之间的映射关系,通常能够更好地恢复图像细节,缺点是需要大量的训练数据和计算资源。
深度学习本质上是利用大量训练数据和强大的模型学习能力,能够更好地重建图像细节,获得更高质量的超分辨率结果。
本文主要讨论的是基于深度学习的超分辨率重建,针对如何在提取更加丰富的特征时,关注提取特征与重建特征的相关性这一问题,提出了多尺度的混合注意力机制超分辨重建网络,主要贡献如下:(1)多尺度提取特征:一个大的感受野可提供更多的上下文细节,并通过结合本地和全局信息帮助重建出更好的性能。
因此,将局部信息和全局信息结合起来,在不同尺度上为图像提供上下文信息,设计了一个多分支网络。
(2)混合注意力机制:由通道注意力和空间注意力相结合,并融合到多分支模型中,实现在提取更加丰富特征情况下,关注提取特征与重建特征的相关性,从而提高重建质量。
整个网络的结构如图1所示,分为特征提取、全局残差学习和上采样模块。
特征提取的作用是提取超分辨重建需要的低中高分辨率信息,丰富的特征信息利于图像重建。
设计网络结构的关键是采用多尺度融合注意力模块级联的方式,其中多尺度是指运用了两条信息流获取上下文的信息,混合注意力是指从通道和空间两个角度来优化选择的特征,使获取的特征更利于超分辨率重建。
基于优化感受野策略的图像修复方法

基于优化感受野策略的图像修复方法刘恩泽;刘华明;王秀友;毕学慧【期刊名称】《计算机应用研究》【年(卷),期】2024(41)6【摘要】当前流行的基于深度神经网络的图像修复方法,通常使用大感受野的特征提取器,在修复局部图案和纹理时,会产生伪影或扭曲的纹理,从而无法恢复图像的整体语义和视觉结构。
为了解决这个问题,提出了一种基于优化感受野策略的图像修复方法(optimized receptive field,ORFNet),将粗糙修复与精细修复相结合。
首先,使用具有大感受野的生成对抗网络获得初始的粗略修复结果;然后,使用具有小感受野的模型来细化局部纹理细节;最后,使用基于注意力机制的编码器-解码器网络进行全局精炼修复。
在CelebA、Paris StreetView和Places2数据集上进行验证,结果表明,ORFNet与现有具有代表性的修复方法进行对比,PSNR和SSIM分别平均提升1.98 dB和2.49%,LPIPS平均下降2.4%。
实验证明,所提图像修复方法在不同感受野的引导下,在修复指标上表现更好,在视觉上也更加真实自然,验证了该修复方法的有效性。
【总页数】8页(P1893-1900)【作者】刘恩泽;刘华明;王秀友;毕学慧【作者单位】阜阳师范大学计算机与信息工程学院【正文语种】中文【中图分类】TP391.41【相关文献】1.一种基于图像切线方向感受野的轮廓检测方法2.一种基于图像切线方向感受野的轮廓检测方法3.基于非经典感受野多尺度机制的图像分析方法4.基于局部感受野扩张D-MobileNet模型的图像分类方法5.基于多重感受野UNet的仪表图像分割方法因版权原因,仅展示原文概要,查看原文内容请购买。
基于多尺度理论的图像分割方法研究共3篇

基于多尺度理论的图像分割方法研究共3篇基于多尺度理论的图像分割方法研究1随着计算机技术的不断发展,图像处理技术成为其中颇具发展潜力的一个重要领域。
而在图像处理中,图像分割是一项十分关键的技术。
它是将一张包含多种物体或者景象的图像,分离成若干个区域,以便进行下一步的处理或者分析。
由于图像分割对于图像处理和分析的功能具有重要的作用,它已经成为了计算机视觉和图像分析领域中的一个重点研究方向。
在图像分割的研究和实践中,很多学者和研究者曾提出了很多方法,如基于灰度阈值的图像分割方法、基于能量优化的图像分割方法等。
但这些方法都存在很多局限性,而基于多尺度理论的图像分割方法研究,具有较高的精度和稳定性,受到了广泛关注。
多尺度理论是指在不同的尺度下,对于物体或者场景的描述是不同的。
在图像分割中,多尺度理论指的是通过多个不同的尺度对图像进行处理和分析。
这种方法不仅能够有效地避免一些局部细节信息对于图像分割的影响,还能够更加准确地描述和处理图像中不同尺寸的物体和景象。
基于多尺度理论的图像分割方法,可以分为多尺度分割和分层分割两种。
多尺度分割方法是指在不同尺度下,对图像进行分割,将分割结果进行融合以获得最终的结果。
而分层分割方法则是将图像分层处理,进行分层分割,将分割结果通过层与层之间的关系进行融合。
在多尺度分割中,常用的方法有小波变换、分形分析、基于区域的相关性分析等。
其中最为流行的方法是小波变换。
通过小波变换,可以将图像的不同尺度信息分离开来,然后利用不同尺度下的小波系数进行分割。
同时,在分层分割中,常用的方法有分层聚类分割、分层生成模型分割等。
其中分层聚类分割是一种经典的分层分割算法,它通过不断剖分图像,将图像分为多层,在每一层上进行聚类分割。
不过,基于多尺度理论的图像分割方法也存在着一些不足。
多尺度分割无法很好地处理边缘信息,且容易产生过渡伪像。
而分层聚类分割受到对比度和噪声等因素的影响,对于复杂图像的处理效果不佳。
基于多尺度特征融合的医学图像分割

基于多尺度特征融合的医学图像分割基于多尺度特征融合的医学图像分割医学图像分割是医学图像处理中的关键任务之一,它在疾病诊断、治疗规划等方面起着重要作用。
然而,由于医学图像普遍具有低对比度、噪声干扰等特点,使得图像分割任务变得异常复杂。
为了提高医学图像分割的准确性和鲁棒性,近年来研究者们开始关注特征融合的方法,并在此基础上提出了基于多尺度特征融合的医学图像分割算法。
多尺度特征融合是指将不同尺度的图像特征进行融合,以获取更全面、更准确的特征信息。
在医学图像分割中,不同尺度的特征对应着不同层次的结构信息。
例如,在CT影像中,低尺度特征可以提取到组织内的微小结构,而高尺度特征则可以提取到组织的整体形态信息。
因此,将不同尺度的特征进行合理地融合,可以使得医学图像分割算法能够更好地捕捉到图像中各种尺度的结构信息,从而提高分割的准确性。
其中一个常用的多尺度特征融合方法是金字塔结构。
金字塔结构是一种多层次、多尺度的图像表示方法,它通过分解图像为一组具有不同尺度的子图像,从而构建了一个层次结构。
在基于金字塔的特征融合方法中,研究者通常先通过不同大小的高斯滤波器对原始图像进行多次模糊操作,得到一组具有不同尺度的模糊图像。
然后,再对这些模糊图像进行下采样,得到一组具有不同尺度的子图像。
最后,将这些子图像与原始图像进行融合,得到一组融合后的多尺度特征。
除了金字塔结构,研究者们还提出了其他多尺度特征融合方法,如多尺度卷积神经网络(MS-CNN)、多尺度图像分割辅助网络(MISAN)等。
这些方法通过设计不同的网络结构和模块,能够有效地融合不同尺度的特征。
例如,MS-CNN通过引入多尺度卷积核和多尺度感受野,实现了对不同尺度特征的有效提取和融合。
而MISAN则通过引入多尺度的注意力机制,使得网络能够自动学习到不同尺度特征的重要性,并将其有效地融合。
基于多尺度特征融合的医学图像分割算法在实验中取得了较好的效果。
通过融合不同尺度的特征,这些算法能够更准确地提取出图像中的各种结构信息,并将其应用于医学图像分割任务中。
基于有效感受野的单阶段多尺度特定目标的实时检测方法[发明专利]
![基于有效感受野的单阶段多尺度特定目标的实时检测方法[发明专利]](https://img.taocdn.com/s3/m/bba802fac281e53a5902ffe4.png)
专利名称:基于有效感受野的单阶段多尺度特定目标的实时检测方法
专利类型:发明专利
发明人:毋立芳,徐得中,赵青,简萌,王东
申请号:CN201811648244.5
申请日:20181230
公开号:CN109741318A
公开日:
20190510
专利内容由知识产权出版社提供
摘要:本发明提供了基于有效感受野的单阶段多尺度特定目标的实时检测方法。
该方法首先是从SSD的多尺度架构中提取出相应的特征层,并根据感受野覆盖的像素范围来选择尺度;其次,我们移除了传统方法中的anchor结构,采用更少的特征层,利用天然感受野的特性直接对特征图的对应的感受野框进行分类和回归。
最后采用RF(感受野)采样框置灰学习策略,避免学习冗杂多余参数。
本方法大大降低了传统基于anchor采样框的算法复杂度,提高了检测的效率并能够达到实时的效果,在数据量非常大的应用背景下非常具有使用价值。
申请人:北京工业大学
地址:100124 北京市朝阳区平乐园100号
国籍:CN
代理机构:北京思海天达知识产权代理有限公司
代理人:刘萍
更多信息请下载全文后查看。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017年第7期文章编号:1〇〇9 -2552 (2017) 07 -0005 -04DOI :10. 13274/j . cnki . hdzj . 2017. 07. 002基于非经典感受野多尺度机制的图像分析方法摘要:神经生理学研究表明,生物视觉系统比机器视觉系统在视觉信息上更加高效,这种信 息处理的高效性归功于人类视觉神经中存在的多层神经网络Q 作为人类视觉系统的初级处理阶 段,神经节细胞非经典感受野的尺寸大小可以根据外界刺激的性质进行自动调节,这种机制利 用在图像处理技术上能够达到多尺度图像分析的目的。
文中提出一个基于非经典感受野的多尺 度图像分析方法,通过非经典感受野的自动调整机制,保留了图像的关键信息,减少了视觉系 统进一步阶段的冗余信息。
并通过与N -cu t 算法的对比和轮廓检测的实验表明这种多尺度规模图 像分析模型能够给后期的图像处理任务带来一定程度的提升。
关键词:多尺度;图像分析;轮廓检测;非经典感受野 中图分类号:TP 391.41 文献标识码:AMulti-scale image analysis based on Non-Classicalreceptive field mechanismXU Yue -ying , LANG Bo , HUANG Jing(School of Information Technology , Beijing Normal University , Zhuhai 519087,Guangdong Province , China )Abstract : In the real world , the biological visual system is more efficient than the machine visual systemin analyzing visual information . Physiology theory shows that this efficiency owes to the multi-layer neural network in human visual system , in which every layer accomplishes different tasks and is related with other layers . The low-level stages of the human visual system , especially the retina , can provide certain scale information for the high-level stages of visual system through using the non-classical receptive field(nCRF ) mechanism . This mechanism that the nCRF size can be adjusted automatically by ganglion cell (GC ) can achieve a multi-scale image analysis . The results , reflecting the distribution of the imageinformation , can be shared by several algorithms or processes solving different visual tasks , such as contour detection and image segmentation . A model of multi-scale image analysis based on GC was proposed in this paper , which retains the key information and reduces the redundancy information for the further stages of the visual system . The experimental results on N-cut algorithm and contour detection show that this multi-scale image analysis model provides distinctive improvement for these image processing tasks .Key words : multi -scale ; image analysis ; contour detection ; nCRF mechanism许跃颖,郎波,黄静(北京师范大学珠海分校信息技术学院,广东珠海519087)引言度、本地性、方向性、各向异性和临界采样等五个属利用图像的多尺度信息对图像进行处理是提取 有效信息的有效方法之一,它被广泛应用于图像降 噪、轮廓检测、图像分割、物体识别和许多其他的任 务[1-2]。
一种优秀的图像分析方法应该具备多尺收稿日期:2016 -06 -15基金项目:国家自然科学基金(61272364)作者简介:许跃颖(1984 -),男,助教,硕士,研究方向为数字图像处理。
通讯作者:郎波。
一5—性,但是目前流行的多尺度算法诸如余弦和小波变 换等很难符合这方面的特点。
而人类视觉系统却能 很好的满足这个需求,这使得我们设计一个基于生 物视觉机制的图像多尺度分析算法成为可能。
在人类视觉系统中存在一个类似于金字塔的一 个分层结构,眼睛获取信息的处理过程是从视网膜 开始。
然后通过外膝体传递视皮层进行处理。
作为 信息感知和处理的第一阶段,视网膜主要获得图像 的光照、颜色和空间信息,然后将其进行进一步传 递。
神经节细胞是视网膜信息处理后最后输出的神 经元。
从上世纪60年代起,有研究发现[3],在神经 节细胞除了中央区的经典感受野部分外,还存在一 片较大区域,这片区域被称为非经典感受野,它能够 对经典感受野里的刺激反应进行一定的调节作用。
作用在非经典感受野上的外部刺激并不能直接导致 细胞进行反应,但能具有易化、抑制或去抑制作用。
非经典感受野的去抑制作用不仅能增强边界对比 度,还能弥补因中心一外周措抗机制引起的低频成 分的损失。
由此发现,非经典感受野在图像局部区 域内的对比度和亮度梯度变化的传递扮演着重要的 角色。
目前已经有一些利用非经典感受野的多尺度分 析和抑制机制的特点来进行图像处理的模型[4—7]。
虽然这些模型在某些方面相对于传统的图像处理方 法有较好的表现,但是仍然存在缺点。
例如,这些模 型只涉及V I区中的皮层细胞的非经典感受野机 制,忽略了作为图像处理初级阶段视网膜的功能。
Grigoresu等人提出了一个基于感受野特征的轮廓检 测模型[4],在实际运行中参数必须通过实验提前设 置。
在这个模型中,仅仅一个参数,例如高斯因子的 标准偏差,就与每一个测试的图像密切相关,并且很 难预设,必须要通过大量的实验才能做到最为接近,这种情况制约了模型在实际场合大规模的应用。
另外在文献[8 -10]中提出的一些多尺度分析模型也 能在某些方面带来一定程度的提高,但是对于尺度 的预估计需要大量关于图像的先验知识,这在实际 操作中是比较困难的。
为了克服参数选择的困难,本文提出了一个基 于皮层细胞和视网膜细胞的非经典感受野多尺度分 析模型,它能够将尺度信息传递给高层视觉系统。
这个模型能够解决以上涉及到的问题。
为了测试模 型的稳定性,本文设计了两个实验:①用本文的模型 得到的图像和原始图像进行N-cu t进行比较[11],结 果表明该模型可以使得N-c u t的图像分割稳定性和 准确性得要一定程度的提升。
②利用本模型和文献[4]里提到的轮廓检测模型进行对比。
1算法设计图1描述了视网膜神经节细胞感受野(包括非 经典感受野)的结构,包含了中心区、外周区和大外 周区,其中大外周区(非经典感受野)的区域比经典 感受野的半径要大很多。
感受野包含了两个部分一一经典感受野(中心区和外周区)、非经典感受野(大外周区)图1神经节细胞的感受野的结构1.1神经节细胞的响应根据神经生物学的研究成果,神经节细胞对落在 感受野范围内的刺激响应可以通过一个三高斯函数 来很好地描述。
计算的计算表达式如式(1)所示:GC(x,y)= (/(x,y) * WC R F)(x,y)+ log2(1 +,“,y)(1)其中,GC(^,y)代表神经节细胞;/(%,y)表示外界 图像刺激;W c r f和W…CRF分别经典感受野和非经典 感受野的是加权函数,具体定义如式(2)所示:W CR(x-x〇)2+(y-y〇)2(x-x〇)2+(y-y〇)2 V2n^1^2n a2W.(x-x〇)2+(y-y〇)2(2)(3)^2n a3其中,^,4,4分别是经典感受野中心区,外周区 和非经典感受野大外周区的响应强度。
^,2,。
分 别是经典感受野中心区、外周区和非经典感受野的 半径。
它们可以根据刺激的性质自动的进行调整;%和y〇是感受野的中心坐标。
在实际的计算中,根 据文献[12],各个参数的设置如下:^3 =4a2,^2 =5^1,^41 = 1,A2 =0. 18,A3 =0.05具体计算方法如下:当落在感受野中的刺激是均 匀的,感受野的尺寸会不断扩大;反之,感受野尺寸会 剧烈缩小。
由于非经典感受野是由很多亚区组成,每 个亚区都属于一个感应刺激的单元。
每个亚区感应 的刺激都被计算在内。
通过计算来判断感应到的刺 激的性质,从而决定感受野尺寸的扩大或者缩小。
1.2利用感受野多尺度特性对轮廓检测算法的提升在计算机视觉和图像处理中,边缘和轮廓的检测在物体识别和其他应用中都是非常重要的。
本文 利用非经典感受野的多尺度机制,提出了一个基于 视网膜神经节细胞,视皮层简单细胞和复杂细胞的 模型。
这个模型利用感受野的多尺度机制达到轮廓 检测的目的。
最重要的是,模型解决了选择尺度参 数较为困难的问题。
图2阐述了模型进行轮廓检测 的大致流程。
与以往一些基于非经典感受野的方法 相比,该模型不需要强制指定尺度参数^的值和学 习相关先验知识。
图2基于非经典感受野的多尺度边缘检测模型图2(a)表示原始图像;图2(b)表示通过感受 野分布情况得到的图像,较暗的像素表现了更精细 的尺度,而越明亮的部分表示的是较为粗糙的尺度; 图2(c)表示使用文献[4]提供精细尺度下计算的 轮廓图,相当于最小尺寸的感受野。
图2(d)表示在 中等尺度值下得到的轮廓图。