设计应用

基于双注意力和多区域检测的细粒度图像分类

作者:潘新辰,杨小健,秦 岭
发布日期:2022-08-09
来源:2022年电子技术应用第8期

0 引言

    目前,深度学习技术已被广泛应用于图像分类领域,细粒度图像分类旨在区分同种对象的不同类别。相较于传统图像分类,细粒度图像分类的难点在于:(1)不同类别之间的高相似性,难以找到具有辨别性的区域并提取细节特征;(2)同一种类别之间由于图像视角、光照、背景和遮挡等因素的变化也存在着一定的差异性。因此,如何定位具有辨别性的局部区域,以及如何更精确地提取细粒度特征,成为目前细粒度图像分类方法的主要研究方向。

    为了检测具有辨别性的局部区域,一些方法[1-2]通过人工标注的方式对细粒度图像中具有辨别性的区域进行标注,然后通过网络学习定位辨别性局部区域,从而提高网络模型的分类准确性,需要花费大量的时间、人力对图像进行标注,成本太大。还有一些方法[3-4]利用类别标签以弱监督的方式来学习具有辨别性的局部区域,这类方法虽然不能够达到使用人工标注的标签进行监督学习的效果,但额外成本几乎为零。

    注意力机制作为提升网络特征提取能力的重要手段[5]主要分为通道注意力机制和空间注意力机制,通道注意力机制可以学习到不同通道间的权重关系,空间注意力机制可以学习不同像素间的依赖关系。合理利用以上两个注意力机制能够更细粒度提取图像的特征,从而能够更好地进行分类。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000004663




作者信息:

潘新辰,杨小健,秦  岭

(南京工业大学 计算机科学与技术学院,江苏 南京211816)



wd.jpg

此内容为AET网站原创,未经授权禁止转载。
细粒度图像分类 注意力机制 区域检测 卷积神经网络 特征提取
Baidu
map