设计应用

一种基于改进Mask R-CNN模型的遥感图像目标识别方法

作者:余慧明,周志祥,彭 杨,崔志斌
发布日期:2021-03-18
来源:信息技术与网络安全

0 引言

随着人工智能的兴起,深度学习[1]算法各个领域的优势被体现出来。对视频、图像中的多目标、细粒度的目标识别技术,可以方便人们在复杂的情景中快速定位到所需要的检测目标。随着场景的复杂度加深,基于基础模型的各种改进版本层出不穷。

在过去近10年中,目标识别技术又有了飞速的发展,从最开始的机器学习算法,再到目前主流的深度学习目标识别算法,如RCNN[2]、SSP-Net[3]、Fast R-CNN[4]、Faster R-CNN[5],目标识别技术已经在各个领域都有了很好的应用。但是,由于数据集的制约,针对遥感图像的军事目标识别却是一个例外。另外,军事码头物体数量众多,需要检测的目标与其他物体交错相间,大大降低了模型的准确性。对于一些密集型的目标检测,PAN X[6]等人提出了一个由特征选择模块(Feature Selection Module,FSM)和动态优化头(Dynamic Refinement Head,DRH)组成的动态优化网络。FSM使神经元能够根据目标物体的形状和方向调整接受野,而DRH使模型能够以一种对象感知的方式动态地改进预测。何代毅[7]等人就提出了一种基于改进 Mask-RCNN[8]的建筑物自动提取方法,在网络的设计中添加了路径聚合网络和特征增强功能,通过监督和迁移学习的方式在Inria航空影像标签数据集中进行多线程迭代训练与模型优化学习,实现了建筑物的自动精确分割和提取。对于数据集缺乏等问题,林通[9]等人通过迁移姿态生成对抗网络生成姿态不同的行人图片,对数据集进行了扩充。


本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003422




作者信息:

余慧明,周志祥,彭  杨,崔志斌

(武汉兴图新科电子股份有限公司 平台产品部,湖北 武汉430073)


此内容为AET网站原创,未经授权禁止转载。
目标识别 MaskR-CNN 通道注意力 数据增强
Baidu
map