设计应用

基于DenseNet和深度运动图的行为识别算法

作者:张健,张永辉,何京璇
发布日期:2020-12-15
来源:2020年信息技术与网络安全第1期

0     引言

  近年来,有关人体行为识别的研究层出不穷,现如今已成为计算机视觉研究中日益关注的热点。其中,对视频中目标的行为识别一直以来都是一个非常活跃的研究领域。虽然在对于静止图像识别的研究上取得了很大的成功,但是对视频类的行为识别如今仍是一个富有挑战性的课题。

  在行为识别领域中,卷积神经网络得到了广泛的应用。早期的研究人员主要尝试融合光流与RGB视频帧来提高行为识别准确率。RGB视频内的细节信息非常丰富,但缺乏深度信息,其识别准确率常常受光照变化、阴影、物体遮挡等因素的干扰。如文献[2]在2014年首次提出了创造性的双流网络,通过从RGB视频序列提取时空信息进行识别;文献[3]用基于长短期记忆的多尺度卷积神经网络来提取多层次表观特征,从而学习长周期的高层时空特征;文献[4]使用在ImageNet上进行预训练的DenseNet来搭建双流卷积神经网络,从中提取空间和时间特征,然后微调来进行单帧活动预测。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003117





作者信息:

张健,张永辉,何京璇

(海南大学,海南 海口 570228)


此内容为AET网站原创,未经授权禁止转载。
行为识别 深度运动图像 DenseNet 光流 FPGA
Baidu
map