设计应用

基于分割的自然场景下文本检测方法与应用

作者:陈小顺,王良君
发布日期:2021-02-25
来源:2021年电子技术应用第2期

0 引言

    视觉图像是人们获取外界信息的主要来源,文本则是对事物的一种凝练描述,人通过眼睛捕获文本获取信息,机器设备的眼睛则是冰冷的摄像头。如何让机器设备从拍照获取的图像中准确检测识别文本信息逐渐为各界学者关注。

    现代文本检测方法多为基于深度学习的方法,主要分为基于候选框和基于像素分割的两种形式。本文选择基于像素分割的深度学习模型作为文本检测识别的主要研究方向,能够同时满足对自然场景文本的精确检测,又能保证后续设备功能(如语义分析等功能)的拓展。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003385




作者信息:

陈小顺,王良君

(江苏大学 计算机科学与通信工程学院,江苏 镇江212013)

此内容为AET网站原创,未经授权禁止转载。
像素分割 注意力机制 LSTM 自然场景文本检测
Baidu
map