设计应用

计算机文本分析算法发展综述

作者:孙静含1,任静2
发布日期:2023-03-28
来源:电子技术应用 2023年3期

0 引言

计算机文本分析自然语言处理(Natural Language Processing, NLP)领域的一个重要分支,是指对文本数据或语料库内的语料进行分析,最终提取出给定语料的各种信息,包括关键词、词向量等内容的计算机技术,在一些文献中也将这一领域的相关技术纳入自然语言处理预训练技术之中。文本分析最早起源于20世纪50~60年代,这一阶段的研究重点是如何对语言规则进行设定。到20世纪70年代,随着语料库的丰富和硬件设备的进步,文本分析技术开始融合机器学习算法,并得到了快速发展。进入21世纪之后,深度学习方法被运用到文本分析之中,诞生了诸如Word2Vec、BERT等技术,进一步提高了文本分析的应用场景。在可以预见的未来,传统的基于数字数据的分析方法将逐渐无法满足越发庞杂的应用需求,文本分析和其所属的自然语言处理领域将会是一个愈发重要的发展方向。




本文详细内容请下载:https://www.chinaaet.com/resource/share/2000005227




作者信息:

孙静含1,任静2

(1.北京工业大学,北京 100124;2.中国电子信息产业集团第六研究所,北京 100083)



微信图片_20210517164139.jpg

此内容为AET网站原创,未经授权禁止转载。
文本分析 自然语言处理 算法
Baidu
map