引言
突发事件具有不可控性与未知性,一旦发生,后果往往难以设想。在应急处置过程中,如果要有效提升应急救援协调能力,降低突发事件带来风险并减少损失,那么对事件关联信息进行及时准确的收集、处理和共享就显得至关重要。
随着互联网技术的发展与智能终端的普及,网络文本逐渐成为大数据背景下一种重要的信息资源。在突发事件发生的紧急情况下,社交媒体会充当重要的信息交流平台,实时传递紧急事件的相关情况。因此,社交平台应急关联信息文本分类的研究已成为互联网时代的热点问题之一。许多学者开始关注社交平台应急关联信息的文本分类问题。即通过将社交平台上的信息划分为不同的类别来实现快速甄别,为应急救援部门提供及时、可靠的决策支持。所采用的研究方法可分为基于机器学习的传统分类算法与基于深度学习的分类模型。伴随着BERT[1]等大规模语言模型的问世,基于预训练模型的文本分类研究取得了突破性进展,分类准确度不断提升。随之而来的挑战也不可忽视。例如,社交平台上获取的信息通常是非结构化且由多种模态组成的,并且可能伴随大量的噪声信息,会大大增加分类的难度,使分类结果的准确性难以得到保证。因此,如何有效地筛选与处理信息数据,同时融合多模态数据进行更全面的分析,仍需进行深入的研究。此外,如何提高分类算法的鲁棒性和泛化能力,也是需要进一步深究的问题。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006009
作者信息:
姜钰棋, 强子珊,卜凡亮
(中国人民公安大学信息网络安全学院,北京100240)

此内容为AET网站原创,未经授权禁止转载。