-
题名基于Elmo的高层语义敏感信息识别方法研究
- 1
-
-
作者
陈紫琴
吴鹏
李乐成
-
机构
国家计算机网络应急技术处理协调中心湖北分中心
-
出处
《长江信息通信》
2024年第7期119-122,共4页
-
文摘
社交媒体的不断发展使得网络上充斥着大量的信息,然而网络的开放性也导致了容易传播涉政敏感信息。在这样的背景下,如何高效准确地筛查出这些涉政敏感信息成为当前迫切需要解决的问题。本文旨在提出一种基于深度学习的语义层级敏感信息识别方法,以应对这一挑战。将输入的文本以基于Elmo的方法生成动态词向量,建立基于高层语义的细到粗策略和基于多上下文的混合模型,再通过基于关联规则的变体词识别算法得到识别结果。经实验证明,在新浪微博数据集上,文章提出的方法有较好的效果。尤其值得注意的是,基于Elmo的动态词向量生成方法相比传统的word2vec和glove表示法具有更突出的效果,这表明了Elmo技术在敏感信息识别任务中的潜力和优势。
-
关键词
文本检测
词向量生成
敏感信息识别
自然语言处理
深度学习
-
Keywords
text detection
word vector generation
sensitive information identification
natural language processing
decp lcarning
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-