期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于BiLSTM-CRF的中文藏头诗敏感词检测算法
1
作者 何亚楠 游福成 《软件工程与应用》 2023年第6期915-921,共7页
在数字化和社交媒体时代,藏头诗作为一种文化传承与现代表达相结合的文学形式,其内容监控成为了互联网平台管理的一个挑战。由于其特殊的构造方式,即每行的开头字连起来可以表达特定意义,这一特性使得其成为了隐藏敏感信息的一种手段。... 在数字化和社交媒体时代,藏头诗作为一种文化传承与现代表达相结合的文学形式,其内容监控成为了互联网平台管理的一个挑战。由于其特殊的构造方式,即每行的开头字连起来可以表达特定意义,这一特性使得其成为了隐藏敏感信息的一种手段。尤其是在社交媒体和即时通讯平台上,用户可能会利用藏头诗来规避敏感词过滤机制。本研究提出了一种基于双向长短期记忆网络(BiLSTM-CRF)的藏头诗敏感词检测算法。该算法首先采用词嵌入方法将文字表示成高维向量,再利用BiLSTM模型对藏头诗正反双向的上下文语义进行理解,并捕获文本序列中跨句藏头词的依赖关系,最后通过CRF模型根据标签相关性输出标记序列。我们对算法在不同类型的藏头诗数据集上进行了测试,结果显示该算法能够有效地识别出敏感词汇,具有较高的准确率和召回率。本算法对于监管自动生成的文本内容,尤其是在保护文化传承和遵守网络法规方面显示出其重要价值。 展开更多
关键词 藏头诗 敏感词检测 BiLSTM-CRF
下载PDF
WebCollector和ElasticSearch在高校网站群敏感词检测中的应用研究 被引量:2
2
作者 钱红兵 李艳丽 张蕊 《电子设计工程》 2019年第24期11-14,19,共5页
在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究... 在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究相关材料文献和技术文档,研究相关系统设计案例,结合实际情况设计和实现一个能运行的系统,得出基于Webcollector爬虫框架和ElasticSearch搜索引擎设计和实现网站群敏感词检测系统的可行性。 展开更多
关键词 WebCollector ElasticSearch 敏感词检测 爬虫 搜索引擎
下载PDF
基于DBNet和改进的Trie树搜索的网络敏感词检测技术 被引量:1
3
作者 刘轩溢 《自动化与仪器仪表》 2024年第5期25-28,共4页
为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法... 为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法相比,设计使用的文本检测和识别方法具有更高的精度,能够为后续的敏感词检测提供更加准确的文本信息;与传统的敏感词检测方法相比,基于DBNet和改进的Trie树搜索的敏感词检测方法具有更高的检测精度,检测准确率、漏检率以及误检率分别为89.12%、5.80%和6.12%。综上可知,设计的敏感词检测方法检测性能良好,精度较高,能够应用于实际的网络信息敏感词检测中,保护未成年人接触到网络中的不良信息,具有一定的可行性。 展开更多
关键词 未成年人保护 敏感词检测 DBNet TRIE树
原文传递
基于深度学习的图片敏感文字检测 被引量:4
4
作者 吴财贵 唐权华 《计算机工程与应用》 CSCD 北大核心 2015年第14期203-206,230,共5页
为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符... 为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符的分割;用BP神经网络算法和深信度网络(DBN)算法结合对敏感信息进行检测。敏感文字检测理论分析和实验数据表明该方法的算法复杂度低,检测速度快。 展开更多
关键词 图像处理 文字区域提取 敏感词检测 深度学习 限制玻尔兹曼机 深信度网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部