期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BiLSTM-CRF的中文藏头诗敏感词检测算法
1
作者
何亚楠
游福成
《软件工程与应用》
2023年第6期915-921,共7页
在数字化和社交媒体时代,藏头诗作为一种文化传承与现代表达相结合的文学形式,其内容监控成为了互联网平台管理的一个挑战。由于其特殊的构造方式,即每行的开头字连起来可以表达特定意义,这一特性使得其成为了隐藏敏感信息的一种手段。...
在数字化和社交媒体时代,藏头诗作为一种文化传承与现代表达相结合的文学形式,其内容监控成为了互联网平台管理的一个挑战。由于其特殊的构造方式,即每行的开头字连起来可以表达特定意义,这一特性使得其成为了隐藏敏感信息的一种手段。尤其是在社交媒体和即时通讯平台上,用户可能会利用藏头诗来规避敏感词过滤机制。本研究提出了一种基于双向长短期记忆网络(BiLSTM-CRF)的藏头诗敏感词检测算法。该算法首先采用词嵌入方法将文字表示成高维向量,再利用BiLSTM模型对藏头诗正反双向的上下文语义进行理解,并捕获文本序列中跨句藏头词的依赖关系,最后通过CRF模型根据标签相关性输出标记序列。我们对算法在不同类型的藏头诗数据集上进行了测试,结果显示该算法能够有效地识别出敏感词汇,具有较高的准确率和召回率。本算法对于监管自动生成的文本内容,尤其是在保护文化传承和遵守网络法规方面显示出其重要价值。
展开更多
关键词
藏头诗
敏感词检测
BiLSTM-CRF
下载PDF
职称材料
WebCollector和ElasticSearch在高校网站群敏感词检测中的应用研究
被引量:
2
2
作者
钱红兵
李艳丽
张蕊
《电子设计工程》
2019年第24期11-14,19,共5页
在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究...
在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究相关材料文献和技术文档,研究相关系统设计案例,结合实际情况设计和实现一个能运行的系统,得出基于Webcollector爬虫框架和ElasticSearch搜索引擎设计和实现网站群敏感词检测系统的可行性。
展开更多
关键词
WebCollector
ElasticSearch
敏感词检测
爬虫
搜索引擎
下载PDF
职称材料
基于DBNet和改进的Trie树搜索的网络敏感词检测技术
被引量:
1
3
作者
刘轩溢
《自动化与仪器仪表》
2024年第5期25-28,共4页
为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法...
为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法相比,设计使用的文本检测和识别方法具有更高的精度,能够为后续的敏感词检测提供更加准确的文本信息;与传统的敏感词检测方法相比,基于DBNet和改进的Trie树搜索的敏感词检测方法具有更高的检测精度,检测准确率、漏检率以及误检率分别为89.12%、5.80%和6.12%。综上可知,设计的敏感词检测方法检测性能良好,精度较高,能够应用于实际的网络信息敏感词检测中,保护未成年人接触到网络中的不良信息,具有一定的可行性。
展开更多
关键词
未成年人保护
敏感词检测
DBNet
TRIE树
原文传递
基于深度学习的图片敏感文字检测
被引量:
4
4
作者
吴财贵
唐权华
《计算机工程与应用》
CSCD
北大核心
2015年第14期203-206,230,共5页
为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符...
为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符的分割;用BP神经网络算法和深信度网络(DBN)算法结合对敏感信息进行检测。敏感文字检测理论分析和实验数据表明该方法的算法复杂度低,检测速度快。
展开更多
关键词
图像处理
文字区域提取
敏感词检测
深度学习
限制玻尔兹曼机
深信度网络
下载PDF
职称材料
题名
基于BiLSTM-CRF的中文藏头诗敏感词检测算法
1
作者
何亚楠
游福成
机构
北京印刷学院信息工程学院
出处
《软件工程与应用》
2023年第6期915-921,共7页
文摘
在数字化和社交媒体时代,藏头诗作为一种文化传承与现代表达相结合的文学形式,其内容监控成为了互联网平台管理的一个挑战。由于其特殊的构造方式,即每行的开头字连起来可以表达特定意义,这一特性使得其成为了隐藏敏感信息的一种手段。尤其是在社交媒体和即时通讯平台上,用户可能会利用藏头诗来规避敏感词过滤机制。本研究提出了一种基于双向长短期记忆网络(BiLSTM-CRF)的藏头诗敏感词检测算法。该算法首先采用词嵌入方法将文字表示成高维向量,再利用BiLSTM模型对藏头诗正反双向的上下文语义进行理解,并捕获文本序列中跨句藏头词的依赖关系,最后通过CRF模型根据标签相关性输出标记序列。我们对算法在不同类型的藏头诗数据集上进行了测试,结果显示该算法能够有效地识别出敏感词汇,具有较高的准确率和召回率。本算法对于监管自动生成的文本内容,尤其是在保护文化传承和遵守网络法规方面显示出其重要价值。
关键词
藏头诗
敏感词检测
BiLSTM-CRF
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
WebCollector和ElasticSearch在高校网站群敏感词检测中的应用研究
被引量:
2
2
作者
钱红兵
李艳丽
张蕊
机构
中国人民大学信息技术中心
出处
《电子设计工程》
2019年第24期11-14,19,共5页
文摘
在高校信息化建设过程中,建设了大量的网站,这些网站发布的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究相关材料文献和技术文档,研究相关系统设计案例,结合实际情况设计和实现一个能运行的系统,得出基于Webcollector爬虫框架和ElasticSearch搜索引擎设计和实现网站群敏感词检测系统的可行性。
关键词
WebCollector
ElasticSearch
敏感词检测
爬虫
搜索引擎
Keywords
Webcollector
ElasticSearch
sensitive word detection
crawler
search engines
分类号
TN99 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
基于DBNet和改进的Trie树搜索的网络敏感词检测技术
被引量:
1
3
作者
刘轩溢
机构
西安翻译学院
出处
《自动化与仪器仪表》
2024年第5期25-28,共4页
基金
陕西省教育厅2022年度一般专项科研计划项目《数字化传播环境对未成年受众的负面影响及解决方案研究》研究成果(省教育厅编号:22JK0089,省社科联编号:2022HZ1173)。
文摘
为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法相比,设计使用的文本检测和识别方法具有更高的精度,能够为后续的敏感词检测提供更加准确的文本信息;与传统的敏感词检测方法相比,基于DBNet和改进的Trie树搜索的敏感词检测方法具有更高的检测精度,检测准确率、漏检率以及误检率分别为89.12%、5.80%和6.12%。综上可知,设计的敏感词检测方法检测性能良好,精度较高,能够应用于实际的网络信息敏感词检测中,保护未成年人接触到网络中的不良信息,具有一定的可行性。
关键词
未成年人保护
敏感词检测
DBNet
TRIE树
Keywords
protection of minors
sensitive word detection
DBNet
Trie tree
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于深度学习的图片敏感文字检测
被引量:
4
4
作者
吴财贵
唐权华
机构
江西师范大学软件学院
出处
《计算机工程与应用》
CSCD
北大核心
2015年第14期203-206,230,共5页
基金
国家自然科学基金(No.61262037)
江西省教育科学技术项目(No.GJJ13232)
文摘
为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符的分割;用BP神经网络算法和深信度网络(DBN)算法结合对敏感信息进行检测。敏感文字检测理论分析和实验数据表明该方法的算法复杂度低,检测速度快。
关键词
图像处理
文字区域提取
敏感词检测
深度学习
限制玻尔兹曼机
深信度网络
Keywords
image processing
text region extraction
sensitive word detection
deep learning
Restricted Boltzmann Machine(RBM)
deep belief network
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BiLSTM-CRF的中文藏头诗敏感词检测算法
何亚楠
游福成
《软件工程与应用》
2023
0
下载PDF
职称材料
2
WebCollector和ElasticSearch在高校网站群敏感词检测中的应用研究
钱红兵
李艳丽
张蕊
《电子设计工程》
2019
2
下载PDF
职称材料
3
基于DBNet和改进的Trie树搜索的网络敏感词检测技术
刘轩溢
《自动化与仪器仪表》
2024
1
原文传递
4
基于深度学习的图片敏感文字检测
吴财贵
唐权华
《计算机工程与应用》
CSCD
北大核心
2015
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部