期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于Bert模型的互联网不良信息检测被引量：5

Internet bad information detection based on Bert model

下载PDF

导出

摘要针对互联网不良信息检测这一业务场景,探讨了基于网站文本内容进行检测的方法。回顾了经典的文本分析技术,重点介绍了Bert模型的关键技术特点及其两种不同用法。详细描述了利用其中的特征提取方法,进行网站不良信息检测的具体实施方案,并且与传统的TF-IDF模型以及word2vec+LSTM模型进行了对比验证,证实了这一方法的有效性。 In view of the business scenario of bad information detection on the internet,the method of detection based on the text content of the website was discussed.Classical text analysis techniques were reviewed.The key technical features and two different usages of Bert model were introduced.The specific implementation scheme of using the feature extraction method to detect website bad information was described in detail,and was compared with the traditional TF-IDF model and word2vec+LSTM model.The validity of this method is verified.

作者蔡鑫 CAI Xin(Research Institute of China Telecom Co.,Ltd.,Shanghai 200122,China)

机构地区中国电信股份有限公司研究院

出处《电信科学》 2020年第11期121-126,共6页 Telecommunications Science

关键词不良信息 Bert模型文本分析特征提取 bad information Bert model text analysis feature extraction

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1蔡鑫,娄京生.基于LSTM深度学习模型的中国电信官方微博用户情绪分析[J].电信科学,2017,33(12):136-141. 被引量：12

共引文献11

1王铮,任华,路绪海.人工智能在客服系统的应用及关键技术[J].电信科学,2018,34(12):84-91. 被引量：23
2杨迪,汪少敏,任华.基于人工智能的智能交互系统体系架构[J].电信科学,2018,34(12):92-101. 被引量：11
3汪少敏,杨迪,任华.基于深度学习的文本分类系统关键技术研究与模型验证[J].电信科学,2018,34(12):117-124. 被引量：11
4任华,王铮,汪少敏.多种因素向量化的客服工单智能排序应用[J].电信科学,2018,34(12):125-131. 被引量：1
5朱肖颖,赖绍辉,陆科达.基于LSTM算法在新闻分类中的应用[J].梧州学院学报,2018,28(6):10-20. 被引量：4
6汪少敏,王铮,任华.利用深度学习融合模型提升文本内容安全的研究[J].电信科学,2020,36(5):25-30. 被引量：10
7宋尚文,卢超,阎红灿.DT和SVM分类器在情感极性分析中的应用[J].新一代信息技术,2020,3(8):17-23.
8蒋国璋,张翼翔,向峰,李公法.基于售后服务记录的卡车动力转向系统漏油分析与预测[J].武汉科技大学学报,2020,43(5):362-369. 被引量：1
9桂飞,程阳,李丹,洪思虹.互联网智能路由架构及算法[J].电信科学,2020,36(10):12-20.
10王一溢,占继尔,陈泽龙,田渊明.机器学习在心理测量中的应用[J].电脑知识与技术,2021,17(3):204-206. 被引量：1

同被引文献52

1向德生,杨格兰,熊岳山.数字水印技术研究[J].计算机工程与设计,2005,26(2):326-328. 被引量：37
2邓一贵,伍玉英.基于文本内容的敏感词决策树信息过滤算法[J].计算机工程,2014,40(9):300-304. 被引量：32
3李扬,潘泉,杨涛.基于短文本情感分析的敏感信息识别[J].西安交通大学学报,2016,50(9):80-84. 被引量：20
4裴雷,孙建军,周兆韬.政策文本计算:一种新的政策文本解读方式[J].图书与情报,2016(6):47-55. 被引量：86
5邢长征,赵全颖,王伟,王星.基于优化密度的耦合空间LDA文本聚类算法研究[J].计算机应用研究,2017,34(7):1966-1970. 被引量：7
6陈欣.移动互联时代如何应对军事新闻传播的失泄密问题[J].中国广播,2017(8):18-22. 被引量：2
7梁晓敏,徐健.舆情事件中评论对象的情感分析及其关系网络研究[J].情报科学,2018,36(2):37-42. 被引量：17
8宋继伟.总体国家安全观下的“敏感信息”管理机制刍议——美国经验借鉴[J].情报杂志,2018,37(8):107-113. 被引量：15
9孙山.人工智能生成内容著作权法保护的困境与出路[J].知识产权,2018,28(11):60-65. 被引量：83
10刘月峰,王成,张亚斌,苑江浩.用于网络入侵检测的多尺度卷积CNN模型[J].计算机工程与应用,2019,55(3):90-95. 被引量：29

引证文献5

1赵姝颖,肖宁,曾华圣,王海兮,常明芳.基于RoBerta的立场检测与趋势预测模型设计[J].应用科技,2021,48(3):27-33. 被引量：4
2陈悦,郭宇,谢圆琰,米振强.基于图像描述算法的离线盲人视觉辅助系统[J].电信科学,2022,38(1):61-72. 被引量：1
3李瀛,王冠楠.网络新闻敏感信息识别与风险分级方法研究[J].情报理论与实践,2022,45(4):105-112. 被引量：11
4乔喆.人工智能生成内容技术在内容安全治理领域的风险和对策[J].电信科学,2023,39(10):136-146. 被引量：4
5李艳.基于BERT和深度学习的网络舆情情感分析[J].信息记录材料,2024,25(5):100-102.

二级引证文献20

1李俊,杨频.单目标立场检测研究综述[J].信息与电脑,2022,34(4):70-72.
2邓家美.新闻敏感在新闻实践中的重要作用[J].环球首映,2022(7):157-159.
3周原.基于自然语言处理的纠错系统架构设计[J].太原师范学院学报（自然科学版）,2022,21(3):37-41. 被引量：3
4杨万灵.基于RoBERTa的数据增强与代码词嵌入代码补全模型[J].软件,2022,43(11):111-116.
5李瀛,杨芮.我国政府数据开放的隐私保护困境及管理框架研究[J].情报杂志,2023,42(1):152-157. 被引量：16
6胡庭恺,陈祖琴,葛继科,陈超,董焱.开放领域新闻中基于自适应决策边界的突发事件识别和分类研究[J].情报理论与实践,2023,46(2):194-200. 被引量：2
7邹凯,王驰名.敏感个人信息分级方法应用与仿真分析[J].图书情报导刊,2022,7(11):30-37.
8鲜于波,黄伟鑫.论辩文本立场检测——基于提示模型的小样本研究[J].逻辑学研究,2023,16(2):49-65.
9吴树芳,杨强,侯晓舟,尹萌.基于SSI-GuidedLDA模型的引导式网络敏感信息识别研究[J].情报杂志,2023,42(11):119-125. 被引量：3
10吴树芳,尹凯.基于敏感语义和复合共现的网络敏感词典构建研究[J].情报科学,2023,41(10):12-20. 被引量：2

1郑云凌,黄达,肖蕾.基于CNN的滤镜信息检测[J].中国航班,2020(16):67-67.
2张颖.解析新媒体时代下的企业党建工作[J].经济与社会发展研究,2020(32):0188-0188.
3王帆.关于计算机网络信息安全和防护思考[J].电子乐园,2020(12):123-123.
4何维.新时期高中生思想政治教育现状及应对策略[J].东西南北（教育）,2020(22):64-64.
5折彩娟.基于立德树人的初中信息技术教学探究[J].科学咨询,2020(49):235-235. 被引量：2
6张海玲.关于汉语中方位词“上”、“下”的研究[J].长安学刊,2020,11(6):26-28.
7林蔚.新媒体时代高校青年教师思想政治工作探索[J].泉州师范学院学报,2020,38(5):12-16. 被引量：1
8朱伟民,张翠月,杨悦.B2C模式下网站因素对消费者网络信任的影响机制研究[J].广西职业师范学院学报,2020,32(3):8-16.
9崔满丰,张晋辉.基于网站的地震应急信息发布技术[J].地震地磁观测与研究,2020,41(4):232-238. 被引量：5
10王瑜,刘铟,王玉鑫.基于点对称图像的变压器局部放电信号故障诊断[J].中国测试,2020,46(11):120-125. 被引量：13

电信科学

2020年第11期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部