期刊文献+

基于Bert模型的互联网不良信息检测 被引量:5

Internet bad information detection based on Bert model
下载PDF
导出
摘要 针对互联网不良信息检测这一业务场景,探讨了基于网站文本内容进行检测的方法。回顾了经典的文本分析技术,重点介绍了Bert模型的关键技术特点及其两种不同用法。详细描述了利用其中的特征提取方法,进行网站不良信息检测的具体实施方案,并且与传统的TF-IDF模型以及word2vec+LSTM模型进行了对比验证,证实了这一方法的有效性。 In view of the business scenario of bad information detection on the internet,the method of detection based on the text content of the website was discussed.Classical text analysis techniques were reviewed.The key technical features and two different usages of Bert model were introduced.The specific implementation scheme of using the feature extraction method to detect website bad information was described in detail,and was compared with the traditional TF-IDF model and word2vec+LSTM model.The validity of this method is verified.
作者 蔡鑫 CAI Xin(Research Institute of China Telecom Co.,Ltd.,Shanghai 200122,China)
出处 《电信科学》 2020年第11期121-126,共6页 Telecommunications Science
关键词 不良信息 Bert模型 文本分析 特征提取 bad information Bert model text analysis feature extraction
  • 相关文献

参考文献1

共引文献11

同被引文献52

引证文献5

二级引证文献20

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部