期刊文献+

基于K近邻分类算法的涉恐信息过滤模型研究 被引量:12

Research on the Risk Information Filtering Model Based on K-nearest Neighbor Classification Algorithm
下载PDF
导出
摘要 [目的/意义]针对现有的涉恐信息过滤在语义过滤和主题无关性方面还存在一定的不足,建立了基于K近邻分类算法的涉恐信息过滤模型。[方法/过程]通过采用K近邻分类算法、TF-IDF分词系统和语义相似度计算建立了一种新的涉恐信息过滤模型,并从爬取主题的一次过滤到关键词匹配的二次过滤,最终进行语义分析的三次过滤,构建了一套完整的涉恐信息过滤体系。[结果/结论]本模型能够快速高效地获取涉恐信息,克服了语义和主题无关性等因素的干扰,较于传统的涉恐信息过滤在查全率和查准率上面有了很大的提升。 [Purpose/Significance]For the existing fear information filtering in the semantic filtering and topic-independence,there are some deficiencies,this paper established a k-nearest neighbor classification algorithm for the risk information filtering model.[Method/Process]By using the k-nearest neighbor classification algorithm,TF-IDF word segmentation system and semantic similarity calculation,a new fear of information filtering model is established,and from one filter to the second filter of the keyword matching,and finally the three filtering of semantic analysis,a set of complete information filtering system is constructed.[Result/Conclusion]This model can quickly and efficiently obtain the information about terrorism,and overcome the interference of semantic and topic independence.Compared with the traditional terrorist information filtering in recall and precision,there is a great improvement.
作者 唐华 杨解君 王俊 黄炜 Tang Hua;Yang Xiejun;Wang Jun;Huang Wei(School of Safety Science and Engineering,Nanjing Tech University,Nanjing 211800;Information Technology Center,Hubei University of Technology,Wuhan 430068)
出处 《情报杂志》 CSSCI 北大核心 2018年第3期64-70,共7页 Journal of Intelligence
基金 湖北省教育厅人文社会科学研究青年项目"风险管理视角下的信息安全"(编号:15Q065) 国家自然科学基金项目"微博环境下实时主动感知网络舆情事件的多核方法研究"(编号:71303075)研究成果之一
关键词 涉恐信息 信息过滤 K近邻算法 分词系统 语义相似度 Information relating to terrorism Information filtering K-nearest neighbor algorithm Word segmentation system Semantic similarity
  • 相关文献

参考文献9

二级参考文献117

共引文献259

同被引文献113

引证文献12

二级引证文献37

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部