期刊文献+

基于机器学习的网站识别方案 被引量:1

原文传递
导出
摘要 本文基于图片分类算法NSFW实现了色情网站识别,使用自然语言处理提取网页特征并通过SVM分类器训练得到博彩网站检测模型,实验表明其精度高于95%,最后结合二者进行非法网站检测。
机构地区 国际关系学院
出处 《网络安全技术与应用》 2020年第7期62-63,共2页 Network Security Technology & Application
基金 国际关系学院大学生学术支持计划项目资助。
  • 相关文献

参考文献3

二级参考文献26

  • 1黄建军,梁彬.基于植入特征的网页恶意代码检测[J].清华大学学报(自然科学版),2009(S2):2208-2214. 被引量:5
  • 2宋江春,沈钧毅.一种新的Web用户群体和URL聚类算法的研究[J].控制与决策,2007,22(3):284-288. 被引量:11
  • 3[1]Uri Hanani. Information filtering: overview of issues, research and systems [J]. User Modeling and User-Adapted Interaction, 2001, (11 ): 203 - 259.
  • 4[2]Belkin N J, Croft W B. Information filtering and information retrieval: two sides of the same coin? [J].Communications of the ACM, 1992, 35 (12): 29 -37.
  • 5[3]Cover T, Hart P. Nearest neighbor pattern classification [ J]. IEEE Trans Information Theory, 1967,(13): 21-27.
  • 6[4]Church K, Hanks P. Word association norms, mutual information and lexicography[J]. Computational Linguistics, 1990,16 (3): 22- 29.
  • 7[5]Yang Y, Liu X. Are-examination of text categori-zation methods [A]. 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR'99) [C]. Berkeley,USA:SIGIR,1999.42-49.
  • 8[6]Yang Y. An evaluation of statistical approach to text categorization [R]. Pittsburgh, USA Technical Report CMU-CS, Computer Science Department,Carnegie Mellon University, ]997. 97- 127.
  • 9[7]He Ji, Tan Ah-Hwee, Tan Chcw-Lim. A comparative study on Chinese test categorization methods [A]. PRICAI'2000 International Workshop on Text and Web Mining[C]. Melbourne :PRICAI, 2000.24-35.
  • 10http ://user. qzone, qq. com/95007917/blog/1274004740.

共引文献17

同被引文献8

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部