期刊文献+

基于Web挖掘自动分类器的设计与实现 被引量:1

Design and Implementation of the Auto Classifier Based on Web Mining
下载PDF
导出
摘要 分析分布式实时网络行为监控系统中Web网页安全性挖掘问题,设计实现一个基于Web挖掘的自动分类器,并构造一个实验环境来检测分类器的性能。该自动分类器利用特征提取算法实现对每个样本的特征向量提取和待分类文本的特征向量提取,利用基于k个"最近邻"(KNN)分类算法实现对网页的分类,能够提取出带有不安全信息的网页,分类效果良好。 This paper analyzes Web security mining problem in distributed real-time network behavior monitoring system. An auto classifier based on Web minning was designed and implemented. An experiment environment to constructed. This classfier extracts the feature test the performance of the classifier was vector of each samples and documents to be classified by using the feature extraction algorithm. Web page was classfied by using the K- Nearest-Neighbor(KNN) classification algorithm. The experimental results show that this auto classifier based on Web minning can fetch insecurity Web pages, and its classification is effective.
出处 《广西科学院学报》 2008年第4期310-312,316,共4页 Journal of Guangxi Academy of Sciences
基金 广西科技攻关项目(桂科攻关033008-9)资助
关键词 网络行为监控 Web网页挖掘 分类器 KNN分类算法 特征提取 network behavior monitoring, Web page minning, classifier, KNN classification algorithm, feature extraction
  • 相关文献

参考文献3

  • 1Han Jiawei,Micheline Kamber.数据挖掘:概念与技术[M].第2版.北京:机械工业出版社,2007.
  • 2冯迪,李晋宏,曹原.基于网页的数据挖掘研究:2007通信理论与技术新发展-第十二届全国青年通信学术会议论文集:上册[C].北京:电子工业出版社,2007.
  • 3张华平,刘群.基于N-最短路径方法的中文词语粗分模型[J].中文信息学报,2002,16(5):1-7. 被引量:99

二级参考文献1

共引文献98

同被引文献2

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部