期刊文献+

搜索服务中基于云计算的垃圾网页识别研究

Research on spam pages identification in search service based on cloud computing
原文传递
导出
摘要 为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较高,处理时间随着集群节点数的增加而明显减少. 为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较高,处理时间随着集群节点数的增加而明显减少.
出处 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第S1期249-253,共5页 Journal of Huazhong University of Science and Technology(Natural Science Edition)
关键词 搜索服务 垃圾网页识别 支持向量机 云计算 HADOOP MAPREDUCE search service spam page identification support vector machines cloud computing Hadoop MapReduce
  • 相关文献

参考文献9

二级参考文献154

共引文献1201

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部