期刊文献+

基于Hadoop的Web用户识别与新闻智能推荐算法研究 被引量:7

下载PDF
导出
摘要 为了解决大数据时代用户阅读时遇到的"信息过载"与"信息迷失"问题,提出了基于Hadoop平台的用户准确识别与新闻推荐算法。首先基于MAC地址识别用户,通过对用户浏览轨迹的离线和在线挖掘,建立用户兴趣模型。然后对新闻关键词进行聚类,结合协同过滤和启发式方法,基于关键词对用户进行新闻的智能推荐。实验结果表明,基于MAC地址的算法比基于IP地址的算法用户识别率提高了30%。
出处 《软件导刊》 2016年第5期27-29,共3页 Software Guide
基金 国家自然科学基金项目(61163012 61363074) 广西科学研究与技术开发计划项目(桂科攻1598010-3) 广西高校科学技术研究项目(2013YB147) 广西研究生教育创新计划项目(YCSZ2014187)
  • 相关文献

参考文献6

二级参考文献23

  • 1孟涛,王继民,闫宏飞.网页变化与增量搜集技术[J].软件学报,2006,17(5):1051-1067. 被引量:22
  • 2Hafri Y,Djeraba C.High performance crawling system.In:Proc.of the 6th ACM SIGMM Int'1 Workshop on Multimedia Information Retrieval.New York:ACM Press,2004.299-360.
  • 3A Heydon,M Najork.Mercator:a scalable,extensible web crawler.International conference on World Wide Web.New York:ACM Press,1999.219-229.
  • 4Yan HF,Wang JY,Li XM,Guo L.Architectural design and evaluation of an efficient Web-crawling sysgem[J].Journal of Systems and Software.2002,60(3):185-193.
  • 5J Edwards,K McCurl,J Tomin.An adaptive model for optimizing performance of an incremental web crawler.International conference on World Wide Web.New York:ACM Press,2001.106-113.
  • 6J Cho,H Garcia-Molina.Effective page refresh policies for web crawlers.ACM Transactions on Database Systems.New York:ACM Press,2003.390-426.
  • 7Page L,Brin S,Motwani R.The PageRank Citation Ranking:Bring Oreder to the Web.Technical report,1998.
  • 8Feng G,Liu TY,Wang Y,et al.AggregateRank:bring order to web sites.Proceedings of the 29th annual international ACM SIGIR conference.New York:ACM Press,2006.75-82.
  • 9J Allan,J Carbonell,G Doddington.et al.Topic detection and tracking pilot study:Final report.In Proceedings of the DARPA Broadcast News Transcription and Understanding Workshop.San Fransisco:Morgan Kaufmann Press Ltd,1999.194-218.
  • 10D M Blei,A Y Ng,M I Jordan.Latent dirichlet allocation[J].J.Mach.Learn.Res.,2003,3(5):993-1022.

共引文献40

同被引文献49

引证文献7

二级引证文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部