期刊文献+

基于主题网络爬虫思想的Web数据挖掘算法探讨 被引量:1

Algorithm for Web Data Mining Based on Idea of Topical Web Crawler
下载PDF
导出
摘要 本文提出一种基于主题网络爬虫思想的Web数据挖掘算法,通过主题网络爬虫尽可能对Web数据进行分类整合处理,促进页面检索效率的提升,在此基础之上与贝叶斯网络算法相结合,基于关联规则对Web数据进行挖掘,并通过仿真实验的方式验证整套算法的可操作性。 Based on the idea of topical Web crawler,this paper puts forward the algorithm for Web data mining that Web data can be sorted and integrated through topical Web crawlers in order to promote the efficiency of page retrieval.On this basis,the algorithm combines with Bayesian network algorithm.The web data can be mined on grounds of association rules,and the whole algorithm will be verified by simulation experiments.
作者 景冰 JING Bing(Shanxi Vocational and Technical College of Finance and Trade,Taiyuan 030031,Shanxi Province,China)
出处 《景德镇学院学报》 2020年第3期66-68,共3页 Journal of JingDeZhen University
关键词 主题网络爬虫 数据挖掘 算法 topical web crawler data mining algorithm
  • 相关文献

参考文献6

二级参考文献54

  • 1战疆,冯月利,王珊.PostgreSQL中文全文索引技术研究与实现[J].华中科技大学学报(自然科学版),2005,33(z1):213-216. 被引量:3
  • 2高晓琴,蒋朝哲,涂瑞,李慧,杨占华.Web使用挖掘研究[J].微计算机信息,2006,22(07X):200-202. 被引量:9
  • 3宋宇,孟祥增.主题蜘蛛的设计与实现[J].郑州大学学报(理学版),2007,39(2):42-45. 被引量:3
  • 4夏崇镨,康丽.基于叙词表的主题爬虫技术研究[J].现代图书情报技术,2007(5):41-44. 被引量:8
  • 5赵燕,陈晓云,莫明辉,汤勇.基于用户群的智能主题爬虫[J].广西师范大学学报(自然科学版),2007,25(2):230-233. 被引量:3
  • 6Chakrabarti S, van den Berg M, Dora B. Focused crawling: a new approach to topic-specific Web resource discovery [J]. Computer Networks. 1999, 31 (11-16):1623-1640.
  • 7M Claypool, P Le, M Waseda, et al· Implicit Interest Indicators [A]. Proc of the ACM Intelligent User Interfaces Conf (IUI) [C] · 2001 ·33-40.
  • 8Y Mizuuchi and K Tajima. Finding context paths for Web pages [C]. Proceedings of the tenth ACM Conference on Hypertext and hypermedia, 1999:13-22
  • 9Arasu A, Cho J H, Molina H G, et al. Searching the Web[J].ACM Transactions on Internet Technology,2001,8(1): 2- 43.
  • 10配置一个使用plproxy的PostgreSQL数据库集群,[2008-5-25]http://www.pgsqldb.org/mwiki/index.php.

共引文献48

同被引文献10

引证文献1

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部