期刊文献+

半结构化多Web文本数据挖掘的研究 被引量:3

The research of data mining for multiple semi-structured Web text
下载PDF
导出
摘要 在Web文本挖掘过程中,挖掘对象数据量大,且多是半结构化或无结构化的数据。采用了XQuery语言与经典的Apriori算法相结合的方法进行研究,引入了XQuery语言中的函数,实现了对多个Web文档的挖掘,通过具体的实例进行验证,该算法能够提高Web文本挖掘的时间效率。 In the process of Web text mining, mining object is the large amount of data and the data is semi-structured or unstructured. This paper adopts the method of combing classic Apriori algorithm and XQuery language for study, introduces the function in XQuery language, Implementation of the mining of multiple Web documents, verified by the concrete examples. The algorithm can improve the time efficiency of Web text mining.
出处 《齐齐哈尔大学学报(自然科学版)》 2015年第2期75-78,共4页 Journal of Qiqihar University(Natural Science Edition)
基金 蚌埠学院自然科学研究项目(2013ZR13) 蚌埠学院自然科学研究项目(2013ZR07) 蚌埠学院工程化教研项目(2013gcjy10)
关键词 WEB文本挖掘 APRIORI算法 XQUERY语言 时间效率 Web text mining apriori algorithm XQuery language time efficiency
  • 相关文献

参考文献5

二级参考文献33

  • 1秦鸿.基于Web的数据挖掘[J].电子科技大学学报,2002,31(S1):56-59. 被引量:7
  • 2朱丽红,赵燕平.Web挖掘研究综述[J].情报杂志,2004,23(7):2-5. 被引量:16
  • 3李立希,李铧汶,杨春燕.可拓学在数据挖掘中的应用初探[J].中国工程科学,2004,6(7):53-59. 被引量:13
  • 4谭光明,冯圣中,孙凝晖.RNA二级结构预测中动态规划的优化和有效并行[J].软件学报,2006,17(7):1501-1509. 被引量:12
  • 5陈文伟,黄金才.可拓知识与可拓数据挖掘[J].广西师范大学学报(自然科学版),2006,24(4):159-162. 被引量:6
  • 6陈金森,原福永,张园园.XML搜索引擎研究[J].图书情报工作,2007,51(1):114-117. 被引量:2
  • 7Agrawal R, Srikan R.Fast algorithms for mining association rules in lager databases[C]//Proceedings of the Twentieth International Conference on Very Large Databases,Santiago,Sep 1994:487-499.
  • 8Gray B, Orlowska M E.CCAIIA: Clustering categorial attribute into interesting association rules[C]//Proceedings of the 2nd Pacific-Asia Conference on Knowledge Discovery and Data Mining, Melbourne, Australia, April 1998.Berlin: Springer, 1998.
  • 9Klemettinem M, Mannila H, Ronkainen R.Finding interesting rules from large set of discovered association rule[C]//Procecdings of the 3rd Int'l Conf on Information and Knowledge Management, Gaithersburg, Maryland, USA, 1994.New York, USA: ACM, 1994.
  • 10Symth P, Goodman R M.An information theoretic approach to rule induction from databases[J].IEEE Trans on Knowledge and Data Engineering, 1992,4(4):301-316.

共引文献50

同被引文献14

引证文献3

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部