半结构化多Web文本数据挖掘的研究被引量：3

The research of data mining for multiple semi-structured Web text

下载PDF

导出

摘要在Web文本挖掘过程中,挖掘对象数据量大,且多是半结构化或无结构化的数据。采用了XQuery语言与经典的Apriori算法相结合的方法进行研究,引入了XQuery语言中的函数,实现了对多个Web文档的挖掘,通过具体的实例进行验证,该算法能够提高Web文本挖掘的时间效率。 In the process of Web text mining, mining object is the large amount of data and the data is semi-structured or unstructured. This paper adopts the method of combing classic Apriori algorithm and XQuery language for study, introduces the function in XQuery language, Implementation of the mining of multiple Web documents, verified by the concrete examples. The algorithm can improve the time efficiency of Web text mining.

作者谢娜戚晓明朱洪浩郭有强

机构地区蚌埠学院计算机科学与技术系

出处《齐齐哈尔大学学报（自然科学版）》 2015年第2期75-78,共4页 Journal of Qiqihar University(Natural Science Edition)

基金蚌埠学院自然科学研究项目(2013ZR13) 蚌埠学院自然科学研究项目(2013ZR07) 蚌埠学院工程化教研项目(2013gcjy10)

关键词 WEB文本挖掘 APRIORI算法 XQUERY语言时间效率 Web text mining apriori algorithm XQuery language time efficiency

分类号 TP311.135.9 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1谢秋华.Web文本挖掘的相关技术问题探讨[J].长春理工大学学报（自然科学版）,2010,33(7):55-56. 被引量：3
2肖毅,张林,聂笑一.基于WEB挖掘的网络爬虫设计与实现[J].计算机系统应用,2013,22(9):60-63. 被引量：9
3卢远征,叶晓彤.XML的DOM树结构在WEB挖掘中的应用[J].四川理工学院学报（自然科学版）,2013,26(3):64-67. 被引量：2
4刘维晓,陈俊丽,屈世富,万旺根.一种改进的Apriori算法[J].计算机工程与应用,2011,47(11):149-151. 被引量：35
5石正喜,葛科奇,曹财耀.基于关联规则的数据挖掘算法研究[J].计算机与网络,2013,39(6):62-64. 被引量：6

二级参考文献33

1秦鸿.基于Web的数据挖掘[J].电子科技大学学报,2002,31(S1):56-59. 被引量：7
2朱丽红,赵燕平.Web挖掘研究综述[J].情报杂志,2004,23(7):2-5. 被引量：16
3李立希,李铧汶,杨春燕.可拓学在数据挖掘中的应用初探[J].中国工程科学,2004,6(7):53-59. 被引量：13
4谭光明,冯圣中,孙凝晖.RNA二级结构预测中动态规划的优化和有效并行[J].软件学报,2006,17(7):1501-1509. 被引量：12
5陈文伟,黄金才.可拓知识与可拓数据挖掘[J].广西师范大学学报（自然科学版）,2006,24(4):159-162. 被引量：6
6陈金森,原福永,张园园.XML搜索引擎研究[J].图书情报工作,2007,51(1):114-117. 被引量：2
7Agrawal R, Srikan R.Fast algorithms for mining association rules in lager databases[C]//Proceedings of the Twentieth International Conference on Very Large Databases,Santiago,Sep 1994:487-499.
8Gray B, Orlowska M E.CCAIIA: Clustering categorial attribute into interesting association rules[C]//Proceedings of the 2nd Pacific-Asia Conference on Knowledge Discovery and Data Mining, Melbourne, Australia, April 1998.Berlin: Springer, 1998.
9Klemettinem M, Mannila H, Ronkainen R.Finding interesting rules from large set of discovered association rule[C]//Procecdings of the 3rd Int'l Conf on Information and Knowledge Management, Gaithersburg, Maryland, USA, 1994.New York, USA: ACM, 1994.
10Symth P, Goodman R M.An information theoretic approach to rule induction from databases[J].IEEE Trans on Knowledge and Data Engineering, 1992,4(4):301-316.

共引文献50

1肖建琼,宋国琴.基于兴趣度-相关性规则挖掘的研究及在推荐选课系统的应用[J].智能计算机与应用,2012,2(5):73-74. 被引量：1
2陈真,姚光伟.基于兴趣度的课程关联规则模式研究[J].广东石油化工学院学报,2012,22(6):27-31.
3洪月华.传感器网络分布式数据流的频繁项集挖掘算法[J].计算机科学,2013,40(2):58-60. 被引量：4
4王琼,曹奎.关联规则挖掘Apriori算法的改进[J].福建电脑,2012,28(12):84-86.
5何云峰.Apriori改进算法综述[J].微型机与应用,2013,32(6):1-3. 被引量：7
6张林,王宏海.一种改进的频繁项目集挖掘算法[J].阜阳师范学院学报（自然科学版）,2013,30(1):54-57. 被引量：1
7龙冰莹,陈小惠.改进Apriori算法在医院监护中心的研究与应用[J].计算机技术与发展,2013,23(8):137-140. 被引量：1
8栗青霞,王换换,傅喆.改进的Apriori算法在试题关联分析中的应用[J].电子科技,2014,27(2):35-38. 被引量：2
9张雪芹,徐金瑜,顾春华.基于本体的信息安全漏洞关联分析[J].华东理工大学学报（自然科学版）,2014,40(1):125-131. 被引量：7
10高冲,郭琳,蒲雪梅,陈守强.基于改进Apriori算法对丁书文治疗期前收缩用药规律的研究[J].山西中医,2014,30(4):44-45. 被引量：2

同被引文献14

1王德兴,胡学钢,刘晓平,王浩.改进购物篮分析的关联规则挖掘算法[J].重庆大学学报（自然科学版）,2006,29(4):105-107. 被引量：12
2李鹏,乔晓东,韩烽,王继田,梁健,张寅生.基于用户浏览行为的数据采集及应用[J].现代图书情报技术,2008(11):56-59. 被引量：4
3刘华婷,郭仁祥,姜浩.关联规则挖掘Apriori算法的研究与改进[J].计算机应用与软件,2009,26(1):146-149. 被引量：119
4干峰,李超峰,胡珊.XML数据库技术及其在医院信息系统中的应用[J].医学信息,2009,22(4):463-465. 被引量：3
5李小青,廖湖声,张晓博.XQuery实现技术研究综述[J].计算机科学,2012,39(3):9-13. 被引量：3
6吴旻峰.基于XML的电子病历系统及其院际信息共享技术研究[J].软件,2013,34(1):106-107. 被引量：13
7王庆福.网站建设中数据库技术与WEB技术的应用对比研究[J].软件,2013,34(2):86-87. 被引量：16
8姚树春.Oracle数据库应用中安全问题研究[J].软件,2014,35(1):94-95. 被引量：9
9董国华,朱习军.中医肺病科电子病历系统设计与实现[J].软件,2014,35(3):17-19. 被引量：5
10赵鹏,倪志伟,贾兆红.利用数据挖掘技术从气象数据库中建立范例库[J].微机发展,2002,12(3):67-70. 被引量：11

引证文献3

1高玉娟.Web数据挖掘研究综述[J].工业控制计算机,2016,29(1):113-115. 被引量：2
2刘娟,宋安军.改进FP-growth算法在气象预报中的应用[J].计算机系统应用,2016,25(10):199-204. 被引量：5
3田昊宇,马义.Native XML数据库在电子病历存储中的应用分析[J].软件,2017,38(10):202-206.

二级引证文献7

1张容.关于数据挖掘在电子商务中应用问题研究[J].通讯世界,2016,0(3):238-238.
2字云飞,李业丽,孙华艳,张莉婧.改进FP-Growth算法在旅游线路规划中的应用研究[J].计算机与现代化,2018(2):17-21. 被引量：4
3赵文芳,刘亚楠,余东昌.基于关联规则的气象服务智能推荐[J].大数据,2018,4(2):72-85. 被引量：3
4秦博宏,施运梅.Apriori算法在金属复合产品质量控制中的应用[J].北京信息科技大学学报（自然科学版）,2018,33(3):42-46. 被引量：1
5窦剑.浅析数据挖掘应用与图书馆智慧门户建设[J].四川图书馆学报,2019(2):42-44. 被引量：5
6韩存鸽.FP-growth算法的研究与改进[J].龙岩学院学报,2020,38(5):8-13. 被引量：3
7黄妙华,王思楚.基于事故数据的智能汽车安全测试场景研究[J].机械设计与制造,2022(10):23-27. 被引量：1

1胡锦成.Web文本数据挖掘关键技术及其在网络检索中的应用[J].河北工程技术高等专科学校学报,2005(2):42-44. 被引量：2
2宋瑞祺.Web文本数据挖掘关键技术及其在网络检索中的应用[J].山西财经大学学报（高等教育版）,2007(S1). 被引量：1
3孙学军.Web文本数据挖掘技术及其在电子商务中的应用[J].菏泽学院学报,2011,33(2):35-39.
4亢华爱.基于隐节点共振致密配对的Web数据文本抽取[J].科技通报,2015,31(2):82-84. 被引量：1
5陈建丽.基于XML的Web文本数据挖掘模型构建[J].电脑与电信,2008(9):63-64.
6邓箴.Web文本数据抽取中文本预处理研究[J].跨世纪,2008,16(11):224-224.
7余小军,刘峰,张春.基于N-Gram文本特征提取的改进算法[J].现代计算机,2012,18(23):3-7. 被引量：9

齐齐哈尔大学学报（自然科学版）

2015年第2期

浏览历史

内容加载中请稍等...

半结构化多Web文本数据挖掘的研究被引量：3

参考文献5

二级参考文献33

共引文献50

同被引文献14

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

半结构化多Web文本数据挖掘的研究 被引量：3

参考文献5

二级参考文献33

共引文献50

同被引文献14

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

半结构化多Web文本数据挖掘的研究被引量：3