Web数据挖掘中数据异构问题解决方法的研究被引量：3

Research on Heterogeneous Data Problem Solving Method in the Process of Web Data Mining

下载PDF

导出

摘要 Web是动态性极强的信息源，访问、分析信息必须研究异构数据的集成问题，并选择合适的技术进行数据分析、集成和处理。怎样对Web海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML（可扩展标记语言）在Web数据挖掘中的应用，探讨了Web数据挖掘中的数据异构问题。通过XML技术建立数据抽取模型，解决互联网上绝大多数因异构、非结构化所导致的Web数据挖掘问题。 The web was an information resource with dynamic state, to access and analyze the data we must study how to integrate heterogeneous architecture data and choose fit techniques to analyze, manage and integrate the data.How to apply plentiful web data to the field of web data mining has been brought into focus. The article discusses the data heterogeneity problem in Web by introducing the application of XML in the field of web data mining. By using XML technology a data extraction model is established for solving most of the difficulties in Web data mining caused by heterogeneous, unstructured problems on Internet.

作者李春梅李艾丹薛中玉韩爽

机构地区北京中机科海科技发展有限公司北京理工大学

出处《中国科技资源导刊》 2012年第4期85-90,共6页 China Science & Technology Resources Review

基金国家国际科技合作计划项目“异构信息知识挖掘与可视化关键技术研究”（2010DFA14390）.

关键词数据挖掘半结构化 XML技术数据抽取模型 data mining semi-structured XML technology data extraction mode

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Han Jiawei, Kamber Micheline. Data Mining: Concept and Tbchniques[M]. San Francisco: Morgan KaUfmann Publishers. Inc. 2001.
2Shanmugasundaram Jayavel, Tufte Kristin, He Gang, et al. Relational Databases for Querying XML Documents: Limitations and Opportunities[C]//Edinbergh, Scotland: Proceeding of the 25th International Conference on Very Large DataBases(VLDB). 1999:302-314.
3Fan W, Simeon J. Integnty Constraints for XML[J]. Journal of Computer and System Science(JCSS), 2003, 66(1):254-291.
4Lee Dongwon, Chu Wesley W. Constraints-preserving Transformation from XML Document Type Definition to Relational Schema[C]//Salk Luke City, Utah: Pro- ceedings of the 19th international conference on Con- ceptual Modeling(ER), 2000:323-338.
5Lee Dongwon, Mani Murali, Chu Wesley W. Conver- sions Methods between XML Schema and Relations Models[M]//Knowledge Transformation for the Se- mantic Web. Amsterdan: IOS Press, 2003.
6方翔,李伟生.关系模式到XML模式的影射[J].计算机应用研究,2002,19(1):130-132. 被引量：26
7Etzioni O, Mine G, Widener T. The World Wide Web: Quagmire or Gold Mine[J]. Communication of the ACM, 1996, 39(11):65-68.
8DalviDinagGrayJoe.NETXML高级编程[M].英宁,林琪,费广正,译.北京:清华大学出版社,2002.
9RirdanRebeccaM.ADO.NET程序设计[M].李高健,译.北京:清华大学出版社,2002:23-25.
10CoyleFrankRXML、Web服务和数据革命[M].袁勤勇,莫青,译.北京:清华大学出版社,2003.

二级参考文献7

1[1]T Bray,J Paoli,C M Sperberg-Mcqueen.eXtensible Markup Language (XML) 1.0 [EB/OL].http://www.w3.org/TR/RECXML.
2[3]R Bourret,C Bornhovd,A Buchmann.A Generic Load/Extract Utility for Data Transfer between XML Documents and Relational Database[J] .TR-DVS99-1,DVS,Dep.CS,Darmstadt U.of Technology,Germany,1999,( 12 ).
3[4]Kevin Williams,Michael Brundage,Patrick Dengler.XML Structures for Existing Databases Eleven Rules for Moving a Aelational Database to XML [EB/OL].http:∥www- 106.ibm.eom/de veloperworks/library/x-struct.
4[5]Volker Turau.DB2XML:A Tool for Transforming Relational Databases into XML Documents [EB/OL] .http :∥www.informatik.fh-wiesbaden.de/～ turau/DB2XML/index.html.
5[6]Henry S Thompson,David Beech,Murray Maloney,et al.XML Schema Part 0: Primer [EB/OL] .http:∥www.w3.org/TR/2001 / REC-xmlschema-0-20010502.
6[7]Henry S Thompson,David Beech,Murray Maloney,et al.XML Schema Part 1: Structures [EB/OL] .http:∥www.w3.org/TR/2001 / REC-xmlschema-0-20010502.
7[8]Henry S Thompson,David Beech,Murray Maloney.XML Schema Part 2: Datatypes [EB/OL].http:∥www.w3.org/TR/2001/REC-xmlschema-0-20010502.

共引文献25

1周卫峰,陈俊杰.一个基于XSD的汽车零部件检索模型[J].电脑开发与应用,2004,17(6):30-32.
2张臣,周儒荣,庄海军.基于XML的复杂信息结构系统的研究与实现[J].机械科学与技术,2004,23(11):1261-1264. 被引量：1
3王伟达,芦东昕,孟照星.关系数据库与XML的双向数据传输的机制与实现[J].计算机应用研究,2005,22(2):164-166. 被引量：7
4田富鹏.基于ADO的XML与DATABASE的数据交换技术[J].西北民族大学学报（自然科学版）,2004,25(4):18-20.
5李爱军,郭学俊.基于Web服务的异构数据交换方案设计与实现[J].计算机技术与发展,2006,16(7):79-81. 被引量：12
6任保锋,肖卫东,唐九阳,刘芳.关系模式到OWL的映射研究[J].计算机应用研究,2006,23(9):33-35. 被引量：4
7离海波.浅谈SQL Server2000对XML文档的支持[J].电脑知识与技术,2006(11):14-15.
8马军,祁国宁,顾新建,郭剑锋.网络化零件库资源集成框架及其关键技术[J].机械工程学报,2007,43(8):91-96. 被引量：15
9陈艳,刘燕,杨彦臣,雷振宇.XML技术在森林资源数据交换平台中的应用研究[J].河北林果研究,2007,22(3):288-293. 被引量：1
10王鑫,方家骐.基于IDEF1x的面向对象XML建模[J].计算机工程与设计,2007,28(18):4507-4510. 被引量：1

同被引文献33

1韦燕.人工智能应用分析[J].佳木斯教育学院学报,2013(2):210-210. 被引量：3
2张良,佟俐鹃.异构数据库集成中数据传输问题的研究[J].计算机应用研究,2004,21(11):65-66. 被引量：19
3张建萍,刘希玉.基于聚类分析的K-means算法研究及应用[J].计算机应用研究,2007,24(5):166-168. 被引量：124
4孔令波,唐世渭,杨冬青,王腾蛟,高军.XML数据的查询技术[J].软件学报,2007,18(6):1400-1418. 被引量：72
5陈磊.REST的真谛[J].软件世界,2007(17):38-39. 被引量：7
6黄海宁.基于REST的轻量级J2EE架构实现[D].杭州:浙江大学,2008.
7Sheth A P. Changing focus on interoperability in information systems from system, syntax, structure to semantics [ C ]// Interoperating Geographic Information Systems. 1998:5-30.
8JIAWEI HAN,MICHELINE KAMBER,JIAN PEI.Data mining:concepts and techniques[M].Elsevier:Morgan Kaufmann,2011.
9JIAWEI HAN,MICHELINE KAMBER,JIAN PEI.Data mining:concepts and techniques[M].Elsevier:Morgan Kaufmann,2011.
10周顺平,魏利萍,万波,杨林,宋宗孝.多源异构空间数据集成的研究[J].测绘通报,2008(5):25-27. 被引量：42

引证文献3

1魏伟.基于REST的个性化数据重用方法[J].计算机与现代化,2013(5):215-218. 被引量：1
2黄伟建,桑志超,杜巍.电子商务环境下的Web数据挖掘系统架构设计[J].河北工程大学学报（自然科学版）,2014,31(2):83-85. 被引量：3
3刘晓璐,王志栋,单广荣.传统与流数据聚类算法[J].现代计算机,2020,26(29):25-28. 被引量：2

二级引证文献6

1盛伟翔,王昊,董晓睿,谢桂华.基于REST架构风格的精品课程平台建设[J].南昌大学学报（理科版）,2015,39(3):251-254. 被引量：2
2邰琦珲.电子商务中的数据挖掘技术探讨[J].电脑编程技巧与维护,2016(6):64-65. 被引量：1
3马勇,鲜敏,郑翔,黎远松.基于Web日志挖掘和相关性度量的电子商务推荐系统[J].计算机系统应用,2016,25(8):91-95. 被引量：6
4王斐玉,文华,王红梅.语义挖掘结合神经网络的电商网页推荐方案[J].控制工程,2018,25(1):149-153. 被引量：6
5黄海兵,吴云星,谷艳昌.应用聚类算法的大坝安全监控方法[J].水利规划与设计,2021(8):122-126. 被引量：2
6张倍思,陈烨,齐艺,董庆兴.多源过程性数据驱动的学习者综合评价模型研究[J].情报科学,2022,40(5):104-110. 被引量：10

1李宏升.基于Android-App的个性化移动学习平台的设计与实现[J].网络安全技术与应用,2014(12):18-19. 被引量：1
2常学洲,朱之红.计算机信息处理技术在办公自动化中的应用研究[J].软件,2014,35(2):93-94. 被引量：32
3李刚,马晓玲.分布计算中间件技术的探讨[J].中国科技博览,2009(2):93-93.
4王景辉.计算机通信的安全问题及维护管理探讨[J].网络安全技术与应用,2013(8):105-106. 被引量：8
5李刚.分布计算中间件技术的探讨[J].中国科技博览,2009,0(6):89-89.
6修桂华,陈贵英.基于XML的石化企业数据集成的研究[J].微计算机信息,2009,25(36):49-51.
7秦志红.如何在Windows环境下实现网络监听[J].网络安全技术与应用,2007(9):26-27. 被引量：2
8赵楠,张明扬,虞闯.一种基于web services的数字化校园中共享数据中心的建立[J].中国科教创新导刊,2007(18):165-165. 被引量：1
9陈彦.网络通信中的信息隐藏技术分析[J].中国新通信,2015,17(7):25-25. 被引量：2
10范冠雄.基于Visual C++的数据库访问技术比较研究[J].计算机与数字工程,2010,38(1):64-66. 被引量：9

中国科技资源导刊

2012年第4期

浏览历史

内容加载中请稍等...

Web数据挖掘中数据异构问题解决方法的研究被引量：3

参考文献10

二级参考文献7

共引文献25

同被引文献33

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

Web数据挖掘中数据异构问题解决方法的研究 被引量：3

参考文献10

二级参考文献7

共引文献25

同被引文献33

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

Web数据挖掘中数据异构问题解决方法的研究被引量：3