Web结构挖掘的XML实现策略被引量：2

Realization strategy of web structure mining

下载PDF

导出

摘要 XML适合于解决Web数据挖掘中数据库环境异构和信息的半结构化等难题。Web结构挖掘是整个Web信息挖掘的重要组成部分。用XML来完成Web结构信息的预处理是将Web结构信息规范化并转化为XML数据,并以此明确网站的文件构成、组织方式、内容构成和内容的超链关系。提出基于XML的Web结构挖掘系统的实现过程,解决了XML文件通过标准接口读入到挖掘程序的关键技术。 The XML is suitable for solve the difficult problem ofthe different database environment and the half-structured ofinformation. The structure mining of web is an important part in web information digest. The pretreatment of web structure with XML is standardizing the information of web structure and transact it to XML format, and then there is an explicit cognition about the document structure, the mode of organization, the contents constitute and the hyperlink relation of contents. The realization procedure of web structure mining is described based on XML and the key technique problem about how themining soft read an XML file with a standard interface is solved.

作者朱德利

机构地区重庆大学软件学院

出处《计算机工程与设计》 CSCD 北大核心 2006年第23期4447-4449,4460,共4页 Computer Engineering and Design

基金重庆师范大学校级科研基金项目(05XWY070)

关键词数据挖掘 WEB挖掘结构挖掘扩展标记语言半结构化信息 data mining web mining structure mining XML half-structured-information

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1王建丽,丁振国.一种基于XML的Web数据挖掘技术[J].西安科技学院学报,2002,22(3):337-340. 被引量：8
2沈洁,薛贵荣.一种基于XML的Web数据挖掘模型[J].系统工程理论与实践,2002,22(9):74-77. 被引量：33
3何波,李建国.基于XML的WEB数据挖掘系统框架的设计与实现[J].西南师范大学学报（自然科学版）,2002,27(6):887-890. 被引量：9
4韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量：356
5Johnny S K Wong,Rishi Nayar.A framework for a world wide web based data mining system[J].Journal at Network and Computer Applications,2000,21:163-185.
6陈一明.基于XML数据模型及面向Web数据挖掘技术[J].计算机系统应用,2002,11(7):28-30. 被引量：2
7左开中,汪伟.XML语言在Web数据挖掘中的应用[J].微机发展,2002,12(3):59-61. 被引量：16
8李军怀,周明全,耿国华,张景西.XML在异构数据集成中的应用研究[J].计算机应用,2002,22(9):10-12. 被引量：128
9孟小峰.Web数据管理研究综述[J].计算机研究与发展,2001,38(4):385-395. 被引量：83
10涂承胜,鲁明羽,陆玉昌.Web挖掘研究综述[J].计算机工程与应用,2003,39(10):90-93. 被引量：49

二级参考文献57

1徐振航,刘莉芹.XML与面向Web的数据挖掘技术[J].软件世界,2000(10):120-122. 被引量：16
2黄中杰王天利.XML新网页语言开发手册[M].北京:清华大学出版社,2000.50-90.
3[1]Bay T, Paoli J, Sperberg-McQueen C M. Extensible Markup Language(XML) 1.0 Specification World Wide Web Consortium Recommendation[EB/OL]. http://www.w3.org/TR/REC-xml/,1999.
4[2]Ananel S S. Designing a kenel for data mining[J]. IEEE Expert on Intelligent System,1997,27(3):947-963.
5[3]Lawrence S, et al. Searching the world wide web[J]. Science,1998,280(5360):98-100.
6[4]Anne Lear. XML Seen as Integral to application integration[J]. IT Pro,1999,(9/10):1012-1031.
7[1]Zainane O R et al. Multimediaminer:a system protoype for multime-dia data mining[C].In:proc ACM SIGMOD Int Conf On managementof Data, 1998:581～583
8[2]Etzioni O.The World Wide Web:Quagmire or gold mine[J].Communi-cations of ACM, 1996; 39 ( 11 ) :65～68
9[3]Feldman R,DaganI.Knowledge discovery in textual databases(KDT) [C].In:Proc of 1st Int'l Conf on Knowledge Discovery and Data Mi-ning. Montreal, Canada, 1995:112～117
10[4]Chakrabarti S.Data mining for hypertext:a tutorial survey[J].SIGKDDExploration ,2000; 1 (2): 1～11

共引文献646

1刘晓莹.基于XML的异构数据库查询技术研究[J].中国电力教育,2007(z2):202-204. 被引量：1
2严彩梅.Web智能信息检索体系结构的研究[J].计算机应用研究,2002,19(11):51-52. 被引量：3
3杨洋.Web数据挖掘的分析与探讨[J].装备制造技术,2006(5):63-64. 被引量：1
4王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量：2
5阿静.政企互动打假树维权典范——爱普生打印机胜诉“骗保门”事件[J].办公自动化,2006(14):10-11.
6曹丹,薛明,许元春.XML在WEB挖掘中的应用[J].新乡师范高等专科学校学报,2006,0(2):40-42.
7董德民.面向电子商务的Web使用挖掘及其应用研究[J].中国管理信息化（综合版）,2006,9(10):83-85. 被引量：1
8杜志文,曾文华.网格计算在文本分类中的应用[J].微电子学与计算机,2006,23(z1):221-222.
9詹雅静.浅谈学校学籍管理系统的设计和实现[J].内蒙古科技与经济,2005(z1):151-152. 被引量：1
10张克君,李伯群,李欣,杨炳儒.基于DWLMS模型的分布式Web用户访问模式挖掘[J].清华大学学报（自然科学版）,2005,45(S1):1762-1766. 被引量：2

同被引文献7

1蔡飞,贝佳,潘金贵.一种简单高效的XML与关系数据库信息交换的方法[J].计算机科学,2004,31(12):72-75. 被引量：3
2顾晓燕.关于Web挖掘技术的研究[J].电脑知识与技术,2005(1):70-72. 被引量：3
3马保国,侯存军,王文丰,钱方正.Web数据挖掘技术及应用[J].计算机与数字工程,2006,34(6):20-22. 被引量：16
4崔建群,何炎祥,郑世珏,吴黎兵.基于XML的Web数据挖掘关键技术的研究[J].计算机工程,2006,32(20):43-44. 被引量：10
5蒋望东,黄发良.基于WEB的数据挖掘研究综述[J].湖南工程学院学报（自然科学版）,2007,17(1):61-64. 被引量：9
6李琳,吴成东,韩中华,胡静.基于Web的数据挖掘技术[J].自动化与仪表,2007,22(2):74-77. 被引量：6
7徐立宇.基于Web的数据挖掘技术研究及其应用[J].电脑知识与技术（过刊）,2009,15(3X):1804-1805. 被引量：5

引证文献2

1李雪竹,王锋.Web数据挖掘研究[J].电脑知识与技术（过刊）,2007(18). 被引量：2
2李孝忠,赵国桦.利用XML的一种因果模式Web挖掘模型[J].天津科技大学学报,2010,25(2):65-67.

二级引证文献2

1梁燕红.Web挖掘技术在网络教学中的应用研究[J].信息技术与信息化,2017(9):127-129. 被引量：3
2吕刚.数据挖掘技术在当前电子商务实践中的运用[J].魅力中国,2010,0(7X):173-173.

1熊忠阳,任芳,张玉芳,毛嘉莉,周涓.基于XML描述的数据挖掘结果的存储方法[J].计算机工程与设计,2006,27(20):3874-3877. 被引量：2
2李艳霞,巩九洲,黎玉琴.基于Web Services的Web挖掘实现方案[J].自动化技术与应用,2008,27(5):73-75. 被引量：1
3黄豫清,戚广智,张福炎.构造Web文档中半结构化信息的技术[J].计算机辅助设计与图形学学报,2000,12(3):230-234. 被引量：4
4陈和平,高丽,杨玲贤.基于面向值的映像方法在XML数据存储中的应用[J].武汉科技大学学报,2005,28(2):197-200. 被引量：2
5黄豫清,戚广志,张福炎.从WEB文档中构造半结构化信息的抽取器[J].软件学报,2000,11(1):73-78. 被引量：47
6朱苏阳,惠浩添,钱龙华,张民.基于自监督学习的维基百科家庭关系抽取[J].计算机应用,2015,35(4):1013-1016. 被引量：1
7徐志浩,惠浩添,钱龙华,朱巧明.中文维基百科的实体分类研究[J].中文信息学报,2015,29(5):91-97. 被引量：1
8李曦.一种办公自动化中决策支持系统模型的研究[J].中南工学院学报,1997,11(1):52-57. 被引量：1
9姜合萍,李愈馨,范悦.数字化车间质量管理信息规范化技术研究[J].新技术新工艺,2013(4):1-3. 被引量：1
10Openfind Herman.电子邮件归档，保护数字资产[J].网管员世界,2010(3):119-120.

计算机工程与设计

2006年第23期

浏览历史

内容加载中请稍等...

Web结构挖掘的XML实现策略被引量：2

参考文献11

二级参考文献57

共引文献646

同被引文献7

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Web结构挖掘的XML实现策略 被引量：2

参考文献11

二级参考文献57

共引文献646

同被引文献7

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Web结构挖掘的XML实现策略被引量：2