期刊文献+

一个基于XML的WEB数据收集模型的研究 被引量:18

Research on a WEB Data-collection Model Based on XML
下载PDF
导出
摘要 目前研究的热门领域Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,是对Web资源中蕴含的、未知的、有潜在应用价值模式的提取。其一般的过程可表示为:信息的发现、信息的选择和预处理、分析过程、产生结果犤1犦。WEB上的数据收集是对WEB数据挖掘的一种支持技术,是WEB数据挖掘的第一步。该文提出了一种基于XML技术的WEB数据收集模型,并实现了其中的一些主要功能。同时针对模型系统的不足做了一些有意义的改进探索。 With the explosive growth of information sources available on the World Wide Web,it has become increas-ingly necessary for users to utilize automated tools in order to find,extract,filter,and evaluate the desired information and resources.Web mining has now been putting forward and been on wide research.It defined as the discovery and analysis of useful information from the world wide web,and the general process are:information discovering,information selecting,information pre-processing,analyzing and processing,and making result.The data-collection on web is the first step of the web mining.In this paper we propone a web data-collection model based on XML ,and take some functions into implementation.At last some valuable discussions are put forward on this model for its shortcomings.
出处 《计算机工程与应用》 CSCD 北大核心 2004年第10期150-152,156,共4页 Computer Engineering and Applications
关键词 XML WEB数据收集 RDF XML ,WEB data-collection,RDF
  • 相关文献

参考文献11

  • 1王继成,邹涛,杨小江,潘金贵,张福炎.基于Internet的信息资源发现技术与实现[J].计算机研究与发展,1999,36(11):1369-1374. 被引量:35
  • 2宋爱波,董逸生,吴文明,孙志挥.Web挖掘研究综述[J].计算机科学,2001,28(11):13-16. 被引量:31
  • 3赵书良.XML应用研究[J].计算机科学,2001,28(8):94-95. 被引量:4
  • 4Jussi Myllymak.Effective Web Data Extraction with standard XML Technologies.http://www.research.ibm.com/people/j/jussi/papers/ANDES/ANDES.pdf.
  • 5Raymond Kosala,Heodrid Blocked.Web Mining Research :A Survey.ACM SIGKDD,2000-07.
  • 6Oualnid H,Karmouch A.Converting Web pages into well-formed XML documents.Communications,1999,ICC'99,1999 IEEE International Conference on,1999; 1:676~680.
  • 7W3C.Extensible Markup Language(XML).http://www.w3.org/xml/156 2004.10计算机工程与应用.
  • 8W3C.Resource Description Framework(RDF) Schema Specification 1.0.http://www.w3.org/TR/2000/CR-rdf-schema20000327,2000-03-27.
  • 9Stefan Haustein.Utilisting an Ontology Based Repository to Connect Web Miners and Application Agents.http://www-ai.cs.uni-dortmund.de.
  • 10张志强,李建中,周立柱.传统事务模型的并行性[J].计算机科学,2001,28(9):1-4. 被引量:1

二级参考文献19

  • 1王海燕 孟小峰 等.基于XML的Web信息查询系统XWIS:结构与实现[J].计算机科学,2000,27:22-25.
  • 2张志强 李建中 等.HPDB系统事务处理的设计与实现.黑龙江大学信息技术研究所研究报告[M].,1998..
  • 3张志强 李建中 等.HPDB系统事务处理的设计与实现.第八届全国青年计算机学术会议[M].南京,2000,10..
  • 4张志强 李建中 等.HPDB系统事务处理的设计与实现[J].南京大学学报(专刊),2000,36:52-59.
  • 5Goldfarb C F 张利等(译).XML实用技术[M].北京:清华大学出版社,1999..
  • 6王珊,数据仓库技术与联机分析处理,1998年
  • 7张志强,南京大学学报,2000年,36卷,专刊,52页
  • 8张志强,HPDB系统事务处理的设计与实践.黑龙江大学信息技术研究所研究报告,1998年
  • 9李建中,并行关系数据库管理系统引论,1998年
  • 10Berstein P A,IEEE Trans on Software Engineering.SE-9,1983年,3期

共引文献67

同被引文献105

引证文献18

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部