一个基于XML的WEB数据收集模型的研究被引量：18

Research on a WEB Data-collection Model Based on XML

下载PDF

导出

摘要目前研究的热门领域Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,是对Web资源中蕴含的、未知的、有潜在应用价值模式的提取。其一般的过程可表示为:信息的发现、信息的选择和预处理、分析过程、产生结果犤1犦。WEB上的数据收集是对WEB数据挖掘的一种支持技术,是WEB数据挖掘的第一步。该文提出了一种基于XML技术的WEB数据收集模型,并实现了其中的一些主要功能。同时针对模型系统的不足做了一些有意义的改进探索。 With the explosive growth of information sources available on the World Wide Web,it has become increas-ingly necessary for users to utilize automated tools in order to find,extract,filter,and evaluate the desired information and resources.Web mining has now been putting forward and been on wide research.It defined as the discovery and analysis of useful information from the world wide web,and the general process are:information discovering,information selecting,information pre-processing,analyzing and processing,and making result.The data-collection on web is the first step of the web mining.In this paper we propone a web data-collection model based on XML ,and take some functions into implementation.At last some valuable discussions are put forward on this model for its shortcomings.

作者陈玉芳葛燧和

机构地区同济大学计算机科学与工程系

出处《计算机工程与应用》 CSCD 北大核心 2004年第10期150-152,156,共4页 Computer Engineering and Applications

关键词 XML WEB数据收集 RDF XML ,WEB data-collection,RDF

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1王继成,邹涛,杨小江,潘金贵,张福炎.基于Internet的信息资源发现技术与实现[J].计算机研究与发展,1999,36(11):1369-1374. 被引量：35
2宋爱波,董逸生,吴文明,孙志挥.Web挖掘研究综述[J].计算机科学,2001,28(11):13-16. 被引量：31
3赵书良.XML应用研究[J].计算机科学,2001,28(8):94-95. 被引量：4
4Jussi Myllymak.Effective Web Data Extraction with standard XML Technologies.http://www.research.ibm.com/people/j/jussi/papers/ANDES/ANDES.pdf.
5Raymond Kosala,Heodrid Blocked.Web Mining Research :A Survey.ACM SIGKDD,2000-07.
6Oualnid H,Karmouch A.Converting Web pages into well-formed XML documents.Communications,1999,ICC'99,1999 IEEE International Conference on,1999; 1:676～680.
7W3C.Extensible Markup Language(XML).http://www.w3.org/xml/156 2004.10计算机工程与应用.
8W3C.Resource Description Framework(RDF) Schema Specification 1.0.http://www.w3.org/TR/2000/CR-rdf-schema20000327,2000-03-27.
9Stefan Haustein.Utilisting an Ontology Based Repository to Connect Web Miners and Application Agents.http://www-ai.cs.uni-dortmund.de.
10张志强,李建中,周立柱.传统事务模型的并行性[J].计算机科学,2001,28(9):1-4. 被引量：1

二级参考文献19

1王海燕孟小峰等.基于XML的Web信息查询系统XWIS：结构与实现[J].计算机科学,2000,27:22-25.
2张志强李建中等.HPDB系统事务处理的设计与实现.黑龙江大学信息技术研究所研究报告[M].,1998..
3张志强李建中等.HPDB系统事务处理的设计与实现.第八届全国青年计算机学术会议[M].南京,2000,10..
4张志强李建中等.HPDB系统事务处理的设计与实现[J].南京大学学报（专刊）,2000,36:52-59.
5Goldfarb C F 张利等（译）.XML实用技术[M].北京:清华大学出版社,1999..
6王珊，数据仓库技术与联机分析处理，1998年
7张志强，南京大学学报，2000年，36卷，专刊，52页
8张志强，HPDB系统事务处理的设计与实践.黑龙江大学信息技术研究所研究报告，1998年
9李建中，并行关系数据库管理系统引论，1998年
10Berstein P A，IEEE Trans on Software Engineering.SE-9，1983年，3期

共引文献67

1高怀金,李国慧.基于遗传算法的Web使用挖掘研究[J].电脑知识与技术（过刊）,2007(18):1628-1630.
2谭锦燕,朱国进.面向读者信息需求的浏览空间[J].华中科技大学学报（自然科学版）,2003,31(S1):351-353. 被引量：1
3石建.论个性化信息服务Web数据挖掘技术的实践环境[J].现代图书情报技术,2003(S1):75-77. 被引量：1
4姜传菊.试论Web中的数据挖掘[J].现代图书情报技术,2003(S1):162-164. 被引量：5
5相春艳,徐生.基于Web的信息资源搜索技术研究[J].烟台师范学院学报（自然科学版）,2004,20(3):185-187.
6孙霞,郑庆华.教育资源元数据语义扩展查找方法的研究[J].计算机研究与发展,2004,41(12):2170-2174. 被引量：9
7肖晓旦,陈先来.互联网信息资源组织发展趋势分析[J].高校图书馆工作,2004,24(6):19-21. 被引量：1
8文坤梅,卢正鼎,陈莉,邓曦.元搜索引擎中检索结果排序的优化方法[J].华中科技大学学报（自然科学版）,2003,31(3):49-51. 被引量：10
9谷秀岩.Web使用模式挖掘的研究[J].计算机工程与应用,2005,41(16):175-178. 被引量：9
10周明建,高济.知识管理系统中的用户视图[J].计算机辅助设计与图形学学报,2005,17(5):1101-1106. 被引量：7

同被引文献105

1徐振航,刘莉芹.XML与面向Web的数据挖掘技术[J].软件世界,2000(10):120-122. 被引量：16
2史耀馨.RDF文档解析器及查询语言的实现[J].计算机应用,2003,23(z2):146-149. 被引量：2
3林清,董占球.XML与HTML在Web环境中的应用分析[J].计算机应用,2001,21(z1):67-68. 被引量：10
4韩金山,张世英,张文泉,谭忠富,刘严.零售市场单一卖方的最优风险管理策略[J].电网技术,2004,28(13):54-59. 被引量：16
5雷云飞,黄刘生,陈国良.RDF查询语言到SQL语言的转换原理及其实现方法[J].计算机研究与发展,2004,41(7):1251-1257. 被引量：6
6何月顺,刘光萍,丁秋林.XML与面向Web的数据挖掘技术的应用研究[J].江西农业大学学报,2004,26(6):968-971. 被引量：6
7杨晴雯,周宇,李晓.WEB图形格式SVG及基于XML+XSL的动态生成技术[J].成都信息工程学院学报,2004,19(4):545-548. 被引量：3
8龚红焱,刘奕明,陈涵生.XML与数据库结合技术的探讨[J].计算机工程,2005,31(4):114-116. 被引量：25
9袁家海,丁伟,胡兆光.基于Agent的计算经济学及其在电力市场理论中的应用综述[J].电网技术,2005,29(7):47-51. 被引量：17
10宋中山,曾广平.基于XML的Web数据挖掘技术[J].中南民族大学学报（自然科学版）,2005,24(1):64-67. 被引量：7

引证文献18

1王艳,刘双红,罗慧敏.XML在Web数据抽取中的应用研究[J].郑州航空工业管理学院学报（社会科学版）,2005,24(4):150-151.
2成光.一种基于XML的WEB数据收集方法[J].农业网络信息,2005(7):40-41.
3李清茂,田昌鹏.基于自然语言查询的搜索引擎模型[J].重庆工商大学学报（自然科学版）,2005,22(5):477-480. 被引量：1
4谢维成,吕先竞,宋玉忠.基于XML的Web数据抽取模型研究(英文)[J].西华大学学报（自然科学版）,2006,25(1):82-86.
5张谦,俞集辉,张淮清,程满.基于Agent的Web数据仓库技术在发电厂报价系统中的应用[J].电网技术,2006,30(8):50-55. 被引量：1
6张冉,卡米力.毛依丁.基于XML和N层VSM的Web信息检索[J].计算机技术与发展,2006,16(5):56-58. 被引量：4
7陈景霞,张鹏伟.基于XML的Web数据挖掘模型的研究[J].情报杂志,2006,25(11):100-102. 被引量：4
8龙飞,戴牡红.WEB数据获取系统的设计与实现[J].自动化技术与应用,2006,25(12):34-36.
9张宗平,李海雁.基于XML的Web信息提取技术研究[J].现代计算机,2007,13(8):29-30. 被引量：1
10汪全莉.XML在Web数据挖掘中的应用[J].情报杂志,2008,27(5):92-93. 被引量：1

二级引证文献21

1王知津,赵洪.基于改进遗传算法的XML信息检索研究[J].图书馆杂志,2007,26(11):20-26. 被引量：2
2汪全莉.XML在Web数据挖掘中的应用[J].情报杂志,2008,27(5):92-93. 被引量：1
3陈桂鸿.普通文件和HTML文件及XML文件信息检索过程探析[J].科技情报开发与经济,2009,19(11):90-92.
4阎红灿,李敏强,任蕴丽,阎少宏.结构和内容联合提取的XML网页分类研究[J].天津大学学报（社会科学版）,2009,11(3):272-276. 被引量：2
5赵治军,陈立潮,谢斌红,王秀慧.基于VSM的OAI-PMH元数据相似度计算研究[J].计算机技术与发展,2009,19(9):119-121.
6陈乃仕,王海宁,周海明,李伟刚.协同粒子群算法在电力市场ACE仿真中的应用[J].电网技术,2010,34(2):138-142. 被引量：6
7方少卿.XML在Web数据挖掘中的应用研究[J].铜陵职业技术学院学报,2010,9(1):50-51.
8张世勇,陈运启.基于概念匹配的语义检索模型研究[J].重庆工商大学学报（自然科学版）,2010,27(5):493-499. 被引量：1
9黄淑芹.基于XML的Web数据挖掘系统模型的设计[J].通化师范学院学报,2010,31(12):35-37.
10黄国超,王衍波,黄开国.基于XSLT的XML文档信息隐藏方法研究[J].计算机技术与发展,2011,21(10):246-249.

1张茹冰,来建军.基于XML技术的WEB数据收集模型的研究[J].计算机光盘软件与应用,2011(24):121-121.
2吴谋硕.基于云计算的Web信息收集与检索过程分析[J].信息与电脑,2016,28(15):34-35. 被引量：1
3蔡利民.基于XML的Web数据收集的研究与实现[J].现代电子技术,2004,27(13):107-108.
4郑跃平,陈传峰.基于XML的WEB数据收集的一种应用[J].福建电脑,2005,21(12):1-2. 被引量：1
5王丽,曹家琏.基于Web数据挖掘的个性化搜索引擎的应用和发展趋势(英文)[J].电脑知识与技术,2009,0(4Z):2818-2819. 被引量：1
6高岩,胡静涛.Web数据挖掘的原理、方法及用途[J].现代图书情报技术,2002(3):51-53. 被引量：30
7邹芳红.Web数据挖掘与个性化搜索引擎综述[J].计算机与现代化,2007(8):44-47. 被引量：5
8高飞,谢维信.互联网上的数据挖掘[J].计算机科学,2001,28(5):81-84. 被引量：3
9张静.Web数据挖掘技术研究与应用[J].电脑知识与技术（过刊）,2010,0(15):4289-4290.
10尤超常.浅谈WEB数据挖掘[J].中国科技信息,2005(4):55-55. 被引量：4

计算机工程与应用

2004年第10期

浏览历史

内容加载中请稍等...

一个基于XML的WEB数据收集模型的研究被引量：18

参考文献11

二级参考文献19

共引文献67

同被引文献105

引证文献18

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

一个基于XML的WEB数据收集模型的研究 被引量：18

参考文献11

二级参考文献19

共引文献67

同被引文献105

引证文献18

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

一个基于XML的WEB数据收集模型的研究被引量：18