XML搜索引擎研究被引量：2

A Survey on XML Search Engines

导出

摘要首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。 As an extensible markup language, XML has its advantages that HTML can＇t match. XML not only can support the mark which is defined by users, but can express semantics, which makes it possible to improve the accuracy of retrieval on the Internet. The paper firstly analyzes the reasons that the traditional search engine does not have a high accuracy ratio of inquiries, then introduces the current situation of the XML and XML search engine, and makes a thorough discussion on the key technique of XML search engines, such as document storage, index and query. Based on the analysis, a model of XML search engine is designed under the present network environment. Taking full advantage of the DTD pattern information of the XML documcnts, the research model can significantly enhance the accuracy ratio of inquiries.

作者陈金森原福永张园园

机构地区燕山大学信息科学与工程学院

出处《图书情报工作》 CSSCI 北大核心 2007年第1期114-117,121,共5页 Library and Information Service

关键词 XML 搜索引擎数据库索引查询信息检索 XML search engine database index query information retrieval

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1史艳,李伟生.基于XML的搜索引擎技术的研究与设计[J].计算机工程与设计,2004,25(9):1488-1491. 被引量：10
2曲卫民,孙乐,孙玉芳.半结构化中文信息检索中查询结果相关度算法的研究[J].中文信息学报,2004,18(4):15-22. 被引量：2
3Fuhr N, Grossjohann K. XIRQL: An XML query language based on information retrieval concepts. ACM Transactions on Information Systems, 2004,22(2):313-356
4吴劲,陈泽琳.基于部分匹配的XML文本文档向量检索模型[J].电子学报,2002,30(12A):2169-2171. 被引量：6
5Wang J T-L, Liu J H, Wang J H. XML clustering and retrieval through principal component analysis. International Journal on Artificial Intelligence Tools, 2005,14(4):683-699
6邓志鸿,唐世渭,杨冬青,张铭.基于XML的本体表示和检索技术的研究[J].计算机工程与应用,2002,38(3):14-15. 被引量：11
7Bourret R. XML and Database.[2006-02-15].http://www.rpbourret.com/xml/XML And Databases.htm
8刘振中,董道国,薛向阳.对XML数据索引的回顾[J].计算机科学,2004,31(4):78-83. 被引量：4
9孔令波,唐世渭,杨冬青,王腾蛟,高军.XML数据索引技术[J].软件学报,2005,16(12):2063-2079. 被引量：55
10王齐,陶世群.一种基于文本节点的XML文档索引[J].山西大学学报（自然科学版）,2005,28(2):142-146. 被引量：2

二级参考文献82

1王静,孟小峰,王珊.基于区域划分的XML结构连接[J].软件学报,2004,15(5):720-729. 被引量：35
2孟小峰,周龙骧,王珊.数据库技术发展趋势[J].软件学报,2004,15(12):1822-1836. 被引量：176
3[1]XML and Search[EB/OL]. http://www.searchtools.com/related/ xml.html.
4[2]Goxml[EB/OL]. http://www.goxml.com.
5[3]Dongwook Shin, Hyuncheol Jang, Hongglan Jin. BUS: An Effective Indexing and Retrieval Cheme in Structured Documents[Z].
6[4]Roy Goldman, JasonMcHugh, Jennifer Widom. From Semi-structured Data to XML: Migrating the Lore DataModel and Query Language[Z].
7[5]Alin Deutsch, Mary Fernandez, Daniela Florescu. A Query Language for XML[C]. The Eighth International World Wide Web Conference.
8[6]Guidelines for Robot Writers[EB/OL]. Http://info. Webcrawler.com/mak/projects/robots/robots.html.
9[7]Extensible Markup Language (XML)[EB/OL]. Http://www.w3 .org/XML/.
10[8]Jon Bosak, Sun Microsystems. XML, Java, and the Future of the Web[Z].

共引文献207

1严彩梅.Web智能信息检索体系结构的研究[J].计算机应用研究,2002,19(11):51-52. 被引量：3
2王鑫,袁晓洁,李楠.Native XML数据库的增量式验证[J].计算机研究与发展,2006,43(z3):424-429.
3詹雅静.浅谈学校学籍管理系统的设计和实现[J].内蒙古科技与经济,2005(z1):151-152. 被引量：1
4吴刚,唐杰,李涓子,王克宏.细粒度语义网检索[J].清华大学学报（自然科学版）,2005,45(S1):1865-1872. 被引量：11
5倪丽萍,张维勇,金麒.XML搜索引擎技术的实现与探讨[J].合肥工业大学学报（自然科学版）,2004,27(7):774-777. 被引量：1
6秦春磊.基于XML工作流督办软件的开发及应用[J].科技信息,2008(27).
7周理,刘琰.XRes:基于关键字的XML查询引擎[J].科技资讯,2007,5(35):88-89.
8王知津,赵洪.基于改进遗传算法的XML信息检索研究[J].图书馆杂志,2007,26(11):20-26. 被引量：2
9谌志群,周其力.基于综合语义的XML文档相似度计算方法[J].杭州电子科技大学学报（自然科学版）,2009,29(3):64-67.
10乔磊,石冰,赵林.TF&B索引:一种基于结构摘要思想的时态XML索引[J].计算机研究与发展,2007,44(z3):402-407.

同被引文献8

1秦鸿.基于Web的数据挖掘[J].电子科技大学学报,2002,31(S1):56-59. 被引量：7
2印鉴,陈忆群,张钢.搜索引擎技术研究与发展[J].计算机工程,2005,31(14):54-56. 被引量：53
3熊一利,徐鹏.基于XML的网页数据挖掘[J].科技广场,2010(1):73-75. 被引量：2
4钱程,阳小兰.HTML到XML转换研究[J].计算机与现代化,2011(8):39-41. 被引量：2
5李霞,蒋盛益.基于DOM树及行文本统计去噪的网页文本抽取技术[J].山东大学学报（理学版）,2012,47(3):38-42. 被引量：4
6李龙,李丽丽,高玲.一种网络课程答疑系统分词器的设计[J].河北工程大学学报（自然科学版）,2012,29(2):68-70. 被引量：1
7余静,刘万军.基于网页分块的主题爬虫研究[J].计算机与信息技术,2008(10):83-84. 被引量：1
8黄磊,黄汉永.XML技术在Web挖掘中的应用[J].信息技术,2003,27(5):6-7. 被引量：2

引证文献2

1胡双双,秦杰.搜索引擎技术及其发展趋势[J].福建电脑,2008,24(6):32-33. 被引量：2
2卢远征,叶晓彤.XML的DOM树结构在WEB挖掘中的应用[J].四川理工学院学报（自然科学版）,2013,26(3):64-67. 被引量：2

二级引证文献4

1李青.基于云安全的DNS网页挂马探测系统分析与设计[J].软件导刊,2011,10(3):146-148. 被引量：1
2王宏旭,董广民.基于云计算与多扫描引擎技术构建DNS网页挂马过滤系统分析与设计[J].信息通信,2011(5):85-86.
3谢娜,戚晓明,朱洪浩,郭有强.半结构化多Web文本数据挖掘的研究[J].齐齐哈尔大学学报（自然科学版）,2015,31(2):75-78. 被引量：3
4刘耀钦.基于HTML5的Web离线应用研究与探讨[J].河南工程学院学报（自然科学版）,2015,27(1):77-80. 被引量：4

1王海波,姜吉发,耿晖,白硕,祝明发.XML搜索引擎研究[J].计算机应用研究,2001,18(4):68-71. 被引量：40
2李小华.一种带反馈的XML信息检索系统设计与研究[J].厦门理工学院学报,2006,14(1):33-36. 被引量：3
3史艳,李伟生.基于XML的搜索引擎技术的研究与设计[J].计算机工程与设计,2004,25(9):1488-1491. 被引量：10
4廖小飞,李津生,洪佩琳,薛开平.一种基于移动代理技术的类应用层组播的搜索引擎模型[J].应用科学学报,2007,25(1):51-56.
5徐德智,吴敏,陆文彦.基于Agent的专业搜索引擎的研究和构造[J].计算机工程,2002,28(10):99-101. 被引量：9
6徐荣国,陆晓希.高效搜索引擎的模型设计与算法实现[J].柳州职业技术学院学报,2008,8(4):79-81.
7尹桂秀.XML搜索引擎探微[J].图书情报工作,2002,46(3):70-73. 被引量：3
8宋向伟,盖立起.一种基于后控词表的XML搜索引擎[J].医学情报工作,2006,27(1):20-22.
9张功耀,黄水松,汪小栋.基于多Agent的搜索引擎模型[J].计算机工程与设计,2002,23(10):65-67. 被引量：10
10魏毅峰,张亮.基于本体的搜索引擎模型设计[J].软件导刊,2010,9(7):118-119. 被引量：1

图书情报工作

2007年第1期

浏览历史

内容加载中请稍等...

XML搜索引擎研究被引量：2

参考文献15

二级参考文献82

共引文献207

同被引文献8

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

XML搜索引擎研究 被引量：2

参考文献15

二级参考文献82

共引文献207

同被引文献8

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

XML搜索引擎研究被引量：2