一种快速的XML语义检索算法被引量：6

A Fast Semantic Search Algorithm for XML Data

下载PDF

导出

摘要传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出了一种快速的XML语义检索算法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显示出新算法的有效性. Traditional keyword-based search engine does not consider the additional information provided by the structure of XML documents,it returns imprecise results often;searching according to keywords and structure information of XML documents inputted is not suitable for contain users.Semantic search for XML data based on tag-keywords overcomes the limitations above, but its efficiency needs to be improved.This paper analyzes semantic information provided by the structure of XML documents deeply.It puts forward a new index structure for XML data and semantic related decision function between two nodes.Based on this,it proposes a fast semantic search algorithm for XML data.The search algorithm reduces the times to decide semantic correlation greatly.The experimental results with real data sets illustrate the effectiveness of the proposed algorithm.

作者李新叶苑津莎

机构地区华北电力大学电子与通信工程系

出处《电子学报》 EI CAS CSCD 北大核心 2007年第11期2220-2225,共6页 Acta Electronica Sinica

关键词 XML文档语义检索索引结构信息检索 XML document semantic search index structure information retrieval

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Theobald,G Weikum. The index-based XXL search engine for querying XML data with relevance ranking[A]. 8th Internalional Conference on Extending Database Technology (EDBT) [ C] .Prague: Springer-Verlag, 2002.477-495.
2吴劲,陈泽琳.基于部分匹配的XML文本文档向量检索模型[J].电子学报,2002,30(12A):2169-2171. 被引量：6
3王晓燕,王海洋,洪晓光.自行调整粒度的XML向量空间检索[J].武汉大学学报（理学版）,2004,50(5):609-613. 被引量：3
4王海波,姜吉发,耿晖,白硕,祝明发.XML搜索引擎研究[J].计算机应用研究,2001,18(4):68-71. 被引量：40
5郭永民.XML文档检索技术研究[D].太原:太原理工大学,2003.
6Sara Cohen, Jonathan Mamou, et al. XSEarch: a semantic search engine for XML [ A]. Proceedings of the 29th VLDB Conference[ C]. Berlin : Morgan Kaufmann Publishers, 2003. 45-56.
7ACM SIGMOD. Available Products[ DB/OL]. http://www. acre. org/sigraod/record/xml, 2006-12-01/2007-3-10.

二级参考文献19

1[1]XML and Search[EB/OL]. http://www.searchtools.com/related/ xml.html.
2[2]Goxml[EB/OL]. http://www.goxml.com.
3[3]Dongwook Shin, Hyuncheol Jang, Hongglan Jin. BUS: An Effective Indexing and Retrieval Cheme in Structured Documents[Z].
4[4]Roy Goldman, JasonMcHugh, Jennifer Widom. From Semi-structured Data to XML: Migrating the Lore DataModel and Query Language[Z].
5[5]Alin Deutsch, Mary Fernandez, Daniela Florescu. A Query Language for XML[C]. The Eighth International World Wide Web Conference.
6[6]Guidelines for Robot Writers[EB/OL]. Http://info. Webcrawler.com/mak/projects/robots/robots.html.
7[7]Extensible Markup Language (XML)[EB/OL]. Http://www.w3 .org/XML/.
8[8]Jon Bosak, Sun Microsystems. XML, Java, and the Future of the Web[Z].
9Theobald A,Weikem G. Adding Relevance to XML[A].Proceedings of 3rd International Workshop on Web and Database[C]. London: Springer-Verlag, 2000.105-124.
10Fuhr N,Grobjohann K. XIRQL:A Query Language for Information Retrieval in XML Documents[A]. Proceedings of the 24th Annual International Conference on Research and development in Information Retrieval[C]. New York: ACM Press, 2001.172-180.

共引文献44

1吴刚,唐杰,李涓子,王克宏.细粒度语义网检索[J].清华大学学报（自然科学版）,2005,45(S1):1865-1872. 被引量：11
2倪丽萍,张维勇,金麒.XML搜索引擎技术的实现与探讨[J].合肥工业大学学报（自然科学版）,2004,27(7):774-777. 被引量：1
3王彤.基于XML技术的报业数字资产管理系统[J].情报理论与实践,2004,27(4):430-432.
4李骥,陈福生.Native-XML数据库综述[J].计算机工程与设计,2004,25(6):932-934. 被引量：17
5史艳,李伟生.基于XML的搜索引擎技术的研究与设计[J].计算机工程与设计,2004,25(9):1488-1491. 被引量：10
6张明,王煜,杨敬伟,袁方,赵红,石强.基于Ontology的智能信息检索研究[J].河北大学学报（自然科学版）,2005,25(5):561-566. 被引量：3
7尹隽,翁翔,黄贤勇.企业ERP集成数据的联机搜索框架及实现模型[J].企业技术开发,2005,24(12):12-14.
8谢红侠,惠正运.一种面向文档的XML的索引查询方法[J].微机发展,2005,15(12):24-26. 被引量：1
9窦玉萌,王孟龙.面向语义Web的搜索引擎构想[J].情报探索,2006(7):56-58.
10何东彬,王俊义.XML文档检索技术研究[J].内蒙古大学学报（自然科学版）,2006,37(5):574-579. 被引量：3

同被引文献56

1汪锦岭,金蓓弘,李京.一种高效的RDF图模式匹配算法[J].计算机研究与发展,2005,42(10):1763-1770. 被引量：13
2孔令波,唐世渭,杨冬青,王腾蛟,高军.XML数据索引技术[J].软件学报,2005,16(12):2063-2079. 被引量：55
3赵军,金千里,徐波.面向文本检索的语义计算[J].计算机学报,2005,28(12):2068-2078. 被引量：28
4孔令波,唐世渭,杨冬青,王腾蛟,高军.XML数据的查询技术[J].软件学报,2007,18(6):1400-1418. 被引量：72
5Xu J X,Croft W B.Query expansion using local and global document analysis[C]//Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.Zurich,Switzerland,1996:4-11.
6Leacock C,Chodorow M.Combining local context and wordnet similarity for word sense identification in WordNet:An Electronic Lexical Database[M]//Christiane Fellbaum,ed.MIT Press,1998,265-283.
7http://wordnet.princeton.edu/linksJHJ.NET.
8Xu Y,Papakonstantinou Y.Efficient Keyword Search for Smallest LCAs in XML Databases[C]//Proceedings of SIGMOD' 2005.Baltimore,Maryland,USA.
9Tran T,Wang H,Rudolph S,et al.Top-k Exploration of Query Candidates for Efficient Keyword Search on Graph-Shaped (RDF)Data[C]//ICDE.2009:405-416.
10Baeza-Yates R,Ribeiro-Neto B.Modern Information Retrieval[M].NewYork:Addison-Wesley-Longman,1999.

引证文献6

1林馨,任仲晟.一种新的XML信息检索索引[J].福建电脑,2008,24(9):118-119.
2王昭龙,李霞,许瑞芳.多关键字查询中LCA剪枝概念树的查询扩展技术研究[J].计算机科学,2010,37(4):132-135. 被引量：4
3叶育鑫,欧阳丹彤.混合语义约简和选择估值优化SPARQL[J].电子学报,2010,38(5):1205-1210. 被引量：5
4曾新红,黄华军,林伟明.超大型中文叙词表本体的检索与推理研究[J].现代图书情报技术,2010(7):58-65. 被引量：2
5YANG Yuehua DU Junping HE Bowei.A Novel Ontology-Based Semantic Retrieval Model for Food Safety Domain[J].Chinese Journal of Electronics,2013,22(2):247-252. 被引量：7
6陈桦,杨威,刘宝龙.细粒度XML数字签名的上下文参考完整性研究[J].计算机技术与发展,2016,26(7):100-103.

二级引证文献18

1王水利,黄广君,霍亚格.基于语义分析的查询扩展方法[J].计算机工程,2011,37(16):77-79. 被引量：7
2杨清琳,李陶深,农健.基于领域本体知识库的语义查询扩展[J].计算机工程与设计,2011,32(11):3853-3856. 被引量：7
3徐雷.SPARQL查询优化[J].现代图书情报技术,2012(10):42-48. 被引量：4
4欧阳柳波,邹北骥,刘丽杰.一种基于混合判定模型的复合概念抽取方法[J].电子学报,2013,41(3):488-495. 被引量：3
5林培金,曹苏燕,应捷.基于领域本体的语义合成研究[J].计算机技术与发展,2013,23(7):44-47.
6JIANG Yang,FENG Zhiyong,WANG Xin.A Multikey Rank Model Based on Ontology for Large-Scale Semantic Data[J].Chinese Journal of Electronics,2014,23(1):119-123. 被引量：1
7褚衍杰,魏强,李云照.基于关键词语义与作用域扩展的事件检测[J].计算机工程,2014,40(8):273-276. 被引量：2
8董书暕,汪璟玢.HMSST:一种高效的SPARQL查询优化算法[J].计算机科学,2014,41(B11):323-326. 被引量：4
9黄华军,曾新红,林伟明,陈若韵.中文知识组织系统形式化语义描述标准体系研究(二)--分类法共享服务系统CLSS研究与实现[J].中国图书馆学报,2015,41(2):17-28. 被引量：8
10马永军,杨海波.一种融合本体和最小二乘支持向量机的主题爬行方法[J].天津科技大学学报,2015,30(3):72-77. 被引量：2

1沈剑沧,鲍培明.XML查询方法的设计与研究[J].计算机工程,2007,33(21):63-65. 被引量：3
2王志军,郭学俊.基于本体的XML语义集成研究[J].计算机技术与发展,2006,16(8):57-59. 被引量：3
3尹辉增,黄全义,巢佰崇.XML在统计地理信息Wed发布中的应用[J].地理空间信息,2005,3(3):39-41.
4李华昱,欧阳纯萍,徐九韵.基于领域本体和关系模型的XML语义集成方法[J].计算机应用,2011,31(12):3258-3263. 被引量：3
5赵磊,李国和,马现峰.基于支持向量机的地层识别研究[J].计算机工程与应用,2006,42(35):230-232. 被引量：4
6张媛,龚伟.基于RDF本体的XML数据集成框架[J].硅谷,2008,1(22):41-41.
7刘敏娟,于景茹,张西芝.一种基于网格密度的聚类算法[J].软件导刊,2012,11(12):56-57.
8崔婉秋,李昕,孟祥福,崔岩,王大伟.XML中支持top-k的关键字查询方法研究[J].辽宁工业大学学报（自然科学版）,2016,36(3):144-149.
9周娜,常义林,姜艳平.人眼定位及其在视频会议中的应用[J].北京电子科技学院学报,2008,16(2):49-51.
10郑延斌,李国和.支持向量机在地层识别中的应用[J].河南师范大学学报（自然科学版）,2009,37(2):37-39. 被引量：7

电子学报

2007年第11期

浏览历史

内容加载中请稍等...

一种快速的XML语义检索算法被引量：6

参考文献7

二级参考文献19

共引文献44

同被引文献56

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

一种快速的XML语义检索算法 被引量：6

参考文献7

二级参考文献19

共引文献44

同被引文献56

引证文献6

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

一种快速的XML语义检索算法被引量：6