基于较高质量扩展源和局部词共现模型的XML查询词扩展

XML Query Expansion Based on High Quality Expansion Source and Local Word Co-occurrence Model

下载PDF

导出

摘要查询词扩展要解决两个方面的问题:一是扩展词的来源,二是如何在来源集合里挑选扩展词项。对此,首先利用检索结果聚类和排序模型获取了较高质量的相关文档集合,并以此作为扩展源;然后结合XML文档的特点,通过词项间的局部共现特征进行查询扩展。相关实验结果表明,一方面,所采用的检索结果聚类和排序模型的相关文档集扩展源具有较高的用户查询相关性,相比传统的伪反馈扩展源,具有更高的质量;另一方面,提出的结合了XML结构特点的词共现查询扩展方案能获得与用户查询意图相关的扩展信息,与初始查询和无结构的词项扩展方法相比,所提方法能够更有效地提高搜索引擎检索性能。 The two problems should be solved in query expansion.One is the origin of the expanded terms and the other is to select appropriate expanded terms from the expansion source.Therefore,this paper proposed query expansion method,in which the high quality relevant documents set is firstly obtained based on xml search results clustering and ranking model and it is regarded as the expansion source,and then the local word co-occurrence model combing xml documents structure features is applied to select the expanded query.The experimental data have proved two sides.On the one hand,the proposed expansion source acquisition method has obtained more relevant documents and the source has higher quality than those of traditional pseudo relevant feedback.On the other hand,compared to original query and no structure method,the selected expanded terms based on local word co-occurrence with XML structural features are more relevant to user＇s query intension and lead to good performance in retrieval.

作者钟敏娟万常选刘德喜廖述梅焦贤沛

机构地区江西财经大学信息管理学院江西财经大学数据与知识工程江西省高校重点实验室

出处《计算机科学》 CSCD 北大核心 2014年第4期200-204,214,共6页 Computer Science

基金国家自然科学基金(61173146 61262035 61363039 71361012) 国家社会科学基金(12CTQ042) 江西省教育厅科技项目(GJJ11729 GJJ12734)资助

关键词 XML查询扩展扩展源词共现 XML结构 XML query expansion Expansion source Word co-occurrence model XML structural feature

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1丁国栋,白硕,王斌.一种基于局部共现的查询扩展方法[J].中文信息学报,2006,20(3):84-91. 被引量：44
2万常选,鲁远.基于权重查询词的XML结构查询扩展[J].软件学报,2008,19(10):2611-2619. 被引量：21
3黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J].软件学报,2009,20(7):1854-1865. 被引量：70
4钟敏娟.基于内容与结构语义相融合的XML检索结果聚类[J].情报学报,2012,31(5):515-525. 被引量：5
5蒲强,何大庆,杨国纬.一种基于统计语义聚类的查询语言模型估计[J].计算机研究与发展,2011,48(2):224-231. 被引量：3

二级参考文献61

1宋玲丽,成颖.相关反馈技术中的检索词排序算法[J].现代图书情报技术,2004(8):44-47. 被引量：2
2霍华,冯博琴,赵深深.基于多查询数据融合和正相关反馈的检索算法[J].西安交通大学学报,2005,39(8):820-823. 被引量：4
3李剑波,李小华.基于XML的反馈式信息检索系统研究[J].情报杂志,2005,24(10):72-74. 被引量：4
4曹华梁,朱星,俞勇.适用于P2P的系统查询扩展优化方法[J].上海交通大学学报,2005,39(10):1706-1710. 被引量：5
5李小华.一种带反馈的XML信息检索系统设计与研究[J].厦门理工学院学报,2006,14(1):33-36. 被引量：3
6吕碧波,赵军.基于相关文档池建模的查询扩展[J].中文信息学报,2006,20(3):78-83. 被引量：7
7丁国栋,白硕,王斌.一种基于局部共现的查询扩展方法[J].中文信息学报,2006,20(3):84-91. 被引量：44
8岳文,陈治平,林亚平.基于查询扩展和分类的信息检索算法[J].系统仿真学报,2006,18(7):1926-1929. 被引量：10
9孔令波,唐世渭,杨冬青,王腾蛟,高军.XML数据的查询技术[J].软件学报,2007,18(6):1400-1418. 被引量：72
10Ponte J, Croft W B. A language modeling approach to information retrieval [C]//Proc of the 21st ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 1998.

共引文献130

1黄子越,万常选.XML检索中基于聚类的查询词扩展[J].电子科技大学学报,2009,38(S1):29-33. 被引量：1
2黄名选,严小卫.基于查询语义树的语义查询扩展研究[J].情报理论与实践,2007,30(6):844-846. 被引量：4
3夏磊,周竹荣.基于互信息的问句语义扩展研究[J].计算机工程与设计,2008,29(1):163-166. 被引量：3
4李卫疆,赵铁军,王宪刚.基于统计机器翻译模型的查询扩展[J].电子与信息学报,2008,30(3):725-729. 被引量：2
5李卫疆,Zhao,Tiejun,Wang,Xian＇gang.A new approach to query expansion in information retrieval[J].High Technology Letters,2008,14(1):77-80. 被引量：2
6黄名选,黄发良.一种基于词间关联规则挖掘的查询扩展方法[J].图书情报工作,2008,52(3):132-134. 被引量：2
7王宝勋,王晓龙,刘秉权,李鹏.一种基于无监督学习的词变体识别方法[J].中文信息学报,2008,22(3):32-36. 被引量：3
8崔骏,张选平,高由兵.基于概念格的查询扩展词推荐[J].微电子学与计算机,2008,25(5):158-160. 被引量：1
9万常选,鲁远.基于权重查询词的XML结构查询扩展[J].软件学报,2008,19(10):2611-2619. 被引量：21
10黄名选,张师超.一种有效的信息检索模型[J].计算机应用研究,2008,25(8):2345-2348. 被引量：1

1刘金岭.基于查询词扩展的中文垃圾短信检索[J].计算机工程,2011,37(8):52-54. 被引量：6
2王海云,刘金岭.基于查询词扩展的文本检索算法研究[J].计算机与数字工程,2011,39(6):15-17. 被引量：1
3王军,史科,王辉.垃圾邮件过滤中特征选择方法研究[J].合肥工业大学学报（自然科学版）,2009,32(12):1863-1866. 被引量：2
4张振伦.应用云化还是云化应用?[J].软件和信息服务,2015(5).
5张蓉.扩展源自创新：艾默生推出创新技术扩展PlantWeb功能[J].流程工业,2006(1):17-17.
6技术[J].保密科学技术,2014(7):73-73.
7王磊,黄广君.结合概念语义空间的语义扩展技术研究[J].计算机工程与应用,2012,48(35):106-109. 被引量：7
8黄子越,万常选.XML检索中基于聚类的查询词扩展[J].电子科技大学学报,2009,38(S1):29-33. 被引量：1
9李晶,顾国强.一种改进的FCM检索结果聚类算法研究[J].软件产业与工程,2014(5):39-41.
10毛琪,黄永峰.基于网络知识库与通用搜索引擎的查询词扩展方法[J].计算机应用,2012,32(A02):5-9. 被引量：1

计算机科学

2014年第4期

浏览历史

内容加载中请稍等...

基于较高质量扩展源和局部词共现模型的XML查询词扩展

参考文献5

二级参考文献61

共引文献130

相关作者

相关机构

相关主题

浏览历史