期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
XML信息检索中最小子树根节点问题的分层算法 被引量:23
1
作者 孔令波 唐世渭 +2 位作者 杨冬青 王腾蛟 高军 《软件学报》 EI CSCD 北大核心 2007年第4期919-932,共14页
最小子树根节点问题(smallest lowest common ancestor,简称SLCA)是实现XML信息检索研究中关键字查询的一个基本问题,其主旨就是求解所有包含给定关键字的紧致子树的根节点.XU等人给出了3种算法—基于索引的搜索算法(indexed lookup eag... 最小子树根节点问题(smallest lowest common ancestor,简称SLCA)是实现XML信息检索研究中关键字查询的一个基本问题,其主旨就是求解所有包含给定关键字的紧致子树的根节点.XU等人给出了3种算法—基于索引的搜索算法(indexed lookup eager,简称ILE)、基于堆栈的算法以及基于扫描的算法(scan eager,简称SE),并通过实验证明ILE算法具有最好的表现.与基于B+树索引结构的ILE算法不同,所给出的新算法,称为LISA(layered intersection scan algorithm)方法.该方法基于SLCA节点按“层”分布的规律,采取了逐层求解SLCA节点的思路,即在获取了包含关键字的节点的Dewey码集合后,通过计算对应于不同关键字、不同层次的Dewey码前缀集合的交集,可以得到对应不同层的SLCA节点.与ILE相比,LISA除了只需对应于关键字的节点集合信息以外,不再需要其他复杂的辅助数据结构——全部的信息只是对应不同关键字的Dewey码集合以及排序操作.同时,给出了两种实际的算法:LISAI和LISAII,二者的区别在于是否采用Dewey编码到整数的转换.其中,LISAII更具有满意的性能. 展开更多
关键词 xml索引 DEWEY编码 xml信息检索 关键字查询 SLCA ILE
下载PDF
XML信息检索中基于反馈的查询扩展分析 被引量:1
2
作者 鲁远 余宏 王芳 《科技广场》 2012年第6期139-143,共5页
XML信息检索中,提高检索准确率的有效途径就是基于反馈机制的用户查询扩展。根据反馈机制的不同,文章对国内外研究XML查询扩展的文献进行了分类分析,重点分析、比较了几篇有影响文献的扩展方法和实验结果。在深入分析的基础上提出了当... XML信息检索中,提高检索准确率的有效途径就是基于反馈机制的用户查询扩展。根据反馈机制的不同,文章对国内外研究XML查询扩展的文献进行了分类分析,重点分析、比较了几篇有影响文献的扩展方法和实验结果。在深入分析的基础上提出了当前研究中存在的几点不足,并对未来的研究工作作出了一些简单的预测和展望。 展开更多
关键词 xml信息检索 反馈 查询扩展
下载PDF
基于词项扩展的XML信息检索反馈技术 被引量:2
3
作者 温馨 陈群 娄颖 《计算机工程》 CAS CSCD 北大核心 2011年第20期36-38,共3页
为提高XML信息检索的查询准确率,提出一种基于词项扩展的XML信息检索反馈技术。利用词项所在节点的语义权重、词项与查询词间的相邻频度、共现程度,评估词项权重并排序,取权重较大的词项对初始检索词进行扩展,给出各因子的计算方法。在W... 为提高XML信息检索的查询准确率,提出一种基于词项扩展的XML信息检索反馈技术。利用词项所在节点的语义权重、词项与查询词间的相邻频度、共现程度,评估词项权重并排序,取权重较大的词项对初始检索词进行扩展,给出各因子的计算方法。在Wikipedia2009数据集上的实验结果表明,扩展后的查询准确率较高。 展开更多
关键词 xml信息检索 词项扩展 反馈 语义权重 相邻频度
下载PDF
基于四层贝叶斯网络的XML文档信息检索模型 被引量:1
4
作者 章小龙 衡星辰 《计算机应用》 CSCD 北大核心 2009年第10期2791-2795,共5页
提出了一种新的基于贝叶斯网络对XML文档信息进行查询的模型方法。该模型支持针对XML文档信息的结构化查询。基于XML信息查询的特点,利用XML数据集中语词、元素和结构化单元的统计信息对模型的拓扑结构和条件概率进行了学习;结合概率函... 提出了一种新的基于贝叶斯网络对XML文档信息进行查询的模型方法。该模型支持针对XML文档信息的结构化查询。基于XML信息查询的特点,利用XML数据集中语词、元素和结构化单元的统计信息对模型的拓扑结构和条件概率进行了学习;结合概率函数的方法,利用模型的概率推理进程对XML文档和结构化查询条件的相关度进行了估算。最后在基于INEX测试集的实验中证明了该方法的有效性和可靠性。 展开更多
关键词 贝叶斯网络 xml信息检索 结构化查询 概率函数
下载PDF
信息检索新技术解析 被引量:4
5
作者 朱永海 《现代教育技术》 CSSCI 2007年第4期80-82,57,共4页
本文结合了计算机科学技术的发展,分析了基于XML的、基于多语言的、基于(多媒体)内容的、基于自然语言(智能)以及基于智能代理的信息检索新技术,并着重指出了它们的工作过程和原理。
关键词 基于xml信息检索新技术 基于多语言的信息检索新技术 多媒体信息检索 智能信息检索 基于智能代理的信息检索 信息检索
下载PDF
浅析语义Web在信息检索中的研究与实现 被引量:1
6
作者 许红梅 《十堰职业技术学院学报》 2010年第2期107-109,共3页
语义Web是未来web的发展方向,是信息可以被机器理解和使用的新的信息环境,语义Web的出现彻底改变了web上信息的组织方式,对于各种网络信息应用都将产生巨大影响。本文首先对Semantic Web的概况进行了简要介绍,然后详细分析了语义Web体... 语义Web是未来web的发展方向,是信息可以被机器理解和使用的新的信息环境,语义Web的出现彻底改变了web上信息的组织方式,对于各种网络信息应用都将产生巨大影响。本文首先对Semantic Web的概况进行了简要介绍,然后详细分析了语义Web体系的主要支持技术(XML RDF),最后探讨了语义Web技术对网络信息检索的影响。 展开更多
关键词 语义WEB 网络信息检索xml RDF
下载PDF
基于Nutch的XML网站全文搜索引擎实现 被引量:5
7
作者 吴敏琦 丁岳伟 《计算机工程》 CAS CSCD 北大核心 2008年第15期95-96,107,共3页
普通搜索引擎的网页抓取程序只能理解常见HTML标签,无法对XML网站的内容做有效解析。该文建立一个包含动态自定义标签的纯XML网站,提出借助XSL样式信息帮助网页抓取程序理解XML网页标签含义的方案,实现了基于Nutch的XML网站全文搜索引擎。
关键词 xml信息检索 可扩展样式表语言转换 基于Nutch的搜索引擎
下载PDF
基于用户相关反馈的带结构语义的XML查询词扩展 被引量:2
8
作者 万常选 鲁远 《情报学报》 CSSCI 北大核心 2009年第3期382-388,共7页
在XML文档的信息检索中,检索质量不高的一个主要原因是用户难以提出准确描述其查询意图的查询表达式,而查询扩展技术被认为是可以帮助用户构建符合其查询意图的查询表达式。本文在XML信息检索中提出了基于用户相关反馈的查询扩展技术,... 在XML文档的信息检索中,检索质量不高的一个主要原因是用户难以提出准确描述其查询意图的查询表达式,而查询扩展技术被认为是可以帮助用户构建符合其查询意图的查询表达式。本文在XML信息检索中提出了基于用户相关反馈的查询扩展技术,在查询扩展中除了考虑词频因素外还充分考虑了XML文档的结构特点对于扩展查询词选取的影响,包括文档中元素的语义权重、元素所在层次和词项与初始查询词间的距离因素对于扩展查询词选取的影响。实验证明本方法是可行的,且能较好地提高检索结果的准确率。 展开更多
关键词 xml信息检索 查询扩展 相关反馈 结构语义
下载PDF
XML文档处理子系统的设计 被引量:1
9
作者 刘康珍 肖和平 阳国贵 《计算机应用与软件》 CSCD 北大核心 2008年第6期116-119,共4页
在某大型软件系统中,采用XML来表示多种不同格式的文书和其它信息,能够大大简化系统编程接口和加快信息交流共享。XML文档处理子系统是该大型软件系统的重要组成部分,为其他子系统提供高效存储处理各种信息的统一接口。从XML文档映射模... 在某大型软件系统中,采用XML来表示多种不同格式的文书和其它信息,能够大大简化系统编程接口和加快信息交流共享。XML文档处理子系统是该大型软件系统的重要组成部分,为其他子系统提供高效存储处理各种信息的统一接口。从XML文档映射模式的相关研究开始,在XML文档处理子系统的设计中提出了一种简单高效的XML文档到关系数据库的映射模式,有效提高了系统处理XML文档的速度。 展开更多
关键词 xml 模式映射 xml信息检索 xml文档更新
下载PDF
基于相关性排序改进的ALCA算法
10
作者 马振华 陈群 《科学技术与工程》 2010年第9期2108-2113,共6页
XML已经广泛的应用于多个领域。基于关键字检索的搜索引擎在商业上获得了巨大的成功。基于相关性进行XML信息检索,将相关性高的结果排在靠前的位置,直接关系到检索质量和用户的满意度。现有的ALCA算法效率较高,但未基于相关性对结果进... XML已经广泛的应用于多个领域。基于关键字检索的搜索引擎在商业上获得了巨大的成功。基于相关性进行XML信息检索,将相关性高的结果排在靠前的位置,直接关系到检索质量和用户的满意度。现有的ALCA算法效率较高,但未基于相关性对结果进行排序。在该算法的基础上增加相关性排序方法,先按根结点中是否包含关键字将所有结果分成相关性不同的两个等级,然后再分别对两个等级的结果排序。结果片段与用户信息需求的相关性是由其中的元素、属性和文本结点的总贡献决定的。实验结果表明改进后的算法取得了较好的排序有效性。 展开更多
关键词 xml信息检索 关键字查询 用户信息需求 最小共同祖先(Lowest COMMON Ancestor ALCA) 相关性排序
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部