期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于LCA的高效XML关键字检索算法 被引量:4
1
作者 韩萌 陈群 王鹏 《计算机工程》 CAS CSCD 北大核心 2010年第23期59-62,共4页
以ELCA的语义为基础,分析ELCA的诸多性质,给出ELCA结果查找算法复杂度高的原因。在其基础上提出BHFA算法,包括2种实现算法BHFAI和BHFAII。该算法计算出分布在各层的LCA,根据ELCA的性质由底向上、向左向右筛选并获取结果。实验结果表明,... 以ELCA的语义为基础,分析ELCA的诸多性质,给出ELCA结果查找算法复杂度高的原因。在其基础上提出BHFA算法,包括2种实现算法BHFAI和BHFAII。该算法计算出分布在各层的LCA,根据ELCA的性质由底向上、向左向右筛选并获取结果。实验结果表明,该算法的查询性能在绝大多数情况下优于现有算法。 展开更多
关键词 XML检索算法 关键字检索 最小公共祖先
下载PDF
基于LCA分块算法的大学科研人员信息抽取 被引量:3
2
作者 易晨辉 刘梦赤 胡婕 《计算机科学与探索》 CSCD 北大核心 2016年第6期761-772,共12页
现有的半结构化网页信息抽取方法主要假设有效数据间具有较强结构相似性,将网页分割为具有类似特征的数据记录与数据区域然后进行抽取。但是存有大学科研人员信息的网页大多是人工编写填入内容,结构特征并不严谨。针对这类网页的弱结构... 现有的半结构化网页信息抽取方法主要假设有效数据间具有较强结构相似性,将网页分割为具有类似特征的数据记录与数据区域然后进行抽取。但是存有大学科研人员信息的网页大多是人工编写填入内容,结构特征并不严谨。针对这类网页的弱结构性,提出了一种基于最近公共祖先(lowest common ancestor,LCA)分块算法的人员信息抽取方法,将LCA和语义相关度强弱的联系引入网页分块中,并提出了基本语义块与有效语义块的概念。在将网页转换成文档对象模型(document object model,DOM)树并进行预处理后,首先通过向上寻找LCA节点的方法将页面划分为基本语义块,接着结合人员信息的特征将基本语义块合并为存有完整人员信息的有效语义块,最后根据有效语义块的对齐获取当前页面所有关系映射的人员信息。实验结果表明,该方法在大量真实的大学人员网页的分块与抽取中,与MDR(mining data records)算法相比仍能保持较高的准确率与召回率。 展开更多
关键词 信息抽取 最近公共祖先(lca) 基本语义块 有效语义块 关系映射
下载PDF
基于扩展查询表达式的XML关键字查询 被引量:4
3
作者 朱菁华 王晓玲 《计算机工程》 CAS CSCD 2014年第10期25-31,共7页
目前可扩展标示语言(XML)关键字查询大多是基于最小公共祖先(LCA)语义子树产生查询结果,而未能加入除LCA语义子树之外与用户查询意图相关的结果。为解决该问题,提出一种基于扩展查询表达式的XML关键字查询方法。将用户查询日志作为查询... 目前可扩展标示语言(XML)关键字查询大多是基于最小公共祖先(LCA)语义子树产生查询结果,而未能加入除LCA语义子树之外与用户查询意图相关的结果。为解决该问题,提出一种基于扩展查询表达式的XML关键字查询方法。将用户查询日志作为查询扩展统计模型,对其进行统计分析,并结合最佳检索概念判断是否需要扩展查询表达式。使用XML TF-IDF方法计算候选属性的权重,根据初检结果的上下文信息,利用聚类方法获得与查询意图最相关的扩展查询关键字,从而扩展查询表达式。实验结果表明,与XSeek和基于语义词典的查询扩展方法相比,该方法的平均F度量值分别提高了7%和17%,具有较高的查询质量。 展开更多
关键词 信息检索 可扩展标示语言 最小公共祖先语义 关键字查询 查询扩展 上下文信息
下载PDF
综合文档语义与用户查询语义的XML关键字检索 被引量:2
4
作者 黎军 熊海灵 《计算机应用》 CSCD 北大核心 2010年第11期2945-2948,共4页
为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先... 为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先改进为语义相关实体子树集来表达查询结果。实验结果表明,该方法能够有效提高关键字检索结果的查准率。 展开更多
关键词 最小最近公共祖先 查询 语义相关 实体子树集 查准率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部