期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于实体的文本数据与XML文档的匹配技术研究
1
作者 刘木强 杨卫东 《小型微型计算机系统》 CSCD 北大核心 2015年第11期2473-2478,共6页
目前飞机企业等单位的大量数据采用XML格式存储,且与其它业务文本数据之间缺乏联系.在异构数据集成领域,文本数据与XML文档的模式匹配还较少有人关注.提出文本数据与XML文档的匹配方法,该匹配方法采用两阶段的算法,首先使用基于条件随... 目前飞机企业等单位的大量数据采用XML格式存储,且与其它业务文本数据之间缺乏联系.在异构数据集成领域,文本数据与XML文档的模式匹配还较少有人关注.提出文本数据与XML文档的匹配方法,该匹配方法采用两阶段的算法,首先使用基于条件随机场的实体抽取算法从文本文档中提取实体信息,然后通过基于实体的最近语义片段(ECSF)检索算法在XM L树中查询覆盖所有实体及实例的最近语义片段作为匹配对象.ECSF检索算法中基于实体的最近语义片段含义是XM L树上的覆盖所有实体及实例信息的最小子树,且实例所对应的实体必须是该实例的祖先节点.最后通过实验验证了本文提出方法的可行性和有效性,且具有较好的匹配效果,包括召回率和准确率. 展开更多
关键词 XML 匹配技术 实体抽取 基于实体的最近语义片段 ECSF
下载PDF
综合文档语义与用户查询语义的XML关键字检索 被引量:2
2
作者 黎军 熊海灵 《计算机应用》 CSCD 北大核心 2010年第11期2945-2948,共4页
为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先... 为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先改进为语义相关实体子树集来表达查询结果。实验结果表明,该方法能够有效提高关键字检索结果的查准率。 展开更多
关键词 最小最近公共祖先 查询 语义相关 实体子树集 查准率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部