期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于扩展模式树匹配的XConquer算法
1
作者 张子鋆 何震瀛 汪卫 《计算机工程》 CAS CSCD 北大核心 2010年第8期40-42,共3页
针对XQuery全文扩展中合取语义ftcontains表达式的计算问题,提出基于扩展模式树匹配的XConquer算法。树形结构索引DataSkeleton为查询节点静态过滤初始数据节点流,最小最低公共祖先动态阻止无效节点入栈,避免无用栈操作。实验结果表明,X... 针对XQuery全文扩展中合取语义ftcontains表达式的计算问题,提出基于扩展模式树匹配的XConquer算法。树形结构索引DataSkeleton为查询节点静态过滤初始数据节点流,最小最低公共祖先动态阻止无效节点入栈,避免无用栈操作。实验结果表明,XConquer算法的查询性能优于DeweyPathStack算法。 展开更多
关键词 XQuery全文扩展标准 扩展模式树 模式匹配
下载PDF
扩展搜索日志上下文的新词识别
2
作者 李雪伟 吕学强 刘克会 《现代图书情报技术》 CSSCI 北大核心 2014年第11期59-65,共7页
【目的】大规模搜集、整理新词扩充现有词典,提高汉语分词准确率,推动中文信息处理的发展。【方法】根据搜索日志查询串特征及新词特点,提出扩展搜索日志上下文的新词识别方法。首先,通过分析查询串的特点获取种子词集合,利用种子词集... 【目的】大规模搜集、整理新词扩充现有词典,提高汉语分词准确率,推动中文信息处理的发展。【方法】根据搜索日志查询串特征及新词特点,提出扩展搜索日志上下文的新词识别方法。首先,通过分析查询串的特点获取种子词集合,利用种子词集在搜索日志中进行全文扩展,提取候选新词。其次,根据新词的时间属性发现新词串,最后基于词语的边界信息,提出改进左右熵方法抽取语料中存在的新词语。【结果】在搜狗日志上进行实验,P@100的平均准确率达到89.60%。【局限】对比词串集合的规模会在一定程度上影响新词的正确率。【结论】实验表明该方法适用于搜索日志这种缺失上下文信息的文本的新词识别。 展开更多
关键词 搜索日志 全文扩展 新词 边界 改进左右熵
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部