期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
搜索引擎日志中“N+V”和“N_1+N_2+V”型短语自动识别 被引量:2
1
作者 赵红改 吕学强 +1 位作者 施水才 郑丽 《中文信息学报》 CSCD 北大核心 2012年第5期20-25,共6页
正确识别搜索引擎日志中的短语,对搜索引擎用短语词典构建和提高搜索引擎性能具有重要的作用。该文提出一种应用条件随机场实现对搜狗日志语料中"N+V"和"N1+N2+V"型短语自动识别的方法。模型的特征集包含词、词性... 正确识别搜索引擎日志中的短语,对搜索引擎用短语词典构建和提高搜索引擎性能具有重要的作用。该文提出一种应用条件随机场实现对搜狗日志语料中"N+V"和"N1+N2+V"型短语自动识别的方法。模型的特征集包含词、词性和词语长度。由人工设计候选特征集,从中选择有效的特征构成特征模板,训练生成用于短语自动识别的条件随机场模型。封闭测试和开放测试的实验结果表明,模型能够实现对这两种短语的有效识别。 展开更多
关键词 条件随机场模型 搜索引擎日志 n+v”型短语 "n1+n2+v"型短语 特征模板
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部