期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
查询会话中的用户行为分析 被引量:3
1
作者 王晓春 李生 +1 位作者 杨沐昀 赵铁军 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第5期76-78,105,共4页
为了更好的理解搜索用户的检索行为,在查询会话基础上分析了用户修改查询的行为规律及用户、查询和点击三者之间的关系.从查询会话的角度,综合考虑了会话中修改的次序、用户、查询和点击等多方面因素,发现了用户修改查询的规律,证明了... 为了更好的理解搜索用户的检索行为,在查询会话基础上分析了用户修改查询的行为规律及用户、查询和点击三者之间的关系.从查询会话的角度,综合考虑了会话中修改的次序、用户、查询和点击等多方面因素,发现了用户修改查询的规律,证明了查询推荐的必要性.统计结果显示:用户修改查询的方式和修改次数有关,而对应的点击数量相对稳定;最终查询一般要比初始查询长,通常是部分替换了初始查询;用户使用搜索引擎的频率越高,修改查询的可能性就越大. 展开更多
关键词 sogou搜索引擎 日志 查询会话分析 用户行为分析 查询
下载PDF
搜索日志中“V+N”、“V+V”型短语识别 被引量:1
2
作者 吕学强 舒燕 施水才 《北京信息科技大学学报(自然科学版)》 2012年第2期53-58,共6页
从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能... 从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能提高短语识别效率,证实了音节数、位置特征对实验效果的低影响力,为搜索引擎用短语词典的构建提供技术支持,为进一步的短语类别识别研究提供方向性指导。 展开更多
关键词 搜狗日志 SVM_HMM模型 短语自动识别 “V+N”短语 “V+V”短语
下载PDF
搜索引擎日志短语标注规范
3
作者 舒燕 吕学强 《中文信息学报》 CSCD 北大核心 2013年第2期47-51,共5页
语料标注是语料库构建的一项重要的基础性工作。基于搜狗日志,该文借助XML文档的结构化特点,将语料标注转换成节点属性的改写,根据语料的特点,制定了一套服务于搜索引擎用短语词典构建的短语语料标注加工规范及执行原则,并对标注集及加... 语料标注是语料库构建的一项重要的基础性工作。基于搜狗日志,该文借助XML文档的结构化特点,将语料标注转换成节点属性的改写,根据语料的特点,制定了一套服务于搜索引擎用短语词典构建的短语语料标注加工规范及执行原则,并对标注集及加工规范进行了详细描述。利用此规范,已完成145 645条查询词串的标注,而且标注质量很高。 展开更多
关键词 语料标注 搜狗日志 短语词典 加工规范
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部