期刊文献+

基于大规模中文搜索引擎的搜索日志挖掘 被引量:16

Mining query log of large-scale Chinese search engine
下载PDF
导出
摘要 从中英文用户的搜索习惯差异的角度出发,引入中文分词技术对中文搜索引擎的搜索日志进行了分析。重点分析了用户输入搜索词的一些规律,包括选择的语言、搜索词的长度和频率、高级搜索技巧的使用以及搜索词的修改情况;还提出了用户提交搜索词的模型,给出了历史搜索词对搜索结果的影响因子算法。 This paper focused on analyzing the query log of large-scale Chinese search engine.It concerned the differences of searching habits between Chinese and English users,and applied a Chinese segmentation technology in some experiments.Then presented some statistical analysis results including the using language,the length and frequency of query words,the utilization of advanced search techniques,and the modification of query words.Additionally,described a model of query words modification,and presented the computation of the impact factors of all query words within a session.
出处 《计算机应用研究》 CSCD 北大核心 2008年第6期1663-1665,共3页 Application Research of Computers
基金 国家"973"计划重点资助项目(2003CB314806)
关键词 搜索引擎 数据挖掘 搜索日志 分词 search engine data mining query log segmentation
  • 相关文献

参考文献1

二级参考文献17

  • 1Cockburn,A.,& Jones,S.Which way now? Analyzing and easing inadequacies in WWW navigation[J].International Journal of Human-Computer Studies,1996,45,105-129.
  • 2Catledge,L.D.,& Pitkow,J.E.Characterizing Browsing Strategies in the World-Wide Web[J].Computer Networks and ISDN Systems,1995,27,1065-1073.
  • 3Tauscher,L.,& Greenberg,S.How people revisit web pages:Empirical findings and implications for the design of history systems[J].International Journal of Human-Computer Studies,1997,47,97-137.
  • 4Craig Silverstein,Monika Henzinger,Hannes Marais,et al.Analysis of a very large Web search engine query log[J].In SIGIR Forum,fall 1998,Volume 33:Number 1,6-12.
  • 5Jansen,B.J.,Spink,A.,Bateman,J.,& Saracevic,T.Real life information retrieval:A study of user queries on the Web[J].SIGIR Forum,1998,32(1):5-17.
  • 6第14次中国互联网络发展状况统计报告[R].中国互联网络信息中心(CNNIC),2004年7月.
  • 7第15次中国互联网络发展状况统计报告[R].中国互联网络信息中心(CNNIC),2005年1月.
  • 8第17次中国互联网络发展状况统计报告[R].中国互联网络中心(CNNIC),2006年1月.
  • 9Danny Sullivan,Search Engine Sizes.In search engine watch website[J],http://searchenginewatch.com/reports/article.php/2156481.
  • 10Andrei Broder,A taxonomy of web search[J].In SIGIR Forum,fall 2002,Volume 36 Number2.

共引文献116

同被引文献182

引证文献16

二级引证文献92

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部