期刊文献+

名人网页相关度评价的概率模型研究

Probabilistic Model for Relevance Evaluation of Celebrities' Webpages
下载PDF
导出
摘要 以名人网页语料库为基础,研究名人网页的个性化检索设计,实现了名人网页相关度评价的概率模型.从模型的训练策略、相关度计算公式等方面进行实验分析,总结了概率模型的规律,提出了模型的改进方法.实验表明,通过选择合适的训练集、细化用户反馈信息,模型取得了较高的相关度评价准确率. Based on the corpus of Chinese celebrities,Designs and implements the probabilistic model for relevance evaluation of celebrities' webpages, the main process of personalized information retrieval of celebrities' webpages. After analyzing on the experiment results from aspects such as the training strategy of the model, relevance computing formula and so on, Achieves some valuable conclusions about the probabilistic model and how to optimize the model. As is shown in the experiment, with well selected training sets and more detailed user feedback, the evaluation precision reaches a high level.
出处 《河南教育学院学报(自然科学版)》 2008年第1期39-41,共3页 Journal of Henan Institute of Education(Natural Science Edition)
关键词 个性化检索 概率模型 相关度评价 personalized information retrieval probabilistic model relevance evaluation
  • 相关文献

参考文献7

  • 1昝红英,苏玉梅,孙斌,俞士汶.名人网页的相关度评价[J].中文信息学报,2003,17(5):27-33. 被引量:8
  • 2贾玉祥,咎红英,范明.基于概率模型的网页相关度研究[C]∥孙茂松,陈群秀.全国第八届计算语言学联合学术会议(JSCL2005)论文集.北京:清华大学出版社,2005:654-656.
  • 3贺宏朝,何丕廉,高剑峰,黄昌宁.一种基于上下文的中文信息检索查询扩展[J].中文信息学报,2002,16(6):32-37. 被引量:25
  • 4刘晓莉,彭波.基于概率模型的名人网页相关度评价[J].清华大学学报(自然科学版),2005,45(S1):1887-1891. 被引量:2
  • 5Norbert Fuhr. Probabilistic Models in Information Retrieval [J]. The Computer Journal, 1992, 35 (3) :243 - 255.
  • 6Ricardo Baeza - Yates, Berthier Ribeiro - Neto. Modern Information Retrieval [ M]. Beijing: China Machine Press, 2004:31 - 34.
  • 7Robertson S E,Walker S, Sparck Jones K , et al. Okapi at TREC -3 [ C ]. In Proceedings of 3rd Text Retrieval Conference( TREC -3), 1995:109 -126.

二级参考文献18

  • 1孙斌.中文信息提取系统设计与若干相关基础问题的研究[R].北京大学博士后研究工作报告,2002.5.
  • 2冯是聪.搜索引擎个性化查询服务研究[R].北京大学博士生开题报告(电子版),2002.6.
  • 3施水才 肖诗斌 等.TSR中文文本信息检索技术的发展[A]..中国中文信息学会二十周年学术会文论文集[C].清华大学出版社,2001,11.(79—88).
  • 4[1]Miller G A, et al. Introduction to WordNet:an on-line lexical database, International Journal of Lexicography, 1990,3(4) :235 - 312
  • 5[2]Rila Mandala,Takenobu Tokunaga,Hozumi Tanaka,Combining multiple evidence from different types of thesaurus for query expansion,SIGIR, 1999:191 - 197
  • 6[3]Voorhees E M, Harman D K,The sixth Test REtrieval Conferenee(TREC-6) ,Gaithersburg,NIST, 1998
  • 7[4]Salton G, The SMART retrieval system-experiments in automatic document processing, Prentice Hall, 1971:115 -411
  • 8[5]http: ∥ morph. ldc. upenn. edu/Projects/Chinese
  • 9[6]Gao J F, Nie J Y, Zhang J, et al, Improving query translation for CLIR using statistical models, ACM SIGIR'01 ,New Orleans,2001:96- 104
  • 10[7]David Hull, Using statistical testing in the evaluation of retrieval performance, In Proc. of the 16th ACM/ SIGIR Conference, 1993: 329 - 338

共引文献32

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部