名人网页相关度评价的概率模型研究

Probabilistic Model for Relevance Evaluation of Celebrities' Webpages

下载PDF

导出

摘要以名人网页语料库为基础,研究名人网页的个性化检索设计,实现了名人网页相关度评价的概率模型.从模型的训练策略、相关度计算公式等方面进行实验分析,总结了概率模型的规律,提出了模型的改进方法.实验表明,通过选择合适的训练集、细化用户反馈信息,模型取得了较高的相关度评价准确率. Based on the corpus of Chinese celebrities,Designs and implements the probabilistic model for relevance evaluation of celebrities＇ webpages, the main process of personalized information retrieval of celebrities＇ webpages. After analyzing on the experiment results from aspects such as the training strategy of the model, relevance computing formula and so on, Achieves some valuable conclusions about the probabilistic model and how to optimize the model. As is shown in the experiment, with well selected training sets and more detailed user feedback, the evaluation precision reaches a high level.

作者陈争艳朱保锋

机构地区河南教育学院信息技术系

出处《河南教育学院学报（自然科学版）》 2008年第1期39-41,共3页 Journal of Henan Institute of Education(Natural Science Edition)

关键词个性化检索概率模型相关度评价 personalized information retrieval probabilistic model relevance evaluation

分类号 TP393.092 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1昝红英,苏玉梅,孙斌,俞士汶.名人网页的相关度评价[J].中文信息学报,2003,17(5):27-33. 被引量：8
2贾玉祥,咎红英,范明.基于概率模型的网页相关度研究[C]∥孙茂松,陈群秀.全国第八届计算语言学联合学术会议(JSCL2005)论文集.北京:清华大学出版社,2005:654-656.
3贺宏朝,何丕廉,高剑峰,黄昌宁.一种基于上下文的中文信息检索查询扩展[J].中文信息学报,2002,16(6):32-37. 被引量：25
4刘晓莉,彭波.基于概率模型的名人网页相关度评价[J].清华大学学报（自然科学版）,2005,45(S1):1887-1891. 被引量：2
5Norbert Fuhr. Probabilistic Models in Information Retrieval [J]. The Computer Journal, 1992, 35 (3) :243 - 255.
6Ricardo Baeza - Yates, Berthier Ribeiro - Neto. Modern Information Retrieval [ M]. Beijing: China Machine Press, 2004:31 - 34.
7Robertson S E,Walker S, Sparck Jones K , et al. Okapi at TREC -3 [ C ]. In Proceedings of 3rd Text Retrieval Conference( TREC -3), 1995:109 -126.

二级参考文献18

1孙斌.中文信息提取系统设计与若干相关基础问题的研究[R].北京大学博士后研究工作报告,2002.5.
2冯是聪.搜索引擎个性化查询服务研究[R].北京大学博士生开题报告(电子版),2002.6.
3施水才肖诗斌等.TSR中文文本信息检索技术的发展[A]..中国中文信息学会二十周年学术会文论文集[C].清华大学出版社,2001,11.(79—88).
4[1]Miller G A, et al. Introduction to WordNet:an on-line lexical database, International Journal of Lexicography, 1990,3(4) :235 - 312
5[2]Rila Mandala,Takenobu Tokunaga,Hozumi Tanaka,Combining multiple evidence from different types of thesaurus for query expansion,SIGIR, 1999:191 - 197
6[3]Voorhees E M, Harman D K,The sixth Test REtrieval Conferenee(TREC-6) ,Gaithersburg,NIST, 1998
7[4]Salton G, The SMART retrieval system-experiments in automatic document processing, Prentice Hall, 1971:115 -411
8[5]http: ∥ morph. ldc. upenn. edu/Projects/Chinese
9[6]Gao J F, Nie J Y, Zhang J, et al, Improving query translation for CLIR using statistical models, ACM SIGIR'01 ,New Orleans,2001:96- 104
10[7]David Hull, Using statistical testing in the evaluation of retrieval performance, In Proc. of the 16th ACM/ SIGIR Conference, 1993: 329 - 338

共引文献32

1徐莹,杜习英.一种基于遗传算法的查询优化方法[J].电脑知识与技术（过刊）,2007(20):524-526. 被引量：1
2左家莉,王明文,王希.基于Markov网络的信息检索扩展模型[J].清华大学学报（自然科学版）,2005,45(S1):1847-1852. 被引量：9
3俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量：29
4张虎,郑家恒,刘江.语料库词性标注一致性检查方法研究[J].中文信息学报,2004,18(5):11-16. 被引量：9
5郑庆华,王朝静,孙霞.一种基于结构化语料库的概念语义网络自动生成算法[J].计算机研究与发展,2005,42(3):478-485. 被引量：7
6李智,李敏强.基金项目评审管理中智能交互式文档检索[J].研究与发展管理,2005,17(3):106-110. 被引量：5
7余正涛,樊孝忠,宋丽荣.基于特定问题类别的汉语问答系统查询扩展[J].北京理工大学学报,2005,25(10):880-884. 被引量：3
8彭林峰.信息化与建设和谐社会[J].职业,2005(10):52-53. 被引量：2
9熊德兰,柴玉梅,昝红英.基于内容的名人网页褒贬性评价[J].平顶山工学院学报,2005,14(4):47-49. 被引量：1
10吕碧波,赵军.基于相关文档池建模的查询扩展[J].中文信息学报,2006,20(3):78-83. 被引量：7

1刘晓莉,彭波.基于概率模型的名人网页相关度评价[J].清华大学学报（自然科学版）,2005,45(S1):1887-1891. 被引量：2
2昝红英,苏玉梅,孙斌,俞士汶.名人网页的相关度评价[J].中文信息学报,2003,17(5):27-33. 被引量：8
3张纯青,陈超,邵正荣,俞能海.基于加权词频的信息检索相似度评价模型[J].计算机仿真,2008,25(1):134-137. 被引量：2
4张汛涞.利用超链分析自动获取网页的主题词描述[J].现代计算机,2001,7(10):25-27.
5邓可,林杰.基于蚁群聚类算法的大规模定制产品模块划分研究[J].计算机工程与应用,2008,44(2):130-132. 被引量：13
6叶得学,韩如冰.智能化信息检索技术的分析及设计[J].自动化与仪器仪表,2014(12):80-80. 被引量：2
7李迎,胡晓凤,侯佳路.浅谈全文检索系统中文档相关性排序问题[J].电子世界,2012(8):89-90.
8戴芬,刘希玉,王晓敏.蚁群神经网络在中小企业信用评价中的应用[J].计算机技术与发展,2009,19(10):218-221. 被引量：1
9王珊珊,王利宁.基于分类表征与检索设计的资源库设计[J].计算机光盘软件与应用,2014,17(12):280-280.
10杨茂林,雷航,廖勇.一种共享资源敏感的实时任务分配算法[J].计算机学报,2014,37(7):1455-1465. 被引量：3

河南教育学院学报（自然科学版）

2008年第1期

浏览历史

内容加载中请稍等...

名人网页相关度评价的概率模型研究

参考文献7

二级参考文献18

共引文献32

相关作者

相关机构

相关主题

浏览历史