基于改进贝叶斯的时效性实体词挖掘
摘要
本文研究了针对大规模查询日志进行时效性实体词挖掘技术,实体词挖掘在搜索引擎中应用广泛,而时效性实体词的识别,对于网络新增热门实体词的检索体验优化具有至关重要的作用。对此,本文通过query聚类、提取实体词上下文组成长文本的方式,提出了一种改进贝叶斯的分类算法进行时效性实体词的识别。实验结果证明本文方法在时效性实体词识别方面,达到了90%以上的准确率。
出处
《信息与电脑(理论版)》
2014年第6期73-74,共2页
China Computer & Communication
二级参考文献7
-
1Borthwick Andrew, Sterling J. , Agichtein E, Grishman R.. NYU: Description of the MENE Named Entity System as used in MUC-7 [C]//Proc. Seventh Message Understanding Conference. 1998.
-
2Cucehiarelli Alessandro, Velardi P. Unsupervised Named Entity Recognition Using Syntactic and Semantic Contextual Evidence [J]. Computational Linguistics,2001,27(1): 123-131.
-
3Evans Richard. A Framework for Named Entity Recognition in the Open Domain[C]// Proc. Recent Ad vances in Natural Language Processing. 2003.
-
4Pasca, M. Weakly-supervised discovery of named entities using web seareh queries[C]// Proceedings of the Sixteenth ACM Conference on Conference on information and Knowledge Management, 2007.
-
5D. M. Blei and J. D. Lafferty. Correlated topic models[C]// Proceedings of the 23rd International Conference on Machine Learning, 2006:113-120.
-
6T. Hofmann. Probabilistic latent semantic indexing [C]// SIGIR '99: Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval, 1999: 50-57.
-
7D. M. Blei, A. Y. Ng and M. I. Jordan. Latent dirichlet allocation[J]. Journal of Machine Learning Research,2003, 3(1): 993-1022.
共引文献7
-
1曹雷,郭嘉丰,程学旗.基于二部图半监督方法的查询日志实体挖掘[J].山东大学学报(理学版),2012,47(5):32-37. 被引量:2
-
2曹雷,郭嘉丰,白露,程学旗.基于半监督话题模型的用户查询日志命名实体挖掘[J].中文信息学报,2012,26(5):26-32. 被引量:6
-
3张梅,段建勇,徐骥超.人名属性知识挖掘及其在查询分类中的应用[J].现代图书情报技术,2013(9):82-87. 被引量:1
-
4李雪伟,吕学强,刘克会.扩展搜索日志上下文的新词识别[J].现代图书情报技术,2014(11):59-65.
-
5任育伟,吕学强,李卓,徐丽萍.搜索日志中命名实体识别[J].现代图书情报技术,2015(6):49-56.
-
6任育伟,吕学强,李卓,徐丽萍.基于查询热度和实体识别的查询推荐[J].计算机应用研究,2016,33(3):657-660. 被引量:1
-
7刘彤,倪维健,柳梅.面向搜索引擎查询日志的领域术语自动识别方法[J].现代图书情报技术,2016(2):25-33. 被引量:2
-
1许莉,王大玲,夏秀峰.基于句法和语义信息的问句特征提取方法[J].计算机工程,2010,36(21):65-66. 被引量:6
-
2毕晓君,彭伟.基于改进贝叶斯优化算法的图像分割方法[J].应用科技,2010,37(12):19-22. 被引量:1
-
3冯祖洪,李静.基于主成分分析的改进贝叶斯网络入侵检测研究[J].现代电子技术,2012,35(19):73-75. 被引量:4
-
4丁文斌,李斌,罗浩.基于改进贝叶斯的垃圾邮件过滤系统设计与实现[J].计算机工程与应用,2005,41(18):127-130. 被引量:14
-
5龚伦峰,黄丽.基于免疫机制的改进贝叶斯优化算法研究[J].考试周刊,2014(1):136-137.
-
6刘建峰,吕佳.融合主动学习的改进贝叶斯半监督分类算法研究[J].计算机测量与控制,2014,22(6):1938-1940. 被引量:4
-
7李静,冯祖洪.主成分分析法改进贝叶斯网络入侵检测[J].中国教育网络,2012(4):48-50.
-
8赵治国,谭敏生,李志敏.基于改进贝叶斯的垃圾邮件过滤算法综述[J].南华大学学报(自然科学版),2006,20(1):33-38. 被引量:4
-
9孟祥燕,余正涛,许洋波,毛煜,郭剑毅.基于改进贝叶斯的领域问答对自动获取[J].广西师范大学学报(自然科学版),2009,27(1):189-192. 被引量:4
-
10夏虎,黄文茜.基于上下文相关的未知实体词识别方法[J].电子科技大学学报,2016,45(5):839-844. 被引量:1