期刊文献+

中文Blog热门话题检测技术研究 被引量:1

Research on Chinese Blog Hot Topic Detection
下载PDF
导出
摘要 利用话题检测技术将Blog信息按照所表达的话题进行归类和组织,可以使Blog信息更加有效、准确地为用户使用。研究了话题检测模型中的词频统计、权重计算以及相似度计算,把简单聚类算法与ISODATA算法相结合,并应用到中文Blog热门话题检测系统中,实验结果表明,文本分类的效果有了进一步的提高。 Using the topic detection technique to effectivly organize and classify the blog information which can make client use the blog information effectivly and accurately.The research focus on word frequency statistics,words weight calculation and similarity calculation,appling the method of combing simple algorithm with isodata algorithm to the chinese blog hot topic of inspection system can improve the text classification effectivly.
作者 张欣
出处 《软件导刊》 2011年第9期6-9,共4页 Software Guide
关键词 BLOG 话题检测 词频统计 权重计算 相似度计算 简单聚类算法 ISODATA算法 Blog Topic Detection Frequency Statistics Weight Calculation Similarity Calculation Simple Algorithm Isodata Algorithm
  • 相关文献

参考文献2

  • 1杨小明,罗云.ISODATA算法的实现与分析[J].采矿技术,2006,6(2):66-66. 被引量:10
  • 2Juha Makkonen,Helena Ahonen-Myka,Marko Salmenkivi. Simple Semantics in Topic Detection and Tracking[J] 2004,Information Retrieval(3-4):347~368

二级参考文献1

  • 1H M Deitel,P J Deitel.C++程序设计教程[M].北京:清华大学出版社,2004.

共引文献9

同被引文献12

  • 1贾自艳,何清,张海俊,李嘉佑,史忠植.一种基于动态进化模型的事件探测和追踪算法[J].计算机研究与发展,2004,41(7):1273-1280. 被引量:58
  • 2丁伟莉,赵华,郑德权,等.中文Bolg热门话题检测与排序技术研究[c].见:中国中文信息学会二十五周年学术会议论文集.北京:中国中文信息学会,2006:282-289.
  • 3中国互联网络信息中心.第31次中国互联网络发展状况统计报告[R].北京,2013.
  • 4ALLAN J, LAVRENKO V, FREY D, et al. UMass at TDT 2000 [ C]//Proc of Topic Detection and Tracking Workshop. [ S. 1. ] : Na- tional Institute of Standar and Technology, 2000 : 109-115.
  • 5YANG Y, PIERCE T, CARBONELL J. A study on retrospective and on-line event detection[ C]//Proc of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 1998 : 28-36.
  • 6WALLS F, JIN H, SISTA S, et al. Topic detection in broadcast news [ C]//Proc of DARPA Broadcast News Workshop. 1999 : 193-198.
  • 7SHARFI B, HUTTON M A, KALITA J. Summarizing microblogs with topic models[ C ]//Proc of NAACL-Hlt. 2010:685-688.
  • 8GUO Jing, ZHANG Peng, GUO Li. Mining hot topics from Twitter streams[ J]. Procedia Computer Science, 2012, 9: 2008-2011.
  • 9BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation [ J ]. Journal of Machine Learning Research, 2003, 3(4-5) :993-1022.
  • 10张晨逸,孙建伶,丁轶群.基于MB-LDA模型的微博主题挖掘[J].计算机研究与发展,2011,48(10):1795-1802. 被引量:166

引证文献1

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部