期刊文献+

基于标题的BBS热点话题挖掘——以南京大学小百合BBS为例 被引量:9

Hot Topic Mining based on Titles in BBS——Taking Lily BBS in Nanjing University as an example
下载PDF
导出
摘要 目的:在使用数据挖掘发现BBS热点话题的过程中,标题的重要性经常被忽略。本文旨在论证和凸显标题在BBS热点话题挖掘中的重要作用,同时区别在BBS热点话题挖掘时标题和文本内容作用的不同。方法:以南京大学小百合BBS的每日10大热门话题帖子的标题为数据样本,采用凝聚式层次聚类法进行数据的聚类。结果:将270条样本数据聚为单类,选取其中有代表性的前五组进行讨论。结论:仅凭标题内容就能够有效挖掘出在一段时间内BBS上的热点主题,证明了标题在BBS热点话题挖掘中的重要性。 Purpose: During the process in mining hot topics in BBS by utilizing data mining, the special importance of ti tles is often ignored. This paper intends to prove the significance of the titles in BBS hot topic mining, and to distinguish the func tion of rifles from that of post content during hot topic mining. Method: Taking the sample data from lily BBS in Nanjing Universi ty, applying agglomerated hierarchy clustering. Results: Put 270 smaples into dusters; Collect the first five reprebemive dusters under discussion. Conclusion: Based on the titles, the hot topies on the BBS in a certain period can be mined effeotively, prov hag the substantial role of the titles in Hot Topic Mining in BBS.
作者 刘骅 朱庆华
出处 《现代情报》 CSSCI 2013年第1期162-165,共4页 Journal of Modern Information
关键词 BBS 热点话题 数据挖掘 凝聚式层次聚类 BBS Hot topic mining data mining agglomerated hierarchy clustering
  • 相关文献

参考文献8

  • 1蓝凯梅.BBS热点话题发现与监控系统[D].北京:北京交通大学,2011.
  • 2中国互联网络信息中心.第30次中国互联网络发展状况统计报告[R].北京:CNNIC,2012.http://www.cnnic.cn/2012-9-20.
  • 3TDT homepage, http:///www. itl. hist. gov/iad/894.01/tests/tdt/index.htm, 2012-7- 1.
  • 4陈立章,李斌,陈晓鹏.高校BBS舆情监测系统设计与实现[J].微处理机,2012,33(1):40-43. 被引量:5
  • 5杨国俊.基于BBS的舆情预测算法及应用研究[D].合肥:合肥工业大学,2009.
  • 6Salton G, Wong A, Yang C S. A vector space modd for automatic indexing.
  • 7Chuang S L, Chien L F. Towards Automatic Generation of Query Taxonomy: A Hierachical Query Clustering Approach [ C ]. In: Proceedings of the 2002 IEEE International Conference on Data Mining, Maebashi City, Japan: IEEE Computer Society Press, 75- 82.
  • 8Brandes U, Gaertler M, Wagner D. Exits on Graph Clustering [C]. In: Proceedings of the 11th Annual European Symposium on Al-gorithans (ESA'03), volume 2832 of Lecture Notes in Computer Science, 2003: 568 - 579.

二级参考文献6

  • 1王佰玲,方滨兴,云晓春.零拷贝报文捕获平台的研究与实现[J].计算机学报,2005,28(1):46-52. 被引量:67
  • 2中国互联网络信息中心.第27次中国互联网络发展状况统计报告[R].北京:CNNIC,2011.http://www.cnnic.cn/research/bgxz/tjbg/201101/P020110221534255749405.pdf.
  • 3Mark Levene,George Loizou.Zipf's Law for Web Surfers[J].Knowledge and Information Systems,2001(3):120-129.
  • 4G S Manku,R Motwani.Approximate Frequency CountsOver Data Streams.Proceedings of the 28th InternationalConference on VLDB[C].Hong Kong,China,2002(8):346-357.
  • 5Zhang Hua-Ping,Liu Qun,Cheng Xue-Qi,et al.Chi-nese lexical analysis using hierarchical hidden Markovmodel:Proceedings of the second SIGHAN workshop onChinese language processing-Volume 17[C].Sapporo,Japan,2003.Association for Computational Linguistics,2003:63-70.
  • 6葛玲,蒋宗礼.基于共现词查询的主题爬虫研究[J].计算机工程,2010,36(8):286-288. 被引量:3

共引文献4

同被引文献91

引证文献9

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部