期刊文献+

基于贝叶斯网络的故事线挖掘算法 被引量:11

Storyline Mining Algorithm Based on Bayesian Network
下载PDF
导出
摘要 目前的多数故事线挖掘研究侧重新闻文献和事件的相似性分析,忽略了故事线的结构化表述及新闻具有的延时性,无法直观地从模型结果看出不同新闻话题的发展过程。为此,提出一种基于贝叶斯网络的无监督故事线挖掘算法。将故事线看成日期、时间、机构、人物、地点、主题和关键词的联合概率分布,并考虑新闻时效性。在多个新闻数据集上进行的实验和评估结果表明,与K-means、LSA等算法相比,该算法模型具有较高的故事线挖掘能力。 At present,most of the research on story line mining focuses on the similarity analysis of news documents and events, while ignoring the structured expression of stories and the delay of news. It is difficult to intuitively see the development of different news topics from the model results. Therefore,an unsupervised storyline mining algorithm based on Bayesian network is proposed, which considers the story line as the joint probability distribution of date, time, organization, person, place, topic and key words and considers the timeliness of news in inside. Experiments and evaluations results on multiple news datasets show that this algorithm model has a higher mining potential than the K- means and LSA algorithms.
作者 佘玉轩 熊赟
出处 《计算机工程》 CAS CSCD 北大核心 2018年第3期55-59,共5页 Computer Engineering
基金 国家自然科学基金(91546105 71331005) 国家高技术研究发展计划项目(2015AA020105) 上海市科委项目(16JC1400801 16511102204) NSFC-广东联合基金(第二期)超级计算科学应用研究专项 国家超级计算广州中心支持项目
关键词 故事线挖掘 事件 贝叶斯网络 时效性 新闻 主题 storyline mining event Bayesian network timeliness news topic
  • 相关文献

参考文献5

二级参考文献60

  • 1骆卫华,于满泉,许洪波,王斌,程学旗.基于多策略优化的分治多层聚类算法的话题发现研究[J].中文信息学报,2006,20(1):29-36. 被引量:38
  • 2谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006,25(3):95-100. 被引量:116
  • 3雷震,吴玲达,雷蕾,黄炎焱.初始化类中心的增量K均值法及其在新闻事件探测中的应用[J].情报学报,2006,25(3):289-295. 被引量:25
  • 4赵华,赵铁军,张姝,王浩畅.基于内容分析的话题检测研究[J].哈尔滨工业大学学报,2006,38(10):1740-1743. 被引量:20
  • 5Allan J, Papka R. On-line new event detection and tracking[ A]. Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval [ C ]. Melbourne: ACM Press, 1998. 37-45.
  • 6Seo Y W, Sycara K. Text clustering for topic detection [ Z ]. USA : Carnegie Mellon University, 2004.
  • 7Yang C, Shi X, Wei C. Tracing the event evolution of terror attacks from on-line news [ A ]. Proceedings of IEEE International Conference on Intelligence and Security Informatics [ C ]. San Diego: Lecture Notes in Computer Science, 2006. 343 - 354.
  • 8路荣,项亮,刘明荣,等.基于隐主题分析和文本聚类的微博客新闻话题发现研究[A]∥第六届全国信息检索学术会议,2010[C].2010:291-298.
  • 9Bollegala D, Matsuo Y, Ishizuka M. Measuring Semantic Similarity between Words Using Web Search Engines//Proc of the 16th Inter- national Conference on World Wide Web. Banff, Canada, 2007: 757 - 766.
  • 10Sahami M, Heilman T D. A Web-Based Kernel Function for Meas- uring the Similarity of Short Text Snippets//Pmc of the 15th Inter- national Conference on World Wide Web. Edinburgh, UK, 2006: 377 - 386.

共引文献134

同被引文献83

引证文献11

二级引证文献24

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部