期刊文献+

医学文献集合的主题抽取和主题聚类实践 被引量:4

A Method for Topic Extraction and Clustering Based on Medical Literature
下载PDF
导出
摘要 文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题'知识抽取'的文章之一. Important keywords in academic papers reflect topics of the literature. Therefore, the extraction of topics turns to be the extraction of keyword groups. This paper first investigates techniques for topic extraction and clustering used by overseas, then the researchers propose a technical scheme for extracting topics in text information resources in the medical field and for topic area identification. A detailed explanation of the techniques for topic clustering is given. To verify the validity of the method, this paper applies the scheme to the field of osteoarthritis research. The result proves the validity of the proposed method.
出处 《数字图书馆论坛》 2008年第9期32-36,共5页 Digital Library Forum
基金 本文受国家社会科学基金项目'从数字信息资源中买现知识抽取的理论和方法研究'(05BTQ006)和国家'十一五'科技支撑计划课置'网络科技信息监测与评价'(2006BAH03B05)的资金资助
关键词 知识抽取 主题抽取 BM25F MMTx 文本挖掘 医学数据挖掘 数字图书馆 Knowledge extraction Topic extraction BM25F MMTx Text mining Medical data mining Digital library
  • 相关文献

同被引文献39

  • 1李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量:93
  • 2索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量:88
  • 3黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量:250
  • 4Alan Kontonstathis,Leon M Galistsky,Willianm M Porttenger,Soma Roy,Daniel J Phelps.A Survey of Emerging Trend Detection in Textual Data Mining[J] ,2003.
  • 5Le Minh Hoang.Emerging Trend Detection from Science Online Documents[D] ,2006,3.
  • 6Chaomei Chen.CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J].Journal of the American Society for Information Science and Technology,2005(16):19.
  • 7Alan Kontonstathis,Leon M Galistsky,Willianm M Porttenger,Soma Roy,Daniel J Phelps.A Survey of Emerging Trend Detection in Textual Data Mining[J],2003.
  • 8Cohen J D. Highlights : Language and domain-independent auto in- dexing terms for abstracting [ J ]. Journal of American Society for Information Science, 1995, 46 ( 3 ) : 162 - 174.
  • 9Matsuo Y, Ishizuka M. Keyword extraction from a single document using word co-occurrence statistical information[ J]. Journal of Ar- tificial Intelligence Tools, 2004, 3( 1 ) : 157 - 169.
  • 10Chien L F. PATree-based keywnrd extraction for Chinese inforla- tion retrieval [ C ]//Proceedings of the 20th Annual International ACM SIGIR Conference on Research and Development in Informa- tion Retrieval. New York: ACM, 1997 : 50 - 59.

引证文献4

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部