期刊文献+

基于HMM的百科辞典文本中句子的知识点分类 被引量:5

A HMM Based Topic Categorization of Sentences in Encyclopedia Texts
下载PDF
导出
摘要 在百科全书条目文本中,往往以几个不同的侧面说明一个条目,一个侧面构成有关这一条目的一个知识点。知识点是一般文本处理领域中话题这一概念在百科全书文本中的具体表现。属于同一个类型的条目文本中总是重复出现有限的几个知识点,这些知识点构成了有关该类型的知识点集合,并且这些知识点在该类型不同的条目文本中的分布有较强的规律性。在条目文本中识别出对应的知识点序列是百科全书中知识提取过程的重要一环。该文提出了一种基于隐马尔科夫(HMM)模型的方法,利用知识点在条目文本中的转移规律以及知识点的词特征分布来判断每个句子的知识点类别。实验表明这个方法能取得较好的结果,在《中国大百科全书》地理卷的中国县市类型的条目文本中的实验结果的正确率为91.8%。 There is a certain common text structure shared by the articles dealing with the same kind items of encyclopedia.In other words,there are several common topics to appear in most of these texts,and the sequences of the topics in these texts are similar to each other.In the case of articles dealing with Chinese City,every sentence is covered by one of the common topics,like Area and Population,Clime etc.Automatic categorization of each sentence according to common topics will be very useful in encyclopedia knowledge retrieval.This paper presented a HMM based method of sentence categorization according to common topics,which utilizes the topic transitional information.Experiment shows that this method can provide acceptable performance,the precision of the sentence categorization in the Chinese City articles is 91.8%.
作者 许勇 宋柔
出处 《计算机工程与应用》 CSCD 北大核心 2005年第4期35-37,133,共4页 Computer Engineering and Applications
基金 国家自然科学基金(编号:60272055) 国家863高技术研究发展计划(编号:2001AA114111)资助
关键词 HMM 百科辞典知识获取 自然语言处理 HMM,encyclopedia knowledge retrieval,natural language processing
  • 相关文献

参考文献6

  • 1范焱,郑诚,王清毅,蔡庆生,刘洁.用Naive Bayes方法协调分类Web网页[J].软件学报,2001,12(9):1386-1392. 被引量:53
  • 2朱华宇,孙正兴,张福炎.一个基于向量空间模型的中文文本自动分类系统[J].计算机工程,2001,27(2):15-17. 被引量:45
  • 3G Salton,A Singhal,C BucHey et al.Automatic text decomposition using text segments and text themes[C].In:Procoedings of Hypertext'96,New York:ACM Press, 1996:53-65.
  • 4Marti A Hearst.Multi-Paragraph Segmentation of Expository Text[C]. In:Proceedings of the 32nd Meeting of the Association for Computational Linguistics,Los Cruces,NM, 1994-06.
  • 5Lang K Newsweeder.Learning to filter net news[C].In:Proceedings of the 12th International Conference on Machine Learning, 1995:331-339.
  • 6Christopher D Manning,Hinrich Schutze.Foundations of Statistical Natural Language Processin[M].The MIT Press, 1996.

二级参考文献8

  • 1邹涛.基于WWW的信息发现技术研究(博士学位论文)[M].南京:南京大学,1999..
  • 2邹涛,博士学位论文,1999年
  • 3Yang Y,Information Retrieval J,1999年
  • 4Yang Y,INRT J,1998年
  • 5吴立德,大规模中文文本处理,1997年,7页
  • 6陈世福,人工智能与知识工程,1997年,391页
  • 7Yang Y,ACM Transactions on Information Systems,1994年
  • 8Lang K,Proc the 12th Int Conference on Machine Learning(ICML 95),1995年,331页

共引文献94

同被引文献68

引证文献5

二级引证文献56

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部