期刊文献+

关于自动文摘系统中文摘句式的一种机器学习方法

A Machine Learning Algorithm of Salience Sentence Patterns in Automatic Abstracting Systems
下载PDF
导出
摘要 自动文摘系统中一个关键的问题是找出能构成摘要的重点句子。找出这些句子的方法很多,但用机器学习的方法却较少,该文提出了一种关于文摘句式的自动学习方法。该方法以经过简单的预处理的若干语句为训练样本集,以正例句为基点进行由底向上的泛化学习,抽象出关于句式的一般概念,形成句式规则集,作为判断文中哪些语句可作为文摘句的有效手段。这是文摘系统实现的核心部分。 A key problem in automatic abstracting is to find salience sentences which can be included in the summary. There are many methods to get these sentences, but few with machine learning. This paper describes the use of machine learning on a training corpus of sentences to discover rules of salience sentences. An algorithm of sentence pattern learning is proposed,which generalizes those positive sentences from bottom to top. After training and learning from a corpus, a set of sentence rules regarding abstract is set up and will play a very important role in systems Of automatic abstracting.
出处 《计算机工程与应用》 CSCD 北大核心 2000年第5期18-20,23,共4页 Computer Engineering and Applications
基金 得到了国家863计划的资助!(863-317-9601-06-03)
关键词 自动文摘系统 文摘句式 机器学习 INTERNET网 automatic abstracting machine learning natural language processing
  • 相关文献

参考文献2

二级参考文献2

  • 1刘源,信息处理用现代汉语分词规范及自动分词方法,1994年
  • 2梅家驹,同义词词林,1983年

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部