关于自动文摘系统中文摘句式的一种机器学习方法

A Machine Learning Algorithm of Salience Sentence Patterns in Automatic Abstracting Systems

下载PDF

导出

摘要自动文摘系统中一个关键的问题是找出能构成摘要的重点句子。找出这些句子的方法很多，但用机器学习的方法却较少，该文提出了一种关于文摘句式的自动学习方法。该方法以经过简单的预处理的若干语句为训练样本集，以正例句为基点进行由底向上的泛化学习，抽象出关于句式的一般概念，形成句式规则集，作为判断文中哪些语句可作为文摘句的有效手段。这是文摘系统实现的核心部分。 A key problem in automatic abstracting is to find salience sentences which can be included in the summary. There are many methods to get these sentences, but few with machine learning. This paper describes the use of machine learning on a training corpus of sentences to discover rules of salience sentences. An algorithm of sentence pattern learning is proposed,which generalizes those positive sentences from bottom to top. After training and learning from a corpus, a set of sentence rules regarding abstract is set up and will play a very important role in systems Of automatic abstracting.

作者孙春葵钟义信

机构地区北京邮电大学信息工程系

出处《计算机工程与应用》 CSCD 北大核心 2000年第5期18-20,23,共4页 Computer Engineering and Applications

基金得到了国家863计划的资助!(863-317-9601-06-03)

关键词自动文摘系统文摘句式机器学习 INTERNET网 automatic abstracting machine learning natural language processing

分类号 G356.7 [文化科学—情报学] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1孙春葵,钟义信.文摘生成系统中词典的一种构造方法[J].计算机工程与应用,1999,35(8):17-19. 被引量：1
2洪家荣，归纳学习.算法、理论、应用，1997年

二级参考文献2

1刘源，信息处理用现代汉语分词规范及自动分词方法，1994年
2梅家驹，同义词词林，1983年

1任海涛,李茹.案例特征权重自动学习方法研究[J].电脑开发与应用,2004,17(3):4-6. 被引量：3
2李茹,任海涛,刘开瑛.基于案例推理中特征权重自动学习方法研究[J].山西大学学报（自然科学版）,2004,27(3):245-248. 被引量：9
3郭俊文.中文科技文献自动文摘系统的研究[J].情报探索,1995(4):26-28. 被引量：1
4赵敏.如何做好新形势下的城建档案工作[J].航空档案,2004(10):171-172.
5王建波,王开铸.自动文摘系统—句子级信息处理研究[J].情报科学,1991,12(6):31-34.
6吴岩,李秀坤,王开铸.HIT-97Ⅰ型英文自动文摘系统[J].情报学报,1998,17(5):358-364. 被引量：14
7陈一稀,杨小虎,尹可挺.基于关系查询的应用系统向语义网移植的研究[J].浙江大学学报（工学版）,2010,44(9):1666-1671. 被引量：1
8柳佳刚,龙军,李泽军.一种用于Web信息抽取的页面信息本体自动学习方法[J].计算技术与自动化,2011,30(1):119-123. 被引量：2
9王占海.信息化背景下图书资料的管理研究[J].中国市场,2016(41):196-197.
10林莉.自动文摘的生成方法与评价研究[J].图书馆学刊,2009,31(5):94-95. 被引量：1

计算机工程与应用

2000年第5期

浏览历史

内容加载中请稍等...

关于自动文摘系统中文摘句式的一种机器学习方法

参考文献2

二级参考文献2

相关作者

相关机构

相关主题

浏览历史