摘要
处理流程和梳理国内外重要研究成果的基础上,重点对自动摘要研究在文本分词、冗余度控制、质量评价、短文本自动摘要以及多语言与跨语言文本自动摘要等方面所面临的若干基本问题及其主要解决方法进行归纳和总结,并对部分研究内容的发展方向进行展望,以期为未来的自动摘要和自然语言处理研究提供有意义的参考。
This paper analyzes the procedure of automatic summarization, and briefly surveys the related achievements at home and abroad. Moreover, some issues of word segmentation, redundancy control, quality evaluation, short text summarization, multilingual summarization and across-language summarization in current work are concluded, and some future directions are also discussed in detail. A valuable reference can be provided to the further studies for automatic summarization and natural language processing.
出处
《图书情报工作》
CSSCI
北大核心
2014年第20期13-22,共10页
Library and Information Service
基金
教育部人文社会科学研究青年项目“微博热点事件发现及其内容自动摘要研究”(项目编号:14YJC870021)
广东省科技计划项目“基于数据挖掘的旅游电子商务平台的关键技术研究”(项目编号:2012B031400016)研究成果之一
关键词
自动摘要
自然语言处理
短文本
文本分词
冗余度控制
automatic summarization natural language processing short text word segmentation redundancy