摘要
缩略语是自然语言中广泛使用的一类典型语言单元,也是最主要的新词来源。而新词会造成自然语言处理多个层面的困难。该文分析了汉语缩略语的特点,对汉语缩略语的构成形式作了总结,对汉语缩略语处理的问题作了划分,并针对不同的问题,重点介绍了在汉语中的研究现状;之后简要比较了汉语缩略语与英语缩略语的差异,并对英语缩略语处理的一些典型方法作了分析。
Abbreviation is a typical kind of language unit widely occuring in natural languages and contributes most OOVs which cause big difficulties for Natural Language Processing at different levels.This paper firstly makes a survey of properties and construction form of Chinese abbreviation;then classifies Chinese abbreviation problems into four aspects and sums up the related works for each one;finally investigates English abbreviation processing and compares some differences on abbreviation between in Chinese and in English.
出处
《中文信息学报》
CSCD
北大核心
2011年第5期60-67,82,共9页
Journal of Chinese Information Processing
基金
国家自然科学基金资助项目(60973053
91024009)
高校博士点专项基金资助项目(20090001110047)
关键词
缩略语识别
缩略语扩展
缩略语预测
缩略语挖掘
abbreviation identification
abbreviation expansion
abbreviation prediction
abbreviation mining