摘要
中文姓名的辨识对汉语自动分词研究具有重要意义。本文提出了一种在中文文本中自动辨识中文姓名的算法。我们从新华通讯社新闻语料库中随机抽取了300个包含中文姓名的句子作为测试样本。实验结果表明,召回率达到了99.77%。
he processing of Chinese names is significant to the approach of Chinese word segmentation. This paper presents an effective algorithm for automatically identifying this sort of proper nouns in Chinese texts. The testing sample, involving 300 sentences each of which contains at least one Chinese names, is extracted at random from the Xinhua News Corpus. The preliminary experiment shows that the recall rate of this algorithm reaches 99.77%.
出处
《中文信息学报》
CSCD
1995年第2期16-27,共12页
Journal of Chinese Information Processing
基金
清华大学智能技术与系统国家重点实验室开放基金
关键词
中文姓名
自动辨识
汉语
自动分词
中文信息处理
Chinese name identification, Unknown word processing,Chinese word segmentation, Chinese information processing