摘要
未登录的人名、地名以及机构名的自动识别是中文信息处理中的一个难点,自动识别技术的突破对提高汉语自动切词和句法分析的准确性有很重要的作用。本文基于书面语的特点,在标点符号的启示下,提出一种新的形式化处理策略,即在现代汉语书面语中给人名、地名以及机构名加上专名号,以便于计算机识别,从而通过原始文本的书写改革从根本上彻底解决问题。如能实行,则能一举突破这一难点,召回率和准确率都将能达到100%,而且意义重大,影响深远。
出处
《乐山师范学院学报》
2009年第2期51-54,共4页
Journal of Leshan Normal University
基金
2007年度安徽省高校青年教师科研资助计划项目"现代汉语缩略词语的自动识别研究"(项目编号:2007jqw104)
巢湖学院科研启动基金