期刊文献+

汉语未登录词识别现状及一种新识别方法介绍 被引量:3

A SURVEY ON IDENTIFICATION OF UNKNOWN CHINESE WORD AND INTRODUCTION TO A NEW APPROACH
下载PDF
导出
摘要 未登录词的识别对于各种汉语处理系统不仅有直接的实用意义,而且起到基础性的作用。在大规模中文文本的自动分词中,未被识别的未登录词是造成分词错误的一个重要原因,也成为许多自动分词系统走向应用的瓶颈。首先对未登录词的研究现状及现有方法做了一个综合的介绍,分析了目前方案的利弊。在此基础上提出了一个基于框架结构的未登录词专有名词识别方法。 The identification of Chinese new word not only does great signification to different Chinese process systems, but also plays a foundational role. In Chinese word segmentation of large-scale text, unidentified new words are primary factor accounting for the errors and a bottleneck for the application of automatic segmentation, A survey of Chinese unknown word identification is presented, and the advantages and disadvantages of popular approaches are discussed. Based upon that, a frame structure based approach is proposed to discover proper noun.
作者 王蕾 杨季文
出处 《计算机应用与软件》 CSCD 北大核心 2007年第8期213-215,共3页 Computer Applications and Software
关键词 专有名词识别 属性标注 错误驱动 规则和实例 Proper noun recognition Attribute tagging Error-driving Rules and instance
  • 相关文献

参考文献10

二级参考文献81

共引文献328

同被引文献32

引证文献3

二级引证文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部