期刊文献+

一种规则与统计相结合的汉语分词方法 被引量:35

A Method Combining Rule-based and Statistics-based Approaches for Chinese Word Segmentation
下载PDF
导出
摘要 汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。 Chinese automatic word segmentation is a basic task in the area of Chinese NLP.After summarizing and analyzing current techniques used in Chinese word segmentation,this paper presents a new method for word segmentation which is based on a marked corpus base.The method combines rule-based and corpus-based statistical methods.
出处 《计算机应用研究》 CSCD 北大核心 2004年第3期23-25,共3页 Application Research of Computers
基金 国家"863"基金资助项目(2001AA114102)
关键词 中文信息处理 分词 语料库 交集型歧义 Chinese NLP Word Segmentation Corpus Crossing Ambiguities
  • 相关文献

参考文献7

二级参考文献34

  • 1孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量:66
  • 2马晏.基于评价的汉语自动分词系统的研究与实现[J].语言信息专论,1996,:2-36.
  • 3郭祥昊.语言信息处理理论及自动文摘关键技术研究[M].北京:北京邮电大学,1998..
  • 4张潮生,中文信息处理国际会议论文集,1987年
  • 5梁南元,中文信息,1986年,1期
  • 6姚天顺,计算机的汉字信息处理,1985年
  • 7管纪文,中文信息处理国际研讨论文集,1983年
  • 8何克杭,中文信息学报,1991年,2期,1页
  • 9朱美英,中文信息学报,1991年,2期,50页
  • 10揭雨春,中文信息学报,1989年,1期,1页

共引文献135

同被引文献211

引证文献35

二级引证文献214

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部