期刊文献+

基于统计规则的交集型歧义处理方法 被引量:9

Crossing Ambiguity Segmentation Based on Statistical Rules
下载PDF
导出
摘要 中文分词是中文信息处理的基础,歧义问题是中文分词的一个难点,而交集型歧义问题占歧义问题的90%以上,因此对交集型歧义问题的研究是中文分词研究的一个重点.通过反复的实验和对实验结果的分析,提出了5条规则,并根据这5条规则给出了一种针对交集型歧义字段切分的算法,实验结果表明,基于该算法实现的分词系统DSfenci,对于交集型歧义消解的准确率高于95.22%. Chinese word segmentation is a base for Chinese Information Processing, and the ambiguity problem is a nodus of Chinese word segmentation and more then 90% of ambiguity problems are crossing ambiguity, so the solution of the crossing ambiguity problem is an important part of Chinese word segmentation. After repeated experiments and analyses, 5 rules and an algorithm based on these 5 rules were proposed to segment crossing ambiguity. From experiment results, it can be found that the accuracy of DSfenci system we developed based on these 5 rules reaches to 95.22%, which is an excellent experiment result.
出处 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2006年第2期223-228,共6页 Journal of Jilin University:Science Edition
基金 国家自然科学基金发展项目(批准号:60373099)
关键词 交集型歧义 规则 统计 crossing ambiguity rules statistics
  • 相关文献

参考文献11

二级参考文献35

  • 1孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量:45
  • 2孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量:87
  • 3吴胜远.一种汉语分词方法[J].计算机研究与发展,1996,33(4):306-311. 被引量:49
  • 4黄萱菁,吴立德,王文欣,叶丹瑾.基于机器学习的无需人工编制词典的切词系统[J].模式识别与人工智能,1996,9(4):297-303. 被引量:24
  • 5马晏.基于评价的汉语自动分词系统的研究与实现[A]..语言信息处理专论[C].北京:清华大学出版社,1996..
  • 6.中国新闻社[EB/OL].http://www.chinanews.com.cn/,2003-10-01.
  • 7Choi A, Cheng C H, Ko Y L. Word extraction from Chinese documents by occurrence counts [ A].1988 International Conference on Computer Processing of Chinese and Oriental Languages, Toronto,Canada: 488 - 491.
  • 8Fan C K, Tsai W H. Automatic word identification in Chinese sentences by the relaxation technique[J]. Computer Processing of Chinese and Oriental Languages, 1988, 4(1):33-56.
  • 9梁南元.书面汉语自动分词系统—CDWS[J].中文信息学报,1987,(2):44-52.
  • 10HUANG De-gen, ZHU He-he, WANG Kun-lun, et al. Chinese automatic words segmentation based on maximum matching and second-maximum matching [J]. Journal of Dalian University of Technology, 1999, 39(6): 831-835. (黄德根, 朱和合, 王昆仑, 等. 基于最长次长匹配的

共引文献326

同被引文献83

引证文献9

二级引证文献54

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部