期刊文献+

一种组合型中文分词方法 被引量:11

A COMBINATION-TYPE CHINESE WORD SEGMENTATION METHOD
下载PDF
导出
摘要 设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种组合型的分词方法能够较好地解决中文歧义并发现新的登录词。 In this paper, we design and implement a combination-type word segmentation mechanism: the dictionary-based largest two-way matching, the word tagging-based Chinese word segmentation method and the hidden Markov segmentation approach. By comparing the experimental results, we find that this combination-type word segmentation means can better solve the Chinese ambiguity and discover the new word.
出处 《计算机应用与软件》 CSCD 北大核心 2012年第7期26-28,39,共4页 Computer Applications and Software
基金 国家自然科学基金项目(60673186 60971088) 江苏省高校"青蓝工程"中青年学术带头人培养对象资助项目
关键词 中文信息处理 中文自动分词 组合型分词 Chinese information processing Chinese word automatic segmentation Combination-type word segmentation
  • 相关文献

参考文献5

  • 1黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量:248
  • 2陈平,刘晓霞,李亚军.基于字典和统计的分词方法[J].计算机工程与应用,2008,44(10):144-146. 被引量:13
  • 3詹姆斯,普雷斯.贝叶斯统计学原理、模型及应用[M].北京:中国统计出版社,1992.
  • 4Rabiner L R, Juang B H. An introduction to hidden Markov models [ J]. IEEE ASSP Mag, 1986,3 ( 1 ) :4 - 16.
  • 5Jurafsky D, Martin J H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguisticsand Speech Recognition [ M ]. USA : Prentice Hall, 2000.

二级参考文献13

共引文献257

同被引文献82

引证文献11

二级引证文献31

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部