期刊文献+

一种基于语境的中文分词方法研究 被引量:8

Chinese Word Segmentation Based on Language Situation
下载PDF
导出
摘要 汉语不同于英语 ,词之间没有间隔标记 .而汉语分词是文本分析的第一步 ,且存在歧义切分 ,因此分词问题成为汉语分析的首要难题 .通过中文切分过程的本质分析 ,推导并提出基于马尔可夫链的语境中文切分理论 ,进而提出一种语境中文分词方法 .该方法建立在词法和句法基础上 ,从语境角度分析歧义字段 ,提高分词准确率 . Different from English, there are no interval marks between words in C hinese, so it is difficult for word segmentation to identify ambiguous words. Established a theory of Chinese word segmentation with language situation , and proposed a Chinese word segmentation method of language situation. The metho d improves the accuracy of word segmentation, by combining morphol ogy and syntax with language situation.
出处 《小型微型计算机系统》 CSCD 北大核心 2005年第1期129-133,共5页 Journal of Chinese Computer Systems
关键词 语境 中文分词 马尔可夫链 歧义切分 language situation Chinese word segmentation Markov chain ambiguous word segmentation
  • 相关文献

参考文献12

二级参考文献29

  • 1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量:83
  • 2王晓龙,王开铸.声音语句输入的研究[J].计算机学报,1994,17(2):96-103. 被引量:7
  • 3万建成.语音代码──汉字智能转换研究[J].中文信息学报,1994,8(2):61-72. 被引量:4
  • 4骆正清,陈增武,胡上序.一种改进的MM分词方法的算法设计[J].中文信息学报,1996,10(3):30-36. 被引量:28
  • 5[1]Rie K A,Lillian L Mostly-unsupervised Statistical Segmentation of Japanese[A].Language Technology Joint Conf of Applied Natural Language Processing and the North American Chapter of the Association for Computational LinguiSticS[C],2000-04
  • 6[2]Kolda T G Limited-memoryMatrix Methods with Applications[D]University of Maryland:College Park,Mayland,1997
  • 7[3]Krishnapuram R,Joshi A,YiL A Fuzzy Relative of the k-Medoids Algorithm with Application to Web Document and Snippet Clustering [A] Korea,ProcIEEE Intl ConfFuzzy Systems-FUZZ IEEE 1 999[C],1999-08
  • 8[4]Hathaway R J,Bezdek J C NERF c-Means Non-Euclidean Relational Fuzzy Clustering[J]Pattern Recognition.1 994,27(3):429-437
  • 9[5]Frigui H.Krishnapuram R Clustering by Competitive Agglomeration [J]Pattern Recognition.1 997.30(7):1109-1119
  • 10[2]Christos Faloutsos,Douglas Oard.A Survey of Information Retrieval and Filtering Methods.christos@cs.umd.edu

共引文献371

同被引文献77

引证文献8

二级引证文献136

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部