期刊文献+

自然语言理解中的音字流自动分词 被引量:2

Separating Syllabes and Characters into Words in Natural Language Understanding
下载PDF
导出
摘要 本文讨论了自然语言理解中的语音流和文字流的自动分词问题;构造了汉语理解的层次化模型;提出了把反馈信息限定为最简形式从而使分词层与语义无关的思想以及词串排序的三种策略:按可能性大小排序,按运算时间长短排序,以及上述两种的综合;介绍了一种分词精度极高的分词方法FWF;并且给出了实现算法和实验结果。FWF分词方法已经在语句级键盘输入、声音输入、手写汉字输入系统上使用。 This paper discusses the problem of Separating Syllables and Characters into Words (SSCW) in natural language, and constructs a model of natural language uaderstand-ing in order to define the action or level of SSCW in natural language understanding, and then presents an idea to make the feedback information simpest so that SSCW has no relationship with the meaning of words in order to get rid of the awkward circle of cause and effect.SSCW consists of word matching and word string arranging. There are three strategies to arrange word string. 1. in possibility order, 2. in runing time order, 3. a compromise of two strategies mentioned above. So far all the popular algorithms of SSCW can rerult from the second strategy,and the best one rerulted from steategy 3 is given in this paper.
出处 《中文信息学报》 CSCD 1991年第3期48-58,共11页 Journal of Chinese Information Processing
基金 国家八六三高技术资助
  • 相关文献

参考文献7

  • 1王晓龙,王开铸,李仲荣,白小华.最少分词问题及其解法[J].科学通报,1989,34(13):1030-1032. 被引量:25
  • 2曾广容,系统论、控制论、信息论与哲学,1988年
  • 3匿名著者,人工科学,1987年
  • 4刘涌泉,中文信息学报,1986年,1卷,1期,9页
  • 5团体著者,汉语词汇的统计与分析,1985年
  • 6陈明远,语言学与现代科学,1983年
  • 7刘源,中文信息学报,1976年,1期

二级参考文献4

  • 1梁南元,中文信息学报,1987年,2卷,2期,45页
  • 2刘源,中文信息学报,1986年,1卷,1期,20页
  • 3关英春,计算机研究与发展,1985年,22卷,12期,5页
  • 4管纪文,中文信息处理国际会议论文集.2,1983年

共引文献24

同被引文献11

引证文献2

二级引证文献29

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部