自然语言理解中的音字流自动分词被引量：2

Separating Syllabes and Characters into Words in Natural Language Understanding

下载PDF

导出

摘要本文讨论了自然语言理解中的语音流和文字流的自动分词问题;构造了汉语理解的层次化模型;提出了把反馈信息限定为最简形式从而使分词层与语义无关的思想以及词串排序的三种策略:按可能性大小排序,按运算时间长短排序,以及上述两种的综合;介绍了一种分词精度极高的分词方法FWF;并且给出了实现算法和实验结果。FWF分词方法已经在语句级键盘输入、声音输入、手写汉字输入系统上使用。 This paper discusses the problem of Separating Syllables and Characters into Words (SSCW) in natural language, and constructs a model of natural language uaderstand-ing in order to define the action or level of SSCW in natural language understanding, and then presents an idea to make the feedback information simpest so that SSCW has no relationship with the meaning of words in order to get rid of the awkward circle of cause and effect.SSCW consists of word matching and word string arranging. There are three strategies to arrange word string. 1. in possibility order, 2. in runing time order, 3. a compromise of two strategies mentioned above. So far all the popular algorithms of SSCW can rerult from the second strategy,and the best one rerulted from steategy 3 is given in this paper.

作者王晓龙王开铸白小华

机构地区哈尔滨工业大学计算机系

出处《中文信息学报》 CSCD 1991年第3期48-58,共11页 Journal of Chinese Information Processing

基金国家八六三高技术资助

关键词自然语言语音流文字流自动分词

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1王晓龙,王开铸,李仲荣,白小华.最少分词问题及其解法[J].科学通报,1989,34(13):1030-1032. 被引量：25
2曾广容，系统论、控制论、信息论与哲学，1988年
3匿名著者，人工科学，1987年
4刘涌泉，中文信息学报，1986年，1卷，1期，9页
5团体著者，汉语词汇的统计与分析，1985年
6陈明远，语言学与现代科学，1983年
7刘源，中文信息学报，1976年，1期

二级参考文献4

1梁南元，中文信息学报，1987年，2卷，2期，45页
2刘源，中文信息学报，1986年，1卷，1期，20页
3关英春，计算机研究与发展，1985年，22卷，12期，5页
4管纪文，中文信息处理国际会议论文集.2，1983年

共引文献24

1郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.
2孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
3杨春花,万建成,姜合.一个并行分词体系结构模型[J].计算机工程与应用,2004,40(33):89-91.
4杨春花,张洁,胡芳立.一个书面汉语词库系统的设计与实现[J].山东轻工业学院学报（自然科学版）,2006,20(2):29-34.
5王晓龙,王幼龙.语句级汉字输入技术[J].中文信息学报,1996,10(4):51-59. 被引量：13
6刘政怡,吴建国,刘慧婷.音节切分歧义方法研究[J].计算机技术与发展,2008,18(8):35-38. 被引量：1
7刘政怡,樊庆林,吴建国,李炜.基于输入法的通用存储结构[J].计算机工程与设计,2008,29(17):4554-4558.
8刘汉兴,朱梅阶,刘财兴,林旭东.基于词图的最大概率分词方法[J].计算机工程与设计,2008,29(24):6370-6372.
9刘挺,吴岩,王开铸.串频统计和词形匹配相结合的汉语自动分词系统[J].中文信息学报,1998,12(1):17-25. 被引量：65
10王轩,王晓龙.大规模文本计算机音字相互转换技术的研究[J].计算机研究与发展,1998,35(5):417-421. 被引量：4

同被引文献11

1王晓龙,王开铸,孙希文,王英伟.音字转换中的机器学习研究[J].计算机学报,1993,16(5):370-377. 被引量：7
2侯敏，计算语言学进展与应用，1995年，81页
3刘源，信息处理用现代汉语分词规范及自动分词方法，1994年
4何克抗，中文信息学报，1991年，2期，1页
5马宴，硕士学位论文，1991年
6刘源，现代汉语常用词词频词典，1990年
7傅京孙，人工智能及其应用，1987年，19页
8王晓龙.汉字编码方案的择优、统一和发展[J]电子学报,1987(01).
9王轩,李巍,王晓龙,赵淑香.大标记集汉语字(词)Markov 语言模型的建立[J].哈尔滨工业大学学报,1997,29(5):23-27. 被引量：3
10刘小虎,李生,赵铁军.词典的模糊查询和单词的快速录入[J].哈尔滨工业大学学报,1997,29(5):28-31. 被引量：1

引证文献2

1王晓龙,王幼龙.语句级汉字输入技术[J].中文信息学报,1996,10(4):51-59. 被引量：13
2刘挺,吴岩,王开铸.最大概率分词问题及其解法[J].哈尔滨工业大学学报,1998,30(6):37-41. 被引量：16

二级引证文献29

1曾华琳,李堂秋.基于上下文信息提取的概率分词算法[J].学术问题研究,2006,0(1):127-131.
2车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：65
3金瑜,陆启明,高峰.基于上下文相关的最大概率汉语自动分词算法[J].计算机工程,2004,30(16):146-148. 被引量：8
4马晓娜,杨承磊.基于面向对象的受限自然语言查询系统的设计与实现[J].计算机工程与应用,2005,41(10):165-168. 被引量：5
5马光志,秦丹.利用互信息实现音乐风格的分类[J].计算机应用,2005,25(5):1116-1118.
6曾华琳,李堂秋,史晓东.一种基于提取上下文信息的分词算法[J].计算机应用,2005,25(9):2025-2027. 被引量：9
7梁刚.基于机械分词与统计学的新词识别研究[J].情报理论与实践,2005,28(5):475-477. 被引量：6
8孙建国,刘秉权,王轩.基于Symbian操作系统的手机输入法研究[J].计算机工程与应用,2005,41(36):89-91. 被引量：3
9高红,黄德根,杨元生.一种与分词一体化的中文人名识别方法[J].计算机工程,2006,32(19):9-10. 被引量：2
10方贵明.汉语拼音的短韵母编码与汉字输入[J].中文信息学报,2007,21(1):74-78.

1梁南元.汉语计算机自动分词知识[J].中文信息学报,1990,4(2):29-41. 被引量：30
2王永成,李健.汉语的自动分词[J].上海交通大学学报,1989,23(2):83-88.
3曹焕光,郑家恒.自动分词软件质量的评价模型[J].中文信息学报,1992,6(4):57-61. 被引量：1
4杨长生,潘凌云.基于知识的汉语拼音自动分词[J].浙江大学学报（自然科学版）,1992,26(2):246-251.
5贺银云,杜劲松.一种基于词链库的分词方法[J].计算机杂志,1991,19(1):144-150.
6杨宪泽.中文自动分词探讨[J].西南民族学院学报（自然科学版）,1994,20(3):242-245. 被引量：8
7黄祥喜.汉语人机接口HRJ自动分词技术[J].中文信息,1990(2):27-30.
8瞿锋,陈纪元.汉语自动分词算法综述[J].福建电脑,2006,22(4):23-25. 被引量：8
9罗洋.汉语自动分词方法的综述[J].科技信息,2009(7):204-204.
10官却多杰.机器翻译用藏文自动分词探究[J].电子测试,2015,26(11X):46-48.

中文信息学报

1991年第3期

浏览历史

内容加载中请稍等...

自然语言理解中的音字流自动分词被引量：2

参考文献7

二级参考文献4

共引文献24

同被引文献11

引证文献2

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

自然语言理解中的音字流自动分词 被引量：2

参考文献7

二级参考文献4

共引文献24

同被引文献11

引证文献2

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

自然语言理解中的音字流自动分词被引量：2