一种采用基于语境松弛算法的汉语分词排歧方法被引量：1

A Disabiguation Method for Segmenting Chinese Words by Using Relaxation Algorithm Based on Context

下载PDF

导出

摘要词切分是像汉语这类非拉丁语言的一个特有问题 ,并且由于汉语组词中普遍存在着歧义性和语境依赖性 ,这一问题也是一个尚未得到彻底解决的难题 .本文通过仔细分析汉语分词歧义的规律 ,将追求整体最优效果的松弛算法引入到汉语自动分词的排歧研究中 .借助于语词之间搭配关系等上下文约束条件以及词频、字频等统计数据 ,构造了一种汉语分词排歧的新方法 .实验结果表明 ,这种方法在切分精度和切分速度上都取得了较好的效果。 Word segmentation is unique to non-Latin languages including Chinese. Owing to the existence of ambiguity and context dependence among Chinese words, Chinese word segmentation is a pains-taking undergoing and its accomplishment is far from satisfaction. This paper presents an automatic segmentation method for Chinese words by using contextual information aiming at resolving ambiguities. The major strategy of this method is preserving the possibilities of all kinds of word segmentation consequences, and then disambiguating by relaxation algorithm. The favorable effect from the experiment shows that this disambiguation method is feasible not only in theory but also in practice.

作者周昌乐秦莉娟

机构地区厦门大学计算机科学系

出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2002年第6期711-714,共4页 Journal of Xiamen University：Natural Science

基金国家自然科学基金资助项目 (6 99830 0 6 )

关键词语境松驰算法排岐方法汉语自动分词上下文关联汉语信息处理切分速度 automatic segmentation of Chinese words context relation disambiguation relaxation algorithm

分类号 TP391.12 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献19

1湛述勇.汉语文献自动分词与标引研究综述[J].情报科学,1992,13(5):66-71. 被引量：6
2梁南元.汉语计算机自动分词知识[J].中文信息学报,1990,4(2):29-41. 被引量：30
3韩世欣,王开铸.基于短语结构文法的分词研究[J].中文信息学报,1992,6(3):48-54. 被引量：7
4王还常宝儒.现代汉语频率词典[M].北京:北京语言学院出版社,1986..
5姚天顺,张桂平,吴映明.基于规则的汉语自动分词系统[J].中文信息学报,1990,4(1):37-43. 被引量：43
6梁南元.书面汉语自动分词综述[J].计算机应用与软件,1987,(3):44-50.
7黄祥喜.书面汉语自动分词的现状和问题[J].情报学报,1989,8(2):125-133. 被引量：11
8钱树人.歧义、系统歧义和语境[J].中文信息学报,1993,7(2):18-26. 被引量：7
9王永成苏海菊等.论中文词切分中的歧形切分问题[J].情报学报,1991,10(2):122-127.
10揭春雨,刘源,梁南元.汉语自动分词实用系统CASS的设计和实现[J].中文信息学报,1991,5(4):27-34. 被引量：16

二级参考文献34

1袁毓林.自然语言理解的语言学假设[J].中国社会科学,1993(1):189-206. 被引量：10
2梁南元，中文信息学报，1987年，2卷，2期，45页
3刘源，中文信息学报，1986年，1卷，1期，20页
4关英春，计算机研究与发展，1985年，22卷，12期，5页
5管纪文，中文信息处理国际会议论文集.2，1983年
6张潮生，中文信息处理国际会议论文集，1987年
7梁南元，中文信息，1986年，1期
8姚天顺，计算机的汉字信息处理，1985年
9管纪文，中文信息处理国际研讨论文集，1983年
10染南元，计算机应用与软件，1987年，3期

共引文献161

1周桂芝.CALL的局限性与英语教师角色的转换[J].河南机电高等专科学校学报,2004,12(3):88-89. 被引量：4
2苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
3刘怀亮,张治国,马志辉,孙蕾.基于SVM与KNN的中文文本分类比较实证研究[J].情报理论与实践,2008,31(6):941-944. 被引量：10
4付艳梅.智能答疑系统的中文分词[J].湖北工业大学学报,2009,24(1):65-67. 被引量：4
5郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.
6曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
7文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
8陈康,奚伟鹏,蒋凯,武港山.Web智能信息服务系统的设计与实现[J].计算机应用研究,2004,21(6):161-163. 被引量：1
9孙展,王永成.格式转换在基于仿人摘要系统中的应用[J].计算机仿真,2004,21(7):163-165.
10孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101

同被引文献10

1熊文新.汉语真需要词间空格吗——对汉语分词连写献疑[J].语言科学,2014,13(6):655-669. 被引量：4
2曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
3陈力为.汉语书面语的分词问题──一个有关全民的信息化问题[J].中文信息学报,1996,10(1):11-13. 被引量：15
4孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量：66
5张小衡.也谈汉语书面语的分词问题——分词连写十大好处[J].中文信息学报,1998,12(3):57-63. 被引量：12
6杨正伟,秦诗芸.体视学分合法在中英文书籍字、词数估计中的运用研究[J].中国体视学与图像分析,2009,14(3):271-278. 被引量：2
7陈其晖,应志伟,柴佩琪.基于歧义二叉树的汉语分词方法[J].计算机辅助工程,1999,8(4):12-17. 被引量：9
8杨正伟,贺显利,许薇,吴美姗.不同字符数量的体视学抽样估计:方法介绍与试点研究[J].中国体视学与图像分析,2017,22(1):87-90. 被引量：1
9张莉莉,冯燕.基于语料库的汉语自动分词错误类型分析[J].华中师范大学研究生学报,2017(1):93-97. 被引量：1
10徐秉铮,贺前华.汉语自动分词歧义及处理策略[J].中文信息,1992(1):17-20. 被引量：1

引证文献1

1杨正伟.汉英引号用途对比和汉字构词歧义:借用抽样方法的试点研究[J].中国体视学与图像分析,2018,23(1):117-124.

1刘锋,陶然,王越,李志勇.基于改进型遗传算法的多传感器-多目标定位信息融合[J].航空电子技术,2003,34(1):24-27.
2朱亚东,张成,俞晓明,程学旗.基于逐点互信息的查询结构分析[J].中文信息学报,2012,26(5):33-39. 被引量：3
3吴翠鸿.MIMO系统中的半正定松弛检测算法[J].电脑编程技巧与维护,2013(8):23-25.
4杨小辉.文字软件处理实论[J].电子世界,2012(7):163-165. 被引量：1
5邓泽鹏,戴志强.一种改进时间上下文关联的餐饮智能推荐模型[J].软件导刊,2014,13(11):152-153.
6刘建成,刘学敏,徐玉如.极大似然法在水下机器人系统辨识中的应用[J].哈尔滨工程大学学报,2001,22(5):1-4. 被引量：20
7吴勇,周军.基于语境和语义的中文文本聚类算法研究[J].科技信息,2010(35).
8费景高.一类自适应松弛算法的算法模型[J].系统工程与电子技术,1993,15(11):32-38.
9清风.免费升级雅虎邮箱的3种方式[J].计算机应用文摘,2004(15):65-65.
10张美云,房斌,王翊,钟南昌.基于图像序列上下文关联的肝脏器官分割方法[J].生物医学工程学杂志,2015,32(5):1125-1130.

厦门大学学报（自然科学版）

2002年第6期

浏览历史

内容加载中请稍等...

一种采用基于语境松弛算法的汉语分词排歧方法被引量：1

参考文献19

二级参考文献34

共引文献161

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种采用基于语境松弛算法的汉语分词排歧方法 被引量：1

参考文献19

二级参考文献34

共引文献161

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种采用基于语境松弛算法的汉语分词排歧方法被引量：1