基于上下文相关的最大概率汉语自动分词算法被引量：8

The Maximum Probability Algorithm of Automatic Chinese Word Segmentation Based on Context

下载PDF

导出

摘要提出了一种新的汉语自动分词算法,其主要思想是通过前后两次对文章的扫描来解决分词过程中出现的交叉歧义问题,介绍了一种新的有效的字段切分算法,它能够排除类似穷举算法中冗余的单字词的切分可能。 This article presents a new algorithm of automatic Chinese word segmentation. Its main idea is to settle the problem of different meanings under the separating words process by scanning the article two times. And puts forward a new efficient string segmentation algorithm, which can exclude possibilities of redundant single words in other algorithms.

作者金瑜陆启明高峰

机构地区合肥工业大学理学院中国科学技术大学近代物理系

出处《计算机工程》 CAS CSCD 北大核心 2004年第16期146-148,共3页 Computer Engineering

关键词上下文相关汉语自动分词分词统计模型 Context relation Automatic Chinese segmentation Statistical model of segmentation

分类号 TP319 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1郭祥昊,钟义信,杨丽.基于两字词簇的汉语快速自动分词算法[J].情报学报,1998,17(5):352-357. 被引量：18
2骆正清,陈增武,王泽兵,胡上序.汉语自动分词研究综述[J].浙江大学学报（自然科学版）,1997,31(3):306-312. 被引量：16
3孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
4王玮,刘丹.汉语文献自动分词存在的问题及趋向[J].情报理论与实践,1994,17(6):28-30. 被引量：6
5刘挺,吴岩,王开铸.最大概率分词问题及其解法[J].哈尔滨工业大学学报,1998,30(6):37-41. 被引量：16
6杨文峰,陈光英,李星.基于PATRICIA tree的汉语自动分词词典机制[J].中文信息学报,2001,15(3):44-49. 被引量：29
7陈其晖,应志伟,柴佩琪.基于歧义二叉树的汉语分词方法[J].计算机辅助工程,1999,8(4):12-17. 被引量：9

二级参考文献29

1骆正清,陈增武,胡上序.一种改进的MM分词方法的算法设计[J].中文信息学报,1996,10(3):30-36. 被引量：28
2张民,李生,王海峰,赵铁军,王铁志.基于知识评价的快速汉语自动分词系统[J].情报学报,1996,15(2):95-105. 被引量：4
3苏新宁.汉语词切分标引算法的改进[J].情报学报,1996,15(6):426-430. 被引量：9
4张国煊，计算机研究与发展，1993年，1期，61页
5冯志伟，中文信息处理与汉语研究，1992年，12页
6贺银云，计算机杂志，1991年，1/3期，144页
7何克抗，中文信息学报，1991年，2期，1页
8韩世欣，中文信息学报，1990年，4期，48页
9揭春雨，中文信息学报，1990年，1期，1页
10揭春雨，中文信息学报，1990年，4期，27页

共引文献125

1李丹宁,李丹,王保华,马新强.几种基于词典的中文分词算法评价[J].贵州科学,2008,26(3):1-8. 被引量：4
2林春实,方燕,全吉成.汉语文献自动分词与标引技术发展浅析[J].情报学报,1997,16(S1):37-40. 被引量：8
3黄昌宁,孙茂松.中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J].当代语言学,1996(4):44-48. 被引量：1
4曾铭,俞俊生,刘绍华.一种用于社交网站的云安全敏感信息过滤模型[J].华中科技大学学报（自然科学版）,2012,40(S1):211-214. 被引量：4
5于清,阿里甫.库尔班.微博语料分词及标注方法初探[J].新疆大学学报（自然科学版）,2013,30(1):81-86. 被引量：1
6曾华琳,李堂秋.基于上下文信息提取的概率分词算法[J].学术问题研究,2006,0(1):127-131.
7陈淑珍.Web文本挖掘中的特征表示与特征提取技术[J].三明高等专科学校学报,2004,21(2):53-57. 被引量：2
8文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
9张素娟,郑庆华,胡云华,孙霞.一种面向网络答疑的汉语切分歧义消除算法[J].计算机工程与应用,2004,40(25):55-58. 被引量：4
10车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：63

同被引文献75

1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：83
2文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
3孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37
4李凯,左万利,吕巍.汉语文本中交集型切分歧义的分类处理[J].小型微型计算机系统,2004,25(8):1486-1490. 被引量：3
5曾华琳,李堂秋,史晓东.一种基于提取上下文信息的分词算法[J].计算机应用,2005,25(9):2025-2027. 被引量：9
6刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望[J].计算机工程与应用,2006,42(3):175-177. 被引量：67
7蒋斌,杨超,赵欢.基于二字词位图表的汉语自动分词词典机制[J].湖南大学学报（自然科学版）,2006,33(1):121-123. 被引量：3
8周文帅,冯速.汉语分词技术研究现状与应用展望[J].山西师范大学学报（自然科学版）,2006,20(1):25-29. 被引量：16
9翟凤文,赫枫龄,左万利.基于统计规则的交集型歧义处理方法[J].吉林大学学报（理学版）,2006,44(2):223-228. 被引量：9
10尹锋,林亚平.汉语自动分词技术的现状及发展趋势[J].软件世界,1996(12):80-84. 被引量：15

引证文献8

1刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
2张辉丽,孟昭鹏,王慧芝.汉语自动分词中的歧义处理[J].微计算机应用,2006,27(6):685-688. 被引量：3
3路永刚,赵伟.一种改进的MM分词方法的研究与实现[J].长春工业大学学报,2006,27(4):320-323. 被引量：3
4郭玲,孟祥逢,张峰.基于最大匹配法的中文分词技术改进[J].舰船电子工程,2009,29(12):159-163. 被引量：1
5梁胜,成卫青.基于组合型中文分词技术的改进[J].南京邮电大学学报（自然科学版）,2013,33(6):112-117. 被引量：2
6胡明.最大匹配算法在校园网信息提取中的应用[J].洛阳师范学院学报,2015,34(8):82-85.
7尹倩.基于语境信息的中文分词交叉歧义处理方法[J].重庆工商大学学报（自然科学版）,2016,33(5):20-24. 被引量：3
8任乾坤,宋楠.基于多项式贝叶斯算法与LDA模型的在线评论情感分析研究[J].价值工程,2021,40(12):139-142.

二级引证文献20

1化柏林,赵亮.知识抽取中的嵌套向量分词技术[J].现代图书情报技术,2007(7):50-53. 被引量：5
2达吾勒.阿布都哈依尔,古丽拉.阿东别克.哈萨克语词法分析器的研究与实现[J].计算机工程与应用,2008,44(19):146-149. 被引量：16
3张小刚,杨凯,冉天保.中文WEB文档自动分类系统的设计与实现[J].微计算机信息,2008,24(30):244-246.
4李国和,刘光胜,吴卫江,孙红军,唐先明,韩宝东.基于最大匹配和歧义检测的中文分词粗分方法[J].北京信息科技大学学报（自然科学版）,2010,25(S2):84-88. 被引量：1
5周宏宇,张政.中文分词技术综述[J].安阳师范学院学报,2010(2):54-56. 被引量：7
6张彩琴,袁健.改进的正向最大匹配分词算法[J].计算机工程与设计,2010,31(11):2595-2597. 被引量：11
7魏莎莎,熊海灵.中文分词中的歧义识别处理策略[J].微计算机信息,2010,26(30):190-192. 被引量：6
8吴琼.基于二次线性模型的网络舆情演化研究与实现[J].现代计算机,2011,17(22):3-6. 被引量：1
9李国和,刘光胜,秦波波,吴卫江,李洪奇.综合最大匹配和歧义检测的中文分词粗分方法[J].计算机工程与应用,2012,48(14):139-142. 被引量：3
10梁胜,成卫青.基于组合型中文分词技术的改进[J].南京邮电大学学报（自然科学版）,2013,33(6):112-117. 被引量：2

1郑耿忠.自动分词算法在智能答疑系统中的应用研究[J].计算机工程与设计,2007,28(9):2224-2226. 被引量：4
2黄莉.词法分析在自然语言处理中的地位和作用[J].价值工程,2010,29(10):157-157. 被引量：2
3傅立云,刘新.基于词典的汉语自动分词算法的改进[J].情报杂志,2006,25(1):40-41. 被引量：10
4张贤,周娅.多次Hash自动分词算法[J].微计算机信息,2009,25(24):214-216.
5姚兴山.基于词频的中文文本分类研究[J].现代情报,2009,29(2):179-181. 被引量：3
6蒋微.中文搜索引擎的自动分词算法[J].电脑开发与应用,2002,15(6):26-27. 被引量：2
7何国斌,赵晶璐.汉语文本自动分词算法的研究[J].计算机工程与应用,2010,46(3):125-127. 被引量：12
8付海辰.基于二字词检测位图表的MM自动分词算法[J].信息与电脑（理论版）,2011(3):97-97.
9束成,张建华.算法课的设计与评价[J].中国信息技术教育,2011(17):95-95. 被引量：2
10王斌.C语言中“穷举”和“递推”算法的基本思想分析[J].电脑与电信,2016(5):49-50. 被引量：1

计算机工程

2004年第16期

浏览历史

内容加载中请稍等...

基于上下文相关的最大概率汉语自动分词算法被引量：8

参考文献7

二级参考文献29

共引文献125

同被引文献75

引证文献8

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于上下文相关的最大概率汉语自动分词算法 被引量：8

参考文献7

二级参考文献29

共引文献125

同被引文献75

引证文献8

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于上下文相关的最大概率汉语自动分词算法被引量：8