中文信息处理中的分词问题被引量：83

下载PDF

导出

摘要在中文信息处理的众多应用领域中，从最底层的键盘、语音和字符识别等各类汉字输入方法，到最高层的各种汉语理解系统，都不可能完全摆脱汉语文本分词处理的困扰。分词问题已成为当前中文信息处理的一个瓶颈。没有一种公认的分词标准，是人和计算机共同面临的困难。如果在这个问题上不能尽快达成共识，那么在词表和带标注的语料库等重要信息资源上就不可能做到共享与复用，势必造成重复开发的严重浪费。

作者黄昌宁

机构地区清华大学计算机科学与技术系

出处《语言文字应用》 CSSCI 北大核心 1997年第1期74-80,共7页 Applied Linguistics

基金国家自然科学基金

关键词中文信息处理汉语自动分词计算机歧义字段语料库汉语信息处理文本分类自动文摘汉语文本自然语言理解

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献556

1杨丽姣,肖航,刘智颖.《信息处理用现代汉语词类标记规范》修订研究[J].语言文字应用,2021(3):111-120. 被引量：1
2唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
3李斌,袁义国,芦靖雅,冯敏萱,许超,曲维光,王东波.第一届古代汉语分词和词性标注国际评测[J].中文信息学报,2023,37(3):46-53. 被引量：5
4程宁,李斌,葛四嘉,郝星月,冯敏萱.基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究[J].中文信息学报,2020(4):1-9. 被引量：21
5化振红.建立中古汉语语料库分词规范的若干问题[J].语言研究集刊,2021(2):151-167. 被引量：2
6曹学林.字母词语也是汉语词语[J].语文建设,2000(7):11-12. 被引量：53
7王瑞敏.留学生汉语离合词使用偏误的分析[J].语言文字应用,2005(S1):27-29. 被引量：24
8丁勇.汉语动宾型离合词的语用分析[J].语言研究,2002,22(S1):148-151. 被引量：19
9刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
10力量,晁瑞.离合词形成的历史及成因分析[J].河北学刊,2007,27(5):174-177. 被引量：17

引证文献83

1梁晓弘,杨文安.分词技术在信息处理中的研究综述[J].电脑知识与技术（过刊）,2007(22):1100-1102. 被引量：1
2刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
3王建新.我国在语料库语言学研究方面的部分进展(概述)[J].外语与外语教学,1999(3):18-20. 被引量：10
4文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
5龚汉明,周长胜.汉语分词技术综述[J].北京机械工业学院学报,2004,19(3):52-55. 被引量：26
6张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
7吴登堂.关于字母词的思考——兼谈中文信息处理对字母词自动切分的构想[J].丹东师专学报,2003,25(2):25-27. 被引量：4
8文庭孝,侯经川,邱均平,张洋.汉语自动分词新思维:无词典切分[J].情报杂志,2005,24(2):2-4. 被引量：2
9年玉萍.中文信息处理与词汇研究概述[J].西安电子科技大学学报（社会科学版）,2002,12(2):89-91. 被引量：1
10邱均平,文庭孝,周黎明.汉语自动分词与内容分析法研究[J].情报学报,2005,24(3):309-317. 被引量：11

二级引证文献723

1杨丽姣,肖航,刘智颖.《信息处理用现代汉语词类标记规范》修订研究[J].语言文字应用,2021(3):111-120. 被引量：1
2唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
3李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
4孙宝刚,肖灵.计算机与数据库技术在舰船建造过程的节本与工时分析应用[J].舰船科学技术,2019,0(20):217-219. 被引量：2
5王蔚,吴建明,刘磊.汉字的理据性[J].汉字文化,2024(5):129-133.
6崔玲玲.近十年离合词研究综述[J].汉字文化,2019,0(21):82-84. 被引量：1
7马钰淇.论警务工作的当代内核——基于《人民警察法》(修订草案稿)词频统计与分析[J].河南警察学院学报,2021(1):119-128.
8谭晓平.现代汉语文本语料库建设及应用现状研究[J].对外汉语研究,2018,0(1):20-29.
9宋凯丽,李云岭,姚露露.基于条件随机场的分词标注一体化地址解析方法[J].测绘地理信息,2021,46(S01):185-187. 被引量：4
10化振红.建立中古汉语语料库分词规范的若干问题[J].语言研究集刊,2021(2):151-167. 被引量：2

1周应权.汉语理解系统中数词的自动处理[J].中文信息,1990(4):25-28. 被引量：1
2宋恩民,郭志扬,许泽卫.计算机汉语理解系统[J].华中理工大学学报,1994,22(1):44-50.
3方艳,周国栋.基于层叠CRF模型的词结构分析[J].中文信息学报,2015,29(4):1-7. 被引量：7
4周经野.基于自然语言计算模型的汉语理解系统[J].软件学报,1993,4(6):41-46. 被引量：13
5陈顺强.信息处理用彝文分词规范研究[J].西南民族大学学报（自然科学版）,2011,37(1):158-160. 被引量：4
6崔耀,陈永明.一个实验性的汉语篇章理解系统[J].中文信息学报,1994,8(3):24-34. 被引量：3
7李小滨.CUI:具有良好适应性的汉语理解工具[J].计算机工程与应用,1989,25(7):48-55.
8陈顺强.彝文自动分词技术研究[J].中文信息学报,2011,25(3):123-128. 被引量：3
9扎西加,珠杰.面向信息处理的藏文分词规范研究[J].中文信息学报,2009,23(4):113-117. 被引量：18
10李玉梅,陈晓,姜自霞,易江燕,靳光瑾,黄昌宁.分词规范亟需补充的三方面内容[J].中文信息学报,2007,21(5):3-7. 被引量：2

语言文字应用

1997年第1期

浏览历史

内容加载中请稍等...

中文信息处理中的分词问题被引量：83

同被引文献556

引证文献83

二级引证文献723

相关作者

相关机构

相关主题

浏览历史

中文信息处理中的分词问题 被引量：83

同被引文献556

引证文献83

二级引证文献723

相关作者

相关机构

相关主题

浏览历史

中文信息处理中的分词问题被引量：83