基于规则的现代汉语常用助词用法自动识别被引量：6

Automatic annotation of auxiliary words usage in rule-based Chinese language

下载PDF

导出

摘要目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库"三位一体"的助词知识库基础上,采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明,对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率,减轻人工标注的工作量,提高大规模语料库的质量。 The existing results of auxiliary word can hardly be used in the automatic annotation of natural language processing.Based on the auxiliary words knowledge database which consists of dictionaries,rule base and corpus base,the rule-based method was used in automatic annotation of auxiliary words usage.The experimental result shows that refining,extending and adjusting the matching order of the rules can promote the precision and recall effectively.It is also helpful to improve the quality of Chinese corpus,deepen the processing depth,and reduce the artificial work.

作者韩英杰昝红英张坤丽柴玉梅

机构地区郑州大学信息工程学院

出处《计算机应用》 CSCD 北大核心 2011年第12期3271-3274,共4页 journal of Computer Applications

基金国家自然科学基金资助项目(60970083) 北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1004) 河南省科技创新人才杰出青年基金资助项目(104100510026)

关键词助词知识库用法规则自动识别 auxiliary word knowledge base usage rule automatic annotation

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1张谊生.助词与相关格式[M].合肥:安徽教育出版社,2000:5-6.
2俞士汶,朱学锋,王惠,等.现代汉语语法信息词典[M].2版.北京:清华大学出版社,2003.
3昝红英,刘锐,张坤丽.基于错误驱动的现代汉语副词用法的自动识别研究[C]//河南省计算机学会2009学术年会论文集.北京:电子工业出版社,2009:203-209.
4昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量：27
5昝红英,张坤丽,柴玉梅,等.现代汉语副词用法形式化描述[c］//第八届汉语词汇语义学研讨会论文集.香港:香港理工大学,2007:1-6.
6郝丽萍,昝红英,张坤丽,等.面向机器识别的现代汉语副词用法规则问题研究[c]//第七届中文信息处理国际会议论文集.北京:电子工业出版社,2007:74-77.
7刘锐咎红英张坤丽.现代汉语副词用法的自动识别研究.计算机科学,2008,(8):172-174.
8昝红英,张军珲,朱学锋等.副词"就"的用法及其自动识别研究［c]//第十届汉语词汇语义学研讨会论文集.烟台:鲁东大学,2009:347-355.
9ZHANG KUNLI, ZHANG WENCONG, ZAN HONGYING, et al. Studies on automatic recognition of several common Chinese adverbs' usages based on BP neural networks[ C]/! Proceedings of the 10th Chinese Lexical Semantics Workshop. 烟台:鲁东大学出版社, 2009:31 - 37.
10韩英杰,张坤丽,昝红英,柴玉梅.基于助词用法的汉语词性、分词错误自动发现[J].计算机应用研究,2011,28(4):1318-1321. 被引量：3

二级参考文献20

1俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量：29
2吴云芳,俞士汶.信息处理用词语义项区分的原则和方法[J].语言文字应用,2006(2):126-133. 被引量：30
3刘锐咎红英张坤丽.现代汉语副词用法的自动识别研究.计算机科学,2008,(8):172-174.
4袁应成,昝红英,张坤丽,等.基于规则的虚词用法自动标注算法设计与系统实现[C]//第十一届汉语词汇语义学研讨会论文集.苏州:苏州大学,2010:163-169.
5田玉英.现代汉语常用助词研究[D].兰州:西北师范大学,2009.
6昝红英,刘锐,张坤丽.基于错误驱动的现代汉语副词用法的自动识别研究[C]//河南省计算机学会2009学术年会论文集.北京:电子工业出版社,2009:203-209.
7昝红英,张坤丽,柴玉梅,等.现代汉语副词用法形式化描述[C]//第八届汉语词汇语义学研讨会论文集.香港:香港理工大学,2007.
8郝丽萍,昝红英,张坤丽,等.面向机器识别的现代汉语副词用法规则问题研究[C]//第七届中文信息处理国际会议论文集.北京:电子工业出版社,2007:74-77.
9昝红英,张军珲,朱学锋,等.副词“就”的用法及其自动识别研究[C]//第十届汉语词汇语义学研讨会论文集.烟台:鲁东大学,2009:347-355.
10ZHANG Kun-li, ZHANG Wen-cong, ZAN Hong-ying, et al. Studies on automatic recognition of several common Chinese adverbs' usages based on BP neural networks[ C ]//Proc of the 10th Chinese Lexical Semantics Workshop. 2009.

共引文献43

1戴玉玲,戴茹冰,冯敏萱,李斌,曲维光.基于关系对齐的汉语虚词抽象语义表示与分析[J].中文信息学报,2020(4):21-29. 被引量：3
2刘亮.现代汉语广义助词知识库构建与应用[J].光盘技术,2008(4):14-16. 被引量：2
3俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量：29
4淑琴,那顺乌日图.面向EBMT系统的汉蒙双语语料库的构建[J].内蒙古社会科学,2006,27(1):140-144. 被引量：5
5雪艳.关于用XML语言组织蒙古语语料库的设想[J].内蒙古大学学报（哲学社会科学版）,2006,38(1):13-16. 被引量：4
6林煜明,李优.基于SVM的句子组块识别[J].山东大学学报（理学版）,2006,41(3):33-36.
7高红,黄德根,杨元生.汉语自动分词中中文地名识别[J].大连理工大学学报,2006,46(4):576-581. 被引量：10
8黄德根,王莹莹.基于SVM的组块识别及其错误驱动学习方法[J].中文信息学报,2006,20(6):17-24. 被引量：6
9俞士汶.建设综合型语言知识库的理念与成果的价值[J].中文信息学报,2007,21(6):3-12. 被引量：12
10王萌,俞士汶,段慧明,孙薇薇.现代汉语名词语法属性的计量研究初探[J].中文信息学报,2008,22(5):22-29. 被引量：2

同被引文献51

1石毓智.论“的”的语法功能的同一性[J].世界汉语教学,2000,14(1):16-27. 被引量：72
2孔令达.“名_1+的+名_2”结构中心名词省略的语义规则[J].安徽师大学报（哲学社会科学版）,1992,20(1):103-107. 被引量：27
3黄国营.“的”字的句法、语义功能[J].语言研究,1982,2(1):101-129. 被引量：104
4施关淦.关于“省略”和“隐含”[J].中国语文,1994(2):125-128. 被引量：18
5张斌.现代汉语虚词词典[M].北京:商务印书馆,2005.
6刘锐咎红英张坤丽.现代汉语副词用法的自动识别研究.计算机科学,2008,(8):172-174.
7俞士汶,朱学锋,刘云.面向自然语言理解的汉语虚词研究[C].民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集,2007:270-277.
8袁应成,咎红英,张坤丽,等.基于规则的虚词用法自动标注算法设计与系统实现[c].苏州:第11届汉语词汇语意学会议论文集,2010:163-169.
9周溢辉,昝红英,柴玉梅,等.基于主观认知的汉语助词和语气词区分问题研究[c].苏十1,1:第11届汉语词汇语意学会议论文集,2010:382-388.
10昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量：27

引证文献6

1昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动识别研究[J].计算机工程与设计,2013,34(6):2152-2157. 被引量：5
2梁猛杰,宋玉,韩英杰,昝红英.基于规则排序的介词用法自动识别研究[J].河南师范大学学报（自然科学版）,2013,41(3):152-155. 被引量：3
3张坤丽,昝红英,柴玉梅,韩英杰,赵丹.现代汉语虚词用法知识库建设综述[J].中文信息学报,2015,29(3):1-8. 被引量：10
4刘秋慧,张坤丽,许鸿飞,俞士汶,昝红英.助词“的”用法自动识别研究[J].北京大学学报（自然科学版）,2018,54(3):466-474. 被引量：3
5侍冰清,戴茹冰,曲维光,顾彦慧,周俊生,李斌,徐戈,史胜旺.基于组合神经网络的语义省略“的”字结构识别[J].北京大学学报（自然科学版）,2019,55(1):75-83. 被引量：1
6戴茹冰,侍冰清,李斌,曲维光.语义省略“的”字结构自动识别研究[J].语言科学,2020,19(1):92-104.

二级引证文献16

1戴玉玲,戴茹冰,冯敏萱,李斌,曲维光.基于关系对齐的汉语虚词抽象语义表示与分析[J].中文信息学报,2020(4):21-29. 被引量：3
2李洪政,晋耀红.基于条件随机场方法的汉语专利文本介词短语识别[J].现代语文（下旬．语言研究）,2015(7):120-122. 被引量：1
3张坤丽,昝红英,柴玉梅,韩英杰,赵丹.现代汉语虚词用法知识库建设综述[J].中文信息学报,2015,29(3):1-8. 被引量：10
4石金铭,昝红英,韩英杰.大规模汉语词汇语义知识库的构建[J].山西大学学报（自然科学版）,2015,38(4):581-587. 被引量：2
5昝红英,许鸿飞,张坤丽,穗志方.网络用语词典的构建及问题分析[J].中文信息学报,2016,30(6):133-139. 被引量：6
6李洪政,晋耀红.汉语介词短语自动识别研究综述[J].中文信息学报,2017,31(2):1-10. 被引量：1
7刘雯旻,张晓如.一种基于规则和统计的连动句识别方法[J].电子设计工程,2017,25(22):18-22. 被引量：4
8韩丽国.现代汉语虚词“等”的功能视角研究[J].辽宁广播电视大学学报,2016(4):122-124.
9李纲,徐健,巴志超,刘学太,安璐.应急知识库系统构建的关键问题与模块划分研究[J].情报理论与实践,2018,41(3):123-128. 被引量：4
10刘秋慧,张坤丽,许鸿飞,俞士汶,昝红英.助词“的”用法自动识别研究[J].北京大学学报（自然科学版）,2018,54(3):466-474. 被引量：3

1人人都是设计师[J].微型计算机,2010(11):9-9.
2李卓明.“虚拟”的妙处[J].科学之友,1998,0(6):14-14.
3尚民.能及之及[J].西北园艺（果树）,2011(3):4-5.
4胡锡晟.谣言与预言的背后[J].科学24小时,2011(12):10-10.
5易萍萍.“辨别”与“辨认”[J].辞书研究,2005(1):200-202.
6“实验”与“试验”的辨析[J].电力系统自动化,2010,34(23):70-70.
7姜大源.职业教育:程序与过程辨[J].中国职业技术教育,2008,24(28):1-1. 被引量：9
8鲁承发.古汉语中祭名义“有”的历时演化[J].中国文字研究,2015(1):165-171.
9张基一.何故高端[J].机电信息,2014(1):15-16.
10陈安妮.感悟“终身教育”[J].终身教育,2010,8(3):102-103.

计算机应用

2011年第12期

浏览历史

内容加载中请稍等...

基于规则的现代汉语常用助词用法自动识别被引量：6

参考文献12

二级参考文献20

共引文献43

同被引文献51

引证文献6

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于规则的现代汉语常用助词用法自动识别 被引量：6

参考文献12

二级参考文献20

共引文献43

同被引文献51

引证文献6

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于规则的现代汉语常用助词用法自动识别被引量：6