期刊文献+

基于规则的现代汉语常用助词用法自动识别 被引量:6

Automatic annotation of auxiliary words usage in rule-based Chinese language
下载PDF
导出
摘要 目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库"三位一体"的助词知识库基础上,采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明,对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率,减轻人工标注的工作量,提高大规模语料库的质量。 The existing results of auxiliary word can hardly be used in the automatic annotation of natural language processing.Based on the auxiliary words knowledge database which consists of dictionaries,rule base and corpus base,the rule-based method was used in automatic annotation of auxiliary words usage.The experimental result shows that refining,extending and adjusting the matching order of the rules can promote the precision and recall effectively.It is also helpful to improve the quality of Chinese corpus,deepen the processing depth,and reduce the artificial work.
出处 《计算机应用》 CSCD 北大核心 2011年第12期3271-3274,共4页 journal of Computer Applications
基金 国家自然科学基金资助项目(60970083) 北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1004) 河南省科技创新人才杰出青年基金资助项目(104100510026)
关键词 助词 知识库 用法 规则 自动识别 auxiliary word knowledge base usage rule automatic annotation
  • 相关文献

参考文献12

  • 1张谊生.助词与相关格式[M].合肥:安徽教育出版社,2000:5-6.
  • 2俞士汶,朱学锋,王惠,等.现代汉语语法信息词典[M].2版.北京:清华大学出版社,2003.
  • 3昝红英,刘锐,张坤丽.基于错误驱动的现代汉语副词用法的自动识别研究[C]//河南省计算机学会2009学术年会论文集.北京:电子工业出版社,2009:203-209.
  • 4昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量:27
  • 5昝红英,张坤丽,柴玉梅,等.现代汉语副词用法形式化描述[c]//第八届汉语词汇语义学研讨会论文集.香港:香港理工大学,2007:1-6.
  • 6郝丽萍,昝红英,张坤丽,等.面向机器识别的现代汉语副词用法规则问题研究[c]//第七届中文信息处理国际会议论文集.北京:电子工业出版社,2007:74-77.
  • 7刘锐 咎红英 张坤丽.现代汉语副词用法的自动识别研究.计算机科学,2008,(8):172-174.
  • 8昝红英,张军珲,朱学锋等.副词"就"的用法及其自动识别研究[c]//第十届汉语词汇语义学研讨会论文集.烟台:鲁东大学,2009:347-355.
  • 9ZHANG KUNLI, ZHANG WENCONG, ZAN HONGYING, et al. Studies on automatic recognition of several common Chinese adverbs' usages based on BP neural networks[ C]/! Proceedings of the 10th Chinese Lexical Semantics Workshop. 烟台:鲁东大学出版社, 2009:31 - 37.
  • 10韩英杰,张坤丽,昝红英,柴玉梅.基于助词用法的汉语词性、分词错误自动发现[J].计算机应用研究,2011,28(4):1318-1321. 被引量:3

二级参考文献20

  • 1俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量:29
  • 2吴云芳,俞士汶.信息处理用词语义项区分的原则和方法[J].语言文字应用,2006(2):126-133. 被引量:30
  • 3刘锐 咎红英 张坤丽.现代汉语副词用法的自动识别研究.计算机科学,2008,(8):172-174.
  • 4袁应成,昝红英,张坤丽,等.基于规则的虚词用法自动标注算法设计与系统实现[C]//第十一届汉语词汇语义学研讨会论文集.苏州:苏州大学,2010:163-169.
  • 5田玉英.现代汉语常用助词研究[D].兰州:西北师范大学,2009.
  • 6昝红英,刘锐,张坤丽.基于错误驱动的现代汉语副词用法的自动识别研究[C]//河南省计算机学会2009学术年会论文集.北京:电子工业出版社,2009:203-209.
  • 7昝红英,张坤丽,柴玉梅,等.现代汉语副词用法形式化描述[C]//第八届汉语词汇语义学研讨会论文集.香港:香港理工大学,2007.
  • 8郝丽萍,昝红英,张坤丽,等.面向机器识别的现代汉语副词用法规则问题研究[C]//第七届中文信息处理国际会议论文集.北京:电子工业出版社,2007:74-77.
  • 9昝红英,张军珲,朱学锋,等.副词“就”的用法及其自动识别研究[C]//第十届汉语词汇语义学研讨会论文集.烟台:鲁东大学,2009:347-355.
  • 10ZHANG Kun-li, ZHANG Wen-cong, ZAN Hong-ying, et al. Studies on automatic recognition of several common Chinese adverbs' usages based on BP neural networks[ C ]//Proc of the 10th Chinese Lexical Semantics Workshop. 2009.

共引文献43

同被引文献51

引证文献6

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部