期刊文献+

一个汉语词义自动标注系统的设计与实现 被引量:5

Design and Implementation of an Automatic System of Word Sense Tagging
下载PDF
导出
摘要 词义排歧在自然语言处理领域占有重要地位。词义排歧的精确率依赖于排歧知识的完备性。但是目前使用基于词典的和基于语料库的词义排歧方法来获取排歧知识的效果都不令人满意。文章将介绍了一个汉语词义自动标注系统,该系统实现了基于语料库的无指导的词义排歧模型,比较成功地解决了排歧知识的获取瓶颈问题。文章将给出系统的总体设计和具体实现,并给出系统测试结果。 : Word Sense Disambiguation has always been important in Natural Language Processing.The precision rate of word sense disambiguation depends on the completeness of disambiguation knowledge.Main methods currently in use,which are based on dictionary and on corpora,to disambiguate word sense are not satisfiable.This paper introduces an automatic system of Chinese word sense tagging.It implements an untutorial word sense disambiguation model based on corpora and solves the disambiguation knowledge acquisition bottleneck successfully.The paper also describes the whole design and concrete implementation and gives the performance evaluation.
出处 《计算机工程与应用》 CSCD 北大核心 2001年第17期170-173,共4页 Computer Engineering and Applications
基金 国家重点自然科学基金项目--语料库语言学研究的理论 方法和工具
关键词 自然语言处理 词义排歧 汉语词义 自动标准系统 设计 : Natural Language Processing,word sense disambiguation,disambiguation knowledge
  • 相关文献

参考文献4

  • 1李涓子 黄昌宁.一种无指导的词义排歧模型.JSCL-99计算语言学文集[M].,1999..
  • 2梅家驹 竺一鸣 等.同义词词林[M].上海:上海辞书出版社,1993..
  • 3李涓子,JSCL 99 计算语言学文集,1999年
  • 4梅家驹,同义词词林,1993年

共引文献5

同被引文献21

  • 1余正涛,樊孝忠,康海燕.基于自然语言理解的受限领域自动应答系统[J].计算机工程,2004,30(18):35-37. 被引量:10
  • 2刘亚清,张瑾,于纯妍.基于义原同现频率的汉语词义排歧系统[J].计算机技术与发展,2006,16(5):184-185. 被引量:1
  • 3崔世起,刘群,孟遥,于浩,西野文人.基于大规模语料库的新词检测[J].计算机研究与发展,2006,43(5):927-932. 被引量:32
  • 4王洋 秦兵 郑实福.句子相似度计算在FAQ中的应用[EB/OL].http://www.nlp.org.cn,.
  • 5刘群 李素建.基于&lt,知网&gt,的词汇语义相似度计算[EB/OL].www.hownet.com,.
  • 6ONG T H, CHEN H C. Updateable PAT-tree approach to chinese key phrase extraction using mutual information: a linguistic foundation for knowledge management [ C ]// Proceedings of the 2nd Asian Digital Library Conference. Taipei : [ s. n. ] , 1999 : 63- 84.
  • 7CHEN K J. Unknownword detection for chineseby a cor- pus-based learning method [ J ]. Computational Linguistics and Chinese Language Processing, 1998,3 (1): 27-44.
  • 8TERRA E, CLARKE C L A. Frequency estimates for sta- tistical word similaritymeasures [ C ]//In Proceedings of the Human Language Technology and North American Chapter of Association of Computational Linguistics Con- ference 2003,2003:244-251.
  • 9GAO Jianfeng, LI Mu, WU Andi, et al. Chinese word seg- mentation : a pragmatic approach [ R ]. Beijing : Microsoft Research Technical Report,2004.
  • 10韩艳,林煜熙,姚建民.基于统计信息的未登录词的扩展识别方法[J].中文信息学报,2009,23(3):24-30. 被引量:15

引证文献5

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部