期刊文献+

汉英双语平行语料库的词义标注 被引量:4

Word Sense Tagging in Chinese-English Parallel Corpora
下载PDF
导出
摘要 本文充分利用当前HowNet资源中概念的可计算性和句子对齐的汉英双语平行语料库信息,将词义排歧的问题转化为两种语言相对应句子词义组合的相似度计算问题,进而利用动态规划法的思想设计出一种在一定的时间复杂度内,有效的标出多义词义项的算法。该方法从以前对每个多义词进行排歧时只考察其上下文环境和对应信息,改变到对句子中所有的词同时考察上下文环境,这样就可以站在句子高度来进行词义标注,最终取得了满意的实验结果。 Taking full advantage of the computability of the concept in the HowNet, this paper changes word sense tagging in Chinese - English parallel corpora into the similarity calculation between the concept combinations of the aligned sentences of the two languages. At the same time, the dynamic planning thought is used in order to reduce the time complexity of the algorithm. The current word sense tagging method in parallel corpora only used the context of the single ambiguous word and alignment information, but this method can take into account the all words' context in the aligned sentences together. In this way it can settle the problem from the viewpoint of the whole sentence and achieve the satisfactory result.
出处 《中文信息学报》 CSCD 北大核心 2005年第6期50-56,共7页 Journal of Chinese Information Processing
关键词 人工智能 自然语言处理 词义排歧 HOWNET 双语平行语料库 artificial intelligence natural language processing word sense disambiguation HowNet parallel corpora
  • 相关文献

参考文献11

  • 1鲁松,白硕,黄雄,张健.基于向量空间模型的有导词义消歧[J].计算机研究与发展,2001,38(6):662-667. 被引量:36
  • 2张刚 刘挺 卢志茂 马金山 李生.隐马尔科夫模型和HowNet在汉语词义标注中的应用[J].计算机应用研究,2003,20(9):40-42.
  • 3李涓子,黄昌宁.基于转换的无指导词义标注方法[J].清华大学学报(自然科学版),1999,39(7):116-120. 被引量:8
  • 4杨尔弘,张国清,张永奎.基于义原同现频率的汉语词义排歧方法[J].计算机研究与发展,2001,38(7):833-838. 被引量:26
  • 5朱靖波,李珩,张跃,姚天顺.基于对数模型的词义自动消歧[J].软件学报,2001,12(9):1405-1412. 被引量:13
  • 6Gale W., K. Church and D. Yarowsky. Using Bilingual Materials to Develop Word Sense Disambiguation Methods[ A ]. In Proceedings, Fourth International Conference on Theoretical and Methodological Issues in Machine Translation[C]. Montreal, 1992. 101- 112.
  • 7Li, C, and H. Li. Word Translation Disambiguation Using Bilingual Bootstrapping[A]. In: Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL) [C], Philadelphia, 2002. 343 - 351.
  • 8Diab, M. and P. Resnik. An Unsupervised Method for Word Sense Tagging using Parallel C6rpora[A] .In: Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL) [C], 2002. 255 - 262.
  • 9Ng, H. T., Wang, B., Chart, Y.S. Exploiting Parallel Texts for Word Sense Disambiguation: An Empirical Study[ A ].In Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics (ACL) [ C ], Sapporo,2003. 455 - 462.
  • 10刘群 李素建.基于《知网》的词汇语义相似度计算[A]..第三届汉语词汇语义学研讨会[c].台北,2002..

二级参考文献16

  • 1董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量:58
  • 2李娟子.汉语词义消歧方法研究:博士论文[M].北京:清华大学,1999..
  • 3鲁川.信息处理用汉语句子语序的认知研究[A]..见:中国中文信息学会二十周年学术会议[C].北京:清华大学出版社,2001.186-197.
  • 4倪文杰,现代汉语辞海,1994年
  • 5梅家驹,同义词词林,1983年
  • 6李娟子,博士论文,1999年
  • 7李涓子,清华大学学报,1999年,39卷,7期,229页
  • 8董振东,语言文字应用,1998年,27卷,3期,76页
  • 9董振东,http://wwwhownetcom
  • 10Stetina Jiri,Proc 5th Workshop on Very Large Corpora,1997年,66页

共引文献93

同被引文献86

引证文献4

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部