期刊文献+

基于最大熵方法进行动词搭配的自动标注

Autolabeling of Chinese verb-verb collocation based on maximum entropy principle
下载PDF
导出
摘要 搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。通过对已标注真实文本的分析,构造了动词搭配对的上下文变量信息特征模板,给出利用最大熵方法抽取动词—动词搭配,对待测的1000句汉语句子应用最大熵方法自动识别出搭配,其中封闭测试抽取正确率为85.6%,召回率达到70.6%。 Collocation plays an important role in parsing and verb is the kernel and precondition for Chinese parsing.This paper presents a method for verb--verb collocation based on maximum entropy principle,using the constructed characteristic modeling for context variable information via analyzing the real text labeled.By testing of 1 000 sentences with the maximum entropy principle,it has obtained S5.6% accuracy and 70.6% recall ratio.
出处 《计算机工程与应用》 CSCD 北大核心 2009年第3期135-137,共3页 Computer Engineering and Applications
基金 国家自然科学基金(No.60775041)~~
关键词 语料 搭配 特征选择 最大熵 corpus collocation feature selection maximum entropy
  • 相关文献

参考文献11

  • 1高建忠 见:黄昌宁 张普主编.汉语动宾搭配的自动识别研究[C].见:黄昌宁,张普主编.自然语言理解与机器翻译[C].清华大学出版社,2001.135-140.
  • 2陈小荷 见:黄昌宁 董振东主编.动宾组合的自动获取与标注[C].见:黄昌宁,董振东主编.计算语言学文集[C].清华大学出版社,1999.215-221.
  • 3穗志方,俞士汶.汉语单句谓语中心词识别知识的获取及应用[J].北京大学学报(自然科学版),1998,34(2):221-230. 被引量:16
  • 4赵军,黄昌宁.基于复杂特征的VN结构模板获取模型[J].软件学报,1999,10(1):92-99. 被引量:5
  • 5Choueka Y,Kleins T,Neuwitz E.Automatic retrieval of frequent idiomatic and collocational expressions in a large corpus[J].Journal of the Association for Literary and Linguistic Computing, 1983,4(1 ): 34-38.
  • 6Church K W,Hanks P.Word association norms,mutual information, and lexicography[C]//Proceedings of 27th Annual Meeting of the Association for Computationgal Linguistics, 1989:76-83.
  • 7孙茂松,黄昌宁,方捷.汉语搭配定量分析初探[J].中国语文,1997(1):29-38. 被引量:54
  • 8孙宏林 黄昌宁.词语搭配在文本中的分布特征[C]..1998中文信息处理国际会议论文集[C].清华大学出版社,1998.67-72.
  • 9王素格.动词与动词搭配自动获取方法[C]..Advances in Computation of Oriental Languages,20th International Conference on Computer Processing of Oriental Languages Shenyang,China,2003 Proceedings,Tsinghua Unversity Press[C].,2003-08.184-190.
  • 10白妙青,郑家恒.利用支持向量机实现动词-动词搭配的自动标注[J].计算机工程与应用,2005,41(35):164-166. 被引量:4

二级参考文献46

  • 1孙茂松,黄昌宁,方捷.汉语搭配定量分析初探[J].中国语文,1997(1):29-38. 被引量:54
  • 2俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量:34
  • 3陈小荷,语言工程,1997年,102页
  • 4罗振声,计算语言学进展与应用,1995年,159页
  • 5俞士汶,语文现代化论丛,1995年,193页
  • 6孙宏林 黄昌宁.词语搭配在文本中的分布特征[C]..1998中文信息处理国际会议论文集[C].清华大学出版社,1998.67-72.
  • 7王素格.动词与动词搭配自动获取方法[C]..Advances in Computation of Oriental Languages,20th International Conference on Computer Processing of Oriental Languages Shenyang,China,2003 Proceedings,Tsinghua Unversity Press[C].,2003-08.184-190.
  • 8Joachims T.Transductive inference for text classification using support vector machines[C].In:Proceedings of the 16th International Conference on Machine Learning(ICML),San Francisco:Morgan Kaufmann Publishers,1999:200-209.
  • 9Joachims T.Making large-scale SVM learning practical[C].In:Scho lkopf,Burges C,Smola A eds.Advances in Kernel Methods-Support Vector Learning B,MIT Press,1999.
  • 10Platt J.Sequential minimal optimization:a fast algorithm for training support vector machines[R].Technical Report,MSR-TR-98-14,Microsoft Research,1998.

共引文献137

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部