期刊文献+

统计和规则相结合的并列结构自动识别 被引量:10

Automatic identification of coordinate structure based on statistics and rules
下载PDF
导出
摘要 并列结构的自动识别是语言信息处理中的难点,采用统计和规则相结合的方法对并列结构的边界进行了识别。首先,根据连接词的位置,使用最大熵模型分别从左和从右识别出并列结构的左边界和右边界;接着,根据并列结构的特性对自动识别的左右边界使用预定义的规则进行后处理,得到最终左右边界。实验的训练集和测试分别包含12 396和1 219个并列结构。实验表明,该方法性能达到了78.1%,其中后处理加入规则的使用提高了3.4%。 Automatic identification of coordinate structure is a challenging task for sentence analysis in natural language processing. The paper combined a statistical model and several novel rules to automatically identify boundaries of coordinate structures. Firstly, applied maximum entropy model to identify the left and right boundaries respectively. Then, according to specialties of coordinate structures, generated and used several novel rules to optimize the identifying results. The experiments were trained and tested on 12 396 and 1 219 coordinate structures. The results show that the combination of maximum entropy model and rules achieve performance 78.1% in F1, and that the rules bring 3.4% improvement in F1.
出处 《计算机应用研究》 CSCD 北大核心 2009年第9期3403-3406,共4页 Application Research of Computers
基金 国家"863"计划资助项目(2006AA01Z147) 国家自然科学基金资助项目(60673041)
关键词 并列结构 并列成分 最大熵模型 coordinate structure conjunct maximum entropy model
  • 相关文献

参考文献8

二级参考文献20

  • 1陆俭明,郭锐.汉语语法研究所面临的挑战[J].世界汉语教学,1998,12(4):3-21. 被引量:95
  • 2陈小荷.一个面向工程的语义分析体系[J].语言文字应用,1998(2):73-78. 被引量:11
  • 3李英哲,卢卓群.汉语连词发展过程中的若干特点[J].湖北大学学报(哲学社会科学版),1997,24(4):52-58. 被引量:20
  • 4马庆株.能愿动词的连用[J].语言研究,1988,8(1):18-28. 被引量:65
  • 5侯敏 黄昌宁 张普.汉语自动分析中的若干问题与对策[A].黄昌宁,张普.自然语言理解与机器翻译[C].北京:清华大学出版社,2001..
  • 6Chao Yuen Ren(赵元任) 吕叔湘译.A Grammar of Spoken Chinese[M]汉语口语语法[M].北京:商务印书馆,1979..
  • 7詹卫东译.框架语义学[A]..《语言学论从》第27辑[C].北京:商务印书馆,2003.382-412页.
  • 8Agarwal, R. and L. Boggess. 1992. A simple but useful approach to conjunct identification. Proceedings of 30th Annual Meeting of Association for Computational Linguistics. Newark, Delaware. Pp. 15-21.
  • 9Fellbaum, C., ed. 1999. Wordnet: An Electronic Lexical Database. Cambridge, MA: MIT Press.
  • 10Kurohashi, S. and M. Nagao. 1994. A syntactic analysis method of long Japanese sentences based on the detection of conjunctive structures. Computational Linguistics 20,4:507 - 34.

共引文献67

同被引文献57

引证文献10

二级引证文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部