期刊文献+

面向事件的多语平行语料库构建研究 被引量:4

Research on Event-Oriented Multiligual Parallel Corpus Construction
下载PDF
导出
摘要 讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则,制定了具有分类信息的标注规范,初步建立了具有近七万句对的可控多语语料库。 Discusses several fundamental problems of muhilingual corpus construction, which oriented Beijing Olympic games, and proposes event-oriented multi-domain fused corpus selection rule, establishes marking guidelines with classification information. A controlled multilingual corpus has been built which contained nearly 70 000 aligned sentence pairs.
出处 《计算机应用研究》 CSCD 北大核心 2005年第11期23-24,30,共3页 Application Research of Computers
基金 国家"863"计划资助项目(2002AA117010-09) 国家自然科学基金资助项目(60375019)
关键词 语料收集原则 标注规范 可控多语语料库 Corpus Selection Rule Marking Guidelines Controlled Multilingual Corpus
  • 相关文献

参考文献4

  • 1黄昌宁.语料库语言[J].中国计算机用户,1990(11):43-45. 被引量:5
  • 2刘非凡 赵君 徐波.大规模非限定领域汉英双语语料库建设及句子对齐研究[M].北京:清华大学出版社,2003.339-345.
  • 3黄昌宁 李涓子.语料库语言学[M].北京:商务印书馆,2002..
  • 4常宝宝 柏晓静.北京大学汉英双语语料库标记规范[J].汉语语言与计算学报,2003,(2):195-209.

共引文献32

同被引文献103

引证文献4

二级引证文献55

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部