期刊文献+

语义为核心的多文种信息处理平台的模型

Model of multilingual information processing platform based on semantic knowledge
下载PDF
导出
摘要 提出了一个基于语义、面向自然语言处理的多文种信息处理平台的模型SMIPP。该模型主要由应用程序/用户接口层、文字输入层和文字输出层、信息处理服务层、语料库层、多文种代码体系SemaCode层和语言Ontology层组成,该平台把各种语言文字统一用具有自描述能力的SemaCode表示,并通过语言Ontology来表示词汇的语义以及在各个文种间的联系,再通过服务形式提供各种基于语料库的文字信息处理功能,是一个全新的多文种信息处理模型。 A hierarchical model ofmultilingual information processing platform based on semantic knowledge (SMIPP) and oriented to natural language processing is proposed, which consists of application/user interface layer, character input/output layer, information services layer, corpora layer, SemaCode and language Ontology layer. That model encodes all languages and their characters with a self-describing multilingual encoding schema-SemaCode and expresses the semantics of words and the relation between similar words in different languages. A set of services is provided to process character information based on corpora, so it's a novel model to process multilingual information.
出处 《计算机工程与设计》 CSCD 北大核心 2008年第16期4335-4339,共5页 Computer Engineering and Design
基金 国家863高技术研究发展计划基金项目(2006AA01Z147) 国家自然科学基金项目(60673041) 江苏省高技术研究基金项目(BG2005020)
关键词 多文种信息处理 语义 本体 语义编码方案 语料库 multilingual information processing semantics ontology SemaCode corpus
  • 相关文献

参考文献4

二级参考文献29

  • 1-.信息技术 通用多八位编码字符集(UCS)[M].北京:中国标准出版社,1995..
  • 2吴健 李国华 等.开放式跨平台的输入方法子系统[J].软件学报,1999,:19-23.
  • 3[2]Debian Project Team.Introduction to ll8N.http:/www.debian.org/doc/manuals/intro-i 18n/index.en.htm l,2002-03
  • 4[3]Narita M,Hiura H.The Input Method Protocol[S]. Version 1.0. X Consortium Standard ,Open Software Foundation, 1990-11
  • 5[4]Tajime H.IM Server Developers Kit-c Language Interface. Xl1R6Xi 18N Implementation Group.http.//ftp.unicomp.br/pub/X II/releases/unsupported/lib/IM dit,2002-05
  • 6[5]Quercia V,O'Reilly T. X Window System Users Guide. Volume Three, OReilly & Associates Inc. ,1993-01
  • 7吴健,软件学报,1999年,增刊,19页
  • 8信息技术开放系统中文API界面规范 (GB/T 16681- 1996),1997年
  • 9Sun Yufang,9th International Unicode Conference,1996年
  • 10信息技术通用多八位编码字符集 (UCS),1995年

共引文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部