期刊文献+

下一站在哪里? 被引量:2

Where is The Next Stop?
下载PDF
导出
摘要 该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要差异,讨论了语言的共性与个性。该文表示了对于中文大规模语料的词性标注、树库建设的质疑。该文提出未来的中文语言资源建设的一些设想,期望一些新的尝试,提出以语义取代现有的句法,以深度标注取代现有的浅层标注,具体将包括标注的目标的定点化,内容的多样化,步骤的阶段化,标注人员的大众化、群体化。文章还提出了未来发展的关键点:技术的融合,人本计算。 This paper briefly depicts major achievements in the Chinese language information processing and roughly reviews the computational linguistic research for the recent 20 years in China.The author questions the current methodologies such as POS tagging and treebank for Chinese.The paper presents some new ideas about the construction of Chinese data resources.The authors suggest that for Chinese we should address deep and semantic annotation instead of current shallow and syntactic one.The future annotation will include targeted tackling,diversified content,stepwise procedure,and non-professional annotators.The paper predicts some eye-catching features: merge of technologies and human-centered computing.
出处 《中文信息学报》 CSCD 北大核心 2011年第6期3-11,共9页 Journal of Chinese Information Processing
关键词 中文信息处理 语言数据资源 语料标注 句法 语义 Chinese information processing linguistic data resources annotation syntax semantics
  • 相关文献

参考文献9

  • 1冯志伟.论语言学研究中的战略转移[J].现代外语,2011,34(1):1-11. 被引量:17
  • 2Shuly Wintner, What Science Underlies Natural Lan- guage Engineering? [Jl. Computational Linguistics Volume 35, Number 4, 2009 Association for Compu-tational Linguistics.
  • 3Dong Zhendong, Dong Qiang. HowNet and the Com- putation of Meaning[M]. World Scientific Publishng Company, Singapore, 2006.
  • 4邢富坤,宋柔.自动词性标注中语法因素和词汇因素对英汉语的不同影响[C]//CCL-2011论文集,清华大学出版社,2011.
  • 5宋柔.从语言工程看汉语词类[M]//语言学论丛(第40辑),商务印书馆,2009.
  • 6沈家煊.我只是接着向前跨了半步-再谈汉语的名词和动词[M]//语言学论丛(第40辑),商务印书馆,2009.
  • 7李艳娇,杨尔弘.树库中歧义组合考察[C]//CCL-2011论文集,清华大学出版社,20.11.
  • 8Kenneth Church, A pendulum Swung Too Far[J]. Linguistic Issues in Language Technology-LiLT,Volume 2, Issue 4 May 2007.
  • 9张桂平,蔡东风.基于知识管理和智能控制的协同翻译平台——知识管理和机器翻译的融合[J].中文信息学报,2008,22(5):3-11. 被引量:9

二级参考文献25

共引文献24

同被引文献30

  • 1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量:90
  • 2信息处理用现代汉语词类标记集规范[J].语言文字应用,2001(3):16-20. 被引量:13
  • 3靳光瑾,肖航,富丽,章云帆.现代汉语语料库建设及深加工[J].语言文字应用,2005(2):111-120. 被引量:46
  • 4俞士汶 朱学锋 刘云.现代汉语广义虚词知识库的建设.汉语语言与计算学报,2003,(1):89-98.
  • 5Tesniere L.Elements de syntaxe structurale.Editions Klincksieck.1959.
  • 6Ting Liu,Jinshan Ma,Sheng Li.Building a Dependency Treebank for Improving Chinese Parser[J].Journal of Chinese Language and Computing,16 (4):207-224.
  • 7Wanxiang Che,Zhenghua Li,Ting Liu.LTP:A Chinese Language Technology Platform[C]//Proceedings of the Coling 2010:13-16.
  • 8Ryan McDonald,Koby Crammer,Fernando Pereira.Online Large-Margin Training of Dependency Parsers[C]//Proceedings of Association for Computational Linguistics (ACL).2005:91-98.
  • 9Ryan McDonald,Fernando Pereira.Non-projective Dependency Parsing using Spanning Tree Algorithms[C]//Proceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing (HLT/EMNLP).2005:523-530.
  • 10Ryan McDonald,Fernando Pereira.Online Learning of Approximate Dependency Paring Algorithms[C]//Proceedings of European Association for Computational Linguistics (EACL).2006:81-88.

引证文献2

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部