期刊文献+

现代汉语词汇历时检索系统的建设与应用 被引量:21

Diachronic Retrieval for Modern Chinese Word:System Construction and Its Application
下载PDF
导出
摘要 词汇是语言系统中最具活力的子系统。在语言演化的过程中,词汇的历时变化是语言学、历史学、社会学等多学科所关注的信息。我们收集了时间跨度约为60年的同质新闻语料。基于自然语言处理技术我们开发了现代汉语词汇历时检索系统。基于该平台可以利用频率、累积和与累积频率等方法从微观和宏观的角度上对词汇的语义、语用等方面进行研究。 Lexicon is the most active and time sensitive sub system of a language. During the evolution of a language, diachronic changes in vocabulary are focused by linguist, historian and sociologist etc. We collected large scale of corpora with a large time span, and developed the system of Diachronic Retrieval for Modern Chinese Word with natural language processing technology. It provides search indexes on frequency, cumulative sum, cumulative fre- quency etc. , for possible studies on the semantics pragmatics and other aspects of the word.
出处 《中文信息学报》 CSCD 北大核心 2015年第3期169-176,共8页 Journal of Chinese Information Processing
基金 国家自然科学基金(61300081 61170162) 国家语委项目(YB125-42) 国家高技术研究(863)发展计划(2015AA015409)
关键词 历时信息 词汇演化 历时计算 语料库 diachronic information lexicon evolution diachronic computing corpus
  • 相关文献

参考文献15

  • 1葛本仪.词汇的动态研究与词汇规范[A].载《词汇学理论与应用》苏新春,苏宝荣主编.北京:商务印书馆.2004.社.2011.
  • 2金观涛,刘青峰.观念史研究[M].北京:法律出版社,2009:178.
  • 3张仲民."局部真实"的观念史研究.《东方早报》2010年5月23日B05版.
  • 4邹嘉彦,邝蔼儿,路斌,蔡永富.汉语共时语料库与追踪语料库:语料库语言学的新方向[J].中文信息学报,2011,25(6):38-45. 被引量:7
  • 5Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden etl. Quantitative Analysis of Culture Using Mil- lions of Digitized Books. Science 331, 176 (2011).
  • 6李宇明.权威方言在语言规范中的地位[J].清华大学学报(哲学社会科学版),2004,19(5):24-29. 被引量:10
  • 7教育部语言文字信息管理司.中国语言生活状况报告[M].北京:商务印书馆,2009:525-534.
  • 8克劳德·艾尔伍德·香农.《通信的数学理论》(A mathematical theory of communication)贝尔系统技术,1948,1:379-423.
  • 9叶蜚声,徐通锵.语言学刚要(修订版)[M].北京:北京大学出版社.2010.
  • 10宋柔,罗智勇.现代汉语通用分词系统(GPWSv3.5)http://democlip, blcu. edu. on: 8081/gpws/.

二级参考文献96

共引文献197

同被引文献119

引证文献21

二级引证文献53

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部