期刊文献+

基于量词的名词概念获取研究

Concept Acquisition Based on Chinese Classifier Words
下载PDF
导出
摘要 概念获取是自然语言理解领域中重要的研究课题。该文提出了一种基于汉语量词的名词概念描述方法,设计并实现了一个权重计算方案。通过聚类实验探索了量词对名词语义区分的作用和贡献,实验结果表明基于量词的名词概念表达方式是有效的,可以区分大部分名词概念。 Concept acquisition from corpora has become increasingly important in NLP. This paper presents a new concept representation based on classifier words. Concepts are modeled as vectors with one component corresponding to each classifier word. We propose a weighting scheme that assigns each classifier word a weight in a concept. Then we conduct experiments to identify concept similarities via clustering, and the results show classifier words can categorize most concept classes.
作者 王萌 俞士汶
出处 《中文信息学报》 CSCD 北大核心 2014年第5期60-65,共6页 Journal of Chinese Information Processing
基金 国家自然科学基金(No.61300152)
关键词 概念获取 量名搭配 量词 聚类 Concept acquisition classifier-noun collocation classifier words cluster
  • 相关文献

参考文献10

  • 1Almuhareb A,Poesio M.Attribute-based and valuebased clustering:an evaluation[C]//Proceedings of the EMNLP,2004.
  • 2Huang Chu-ren,CHEN Keh-jiann,GAO Zhao-ming.Noun Class Extraction from a Corpus-based Collocation Dictionary:An Integration of Computational and Qualitative Approaches[J].Quantitative and Computational Studies of Chinese Linguistics,1998:339-352.
  • 3王萌,俞士汶,段慧明,孙薇薇.现代汉语名词语法属性的计量研究初探[J].中文信息学报,2008,22(5):22-29. 被引量:2
  • 4Hong Zhang.Numeral Classifiers in Mandarin Chinese[J].East Asian Linguist,2007(16):43-59.
  • 5Grefenstette,Gregory.SEXTANT:Extracting Semantics from Raw Text Implementation Details[R].Compater Science Technical keport,Cs92-05,University of Pittsburgh,Feb.1992.
  • 6Karypis G.CLUTO:A Clustering toolkit[R],Technical Report 02-017,University of Minnesota,2002.
  • 7Dongdong Zhang,Mu Li,Nan Duan.Measure Word Generation for English-Chinese SMT System[C]// Proceedings of the ACL,2008:89-96.
  • 8D Lin.Automatic Retrieval and Clustering of Similar Words[C]//Proceedings of the COLING-ACL,1998:768-774.
  • 9Dominic Widdows,Beate Dorow.A Graph Model for Unsupervised Lexical Acquisition[C]//Proceedings of the COLING,2002:1093-1099.
  • 10Tai,James H Y.Chinese Classifier Systems and Human Categorization[M].In Honor of Professor William S-Y.Wang:Interdisciplinary Studies on Language and Language Change,Matthew Chen and Ovid Tseng,eds.Pyramid Publishing Company,1994:479-494.

二级参考文献11

  • 1俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量:29
  • 2俞士汶,段慧明,朱学锋.汉语词的概率语法属性描述[J].语言文字应用,2001(3):21-26. 被引量:6
  • 3俞士汶 段慧明 朱学锋 等.北大语料库加工规范:切分·词性标注·注音[J].汉语语言与计算学报,2003,13(2):121-158.
  • 4何杰.现代汉语量词研究[M].北京:民族出版社,2001.
  • 5俞士汶.词的概率语法属性描述研究及其成果[M]∥许嘉璐,傅永和.中文信息处理现代汉语词汇研究.广州:广东教育出版社,2006.
  • 6Yu Jiangsheng, Jin Zhuihui, Wen Zhenshan. Automatic detection of collocation[C]//Hong Kong: Proceedings of the 4th Chinese Lexica Semantics Workshop, 2003.
  • 7俞士汶,朱学锋,段慧明,张化瑞.以词义为主轴的综合型语言知识库[C]//第六届汉语词汇语义学研讨会论文集.厦门:厦门大学.2005年4月,214-221.
  • 8俞士汶,段慧明,朱学锋.词语兼类暨动词向名词漂移现象的计量分析[C]//自然语言理解与大规模内容计算.北京:清华大学出版社,2005:70-76.
  • 9方芳,李斌.基于语料库的数量名短语识别[C]//第三届学生计算语言学研讨会论文集.沈阳,2006年8月.
  • 10俞士汶.建设综合型语言知识库的理念与成果的价值[J].中文信息学报,2007,21(6):3-12. 被引量:13

共引文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部