期刊文献+

基于文本挖掘的搭配词典自动架构探讨 被引量:2

Automatic Construction of CollocationsDictionary Based on Text Mining
下载PDF
导出
摘要 研究词语搭配的关系对于自然语言处理有很大的帮助。目前对计算机用的搭配词典是用人工方法实现的,它由人工进行维护,有更新慢、收藏的词少等缺点。为此,利用文本挖掘技术对大规模语料库进行分析,挖掘词语搭配的深层关系,在此基础上自动建立词语搭配词典,实验结果显示该方法是有效的。 A collocations dictionary is the useful component to many natural language and spoken language processing application such as grammar checking, text-speech conversion and machine translation. Currently The collocations dictionary is constructed artificially, firstly it may not be updated frequently and many lexicon entries may be not available. Secondly to construct a dictionary may need lots of human resources. In this paper, text-mining approach for constructing a collocations dictionary is surveyed. The main purpose is to enable cheap and quick acquisition of a collocations dictionary from a large text corpus. Experimental results show that the approach is effective and suitable.
作者 张辉 薛贵荣
出处 《上海工程技术大学学报》 CAS 2004年第4期323-326,共4页 Journal of Shanghai University of Engineering Science
基金 上海工程技术大学青年基金资助项目(2003Q03)
关键词 文本挖掘 互信息 关联规则挖掘 搭配词典 text mining mutual information association rule mining collocations dictionary
  • 相关文献

参考文献6

  • 1Agrawal R,Srikant R. Mining Sequential Patterns [A]. Proc. of 11th International Conference on Data Engineering [C]. Taipei: IEEE Computer Society,1995.
  • 2闻扬,苑春法,黄昌宁.基于搭配对的汉语形容词-名词聚类[J].中文信息学报,2000,14(6):45-50. 被引量:11
  • 3Rajman M, Beancon R. Text Ming: Natural language techniques and Text Mining applications [A]. Proc. of the 7th IFIP Working Conference on Database Semantics (DS-7) [C]. Leysin: Chapam & Hall, 1997.
  • 4Agrawal R,Srikant R. Fast Algorithms for Mining Association Rules [A]. Proc. of 20th VLDB Conference [C]. Santiago: Morgan Kafmann,1994.
  • 5HanJ.数据挖掘--概念与技术(影印版)[M].北京:高等教育出版社,2001..
  • 6Church K, Hanks P. Word Association Norms,Mutual Information and Lexicography [J]. Computational Linguistics ,1990,16(1) :22~29.

二级参考文献8

  • 1许伟.句法-语义一体化的汉语句法分析研究[硕士学位论文].北京:清华大学,1997..
  • 2边肇祺.模式识别[M].北京:清华大学出版社,1997..
  • 3Li Hang,Clustering Words with the MDL Principle ,cmplg/ 960 50 14,1996年
  • 4姬东鸿,汉语形容词和名词的语义组合模型,1996年
  • 5倪文杰,现代汉语辞海,1994年
  • 6边肇祺,模式识别,1998年
  • 7李涓子,基于组合实例的双向优化聚类 .JSCL - 97,1997年
  • 8许伟,硕士学位论文,1997年

共引文献10

同被引文献10

引证文献2

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部