期刊文献+

WEB文本挖掘的中文分词系统的设计与实现 被引量:1

Design and Implementation of Chinese Automatic Word-cut in Web Text Mining
下载PDF
导出
摘要 设计了一个基于W eb文本挖掘的分词系统。具体介绍了如何将H tm l格式的文档转化为Txt格式文本,以及利用M M法来实现对文档的汉语自动分词。并采用最大匹配加回退一字方法,处理交段长度为1的交集型歧义字段。 This paper designed and realized a Chinese automatic word-cut system in Web text mining. It begins to introduce a method of how to change Html form text into Txt form text in detail. Then, it analyzes the use of MM method to realize the Chinese automatic word-cut in Web text. Finally, this paper examines the method of the most match with back to a word to dispel word ambiguity.
出处 《三明学院学报》 2005年第2期197-200,共4页 Journal of Sanming University
关键词 文本挖掘 中文自动分词 消歧 text mining Chinese automatic word-cut dispel ambiguity
  • 相关文献

参考文献5

二级参考文献34

  • 1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量:83
  • 2骆正清,陈增武,胡上序.一种改进的MM分词方法的算法设计[J].中文信息学报,1996,10(3):30-36. 被引量:28
  • 3关英春,中文信息学报,1996年,1期
  • 4揭春雨,中文信息学报,1989年,1期
  • 5赵珀璋,计算机中文信息处理,1989年
  • 6张国煊,计算机研究与发展,1993年,1期,61页
  • 7冯志伟,中文信息处理与汉语研究,1992年,12页
  • 8贺银云,计算机杂志,1991年,1/3期,144页
  • 9何克抗,中文信息学报,1991年,2期,1页
  • 10韩世欣,中文信息学报,1990年,4期,48页

共引文献160

同被引文献2

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部