期刊文献+

基于Rough集的web文本分类研究

The Research of Web Text Categorization Based on Rough Set theory
下载PDF
导出
摘要 随着Internet的飞速发展,网络上的web信息资源迅速膨胀,如何在浩瀚的web文本信息资源中高效精确地挖掘出有用的知识已经成为目前的研究热点之一。本文首先介绍了web文本分类的基本概念,并对分类过程中的几个关键技术做了简单描述,然后对传统的属性约简方法进行了改进,初步证明该改进可降低决策表的维数,从而减少运算量,提高了效率。 With the fast development of Internet, the Information Resource is expanding rapidly. So how to mine the useful knowledge effectively and exactly in large web text information resources have become one of the research hot sots. First, this paper introduces the basic concept of web text categorization and describes the key technique during the course of categorization. Then, the traditional way of reduction attributes is improved, and the improvement can decrease the dimension of the decision table. So it reduces the operations and improves the efficiency.
出处 《微计算机信息》 2009年第27期180-181,8,共3页 Control & Automation
基金 基金颁发部门:国家自然科学基金委(60863002)
关键词 WEB文本分类 ROUGH集 属性约简 决策表 web text categorization Rough set Reduction of attributes Decision table
  • 相关文献

参考文献5

  • 1徐甜,肖新峰.Web文本表示及其分类研究[J].微计算机信息,2007,23(21):284-285. 被引量:7
  • 2张冬慧,孙波,徐照财,程显毅.文本自动分类关键技术研究[J].微计算机信息,2008,24(6):197-199. 被引量:12
  • 3Chute C G. An example based mapping method for text categorization and retrieval[J]. ACM Transactions on Information System, 1994,12 (3) :252 - 277.
  • 4Pawlak Z. Rough Sets [J].International Journal of Computer and Information Science,1982,11 (5):341-356.
  • 5刘清.Rough集及Rough推理[M].北京:科学出版社,2001..

二级参考文献10

  • 1亓洪标,李安,胡柏青.基于XML的web文本挖掘方法与模型研究[J].微计算机信息,2006,22(11X):196-197. 被引量:5
  • 2[1]Harry Zhang,Charles X.Ling.A Fundamental Issue of Naive Bayes,Advances in Artificial Intelligence,AI2003[C],Halifax,Canada,2003(6):591?595.
  • 3[2]Han-joon Kim,Jae-young Chang.Improving Naive Bayes Text Classifier with Modified EM Algorithm[C].ISMIS 2003:326-333.
  • 4[6]Salton G,McGill M.J.Introduction to Modern Information Retrieval[M].NewYork,McGraw-Hill,1983.
  • 5http://www.pku .edu .cn/comwim2004/sunleap/personal/article3.htm.杨庆跃.Web数据挖掘的研究现状及发展
  • 6毛国君,段立娟,王实,等.数据挖掘原理与算法[M].北京:清华大学出版社,2006:183.
  • 7Margaret H.Dunham著.郭崇慧等译,数据挖掘教程[M].北京:清华大学出版社,2006.3.
  • 8Jaideep Srivastava,Robert Cooley,Mukund Deshpande,PangNing Tan,Web usage mining:discovery and applications of usage patterns from web data,http://www.acm.org/sigs/sigkdd/explorations/issue 1-2/srivastava.pdf.
  • 9John R.Punin,Mukkai S.Krishnamoorthy,Mohammed J.Zaki,Web Usage Mining-Languages and Algorithms,http://www.cs.rpi.edu/-puninj/LOGML/TR01-3.pdf.
  • 10李钝(导师:梁吉业),基于粗糙集理论的文本挖掘技术研究,山西大学硕士研究生学位论文,2003.

共引文献375

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部