期刊文献+

一种文本分类数据挖掘的技术 被引量:10

A Technology of Text Classification of Data Mining
下载PDF
导出
摘要 挖掘的理论和应用研究是数据挖掘领域一个新的重要分支 ,介绍了一种文本数据挖掘方法 .首先 ,论述了文本挖掘的意义和重要性 ,探讨了文本挖掘的定义和文本分类的一些形式 ,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题 ,并给出了一个基于该方法的文本分类系统的实验结果 。 Study and application of text data mining is one of the most important problems in the data mining. In this paper, we firstly study a method of text data mining. We first discuss the signification and importance of text data mining, and present the definition of text mining and some types of text classification. Then we give the key theory on text classification in detail, such as data processing, character mining, character denoting and character matching. Finally, we get some results of experiment by using a simple system based on the text classification method. These results of experiment mean that the method is feasible.
作者 杨斌 孟志青
出处 《湘潭大学自然科学学报》 CAS CSCD 2001年第4期34-37,共4页 Natural Science Journal of Xiangtan University
基金 湖南省教育厅资助项目 (0 0C85 )
关键词 文本挖掘 文本分类 数据挖掘 VSM Text mining Text classification Data mining VSM
  • 相关文献

参考文献5

  • 1李水平,陈意云,黄刘生.数据采掘技术回顾[J].小型微型计算机系统,1998,19(4):74-81. 被引量:38
  • 2王继成,潘金贵,张福炎.Web文本挖掘技术研究[J].计算机研究与发展,2000,37(5):513-520. 被引量:275
  • 3[3]Feldman R,Dagan I. Knowledge discovery in textual databases(KDT)[C]. In:Proc of the 1st Int'l Conf on Knowledge Discovery. Montreal,1995.112- 117.
  • 4[4]Wuthrich B,Permunetilleke D,Leung S et al. Daily prediction of major stock indices from textual WWW data[C].In:Proc of the 4th Int'l C onf on Knowledge Discovery.New York,1998.
  • 5[6]Koller D,Sahami M.Hierarchically classifying documents using very few wor ds[J].ICML97,1997.170-178.

二级参考文献15

  • 1Zhang T,Proc 1996 ACM-SIGMOD Int Conf Management of Data,1996年
  • 2Cheung D W,Proc 1996 Int’l Conf on Data Engineering,1996年
  • 3Li C S,Proceedings of the 12th Intl Conf on Data Engineering,1996年
  • 4Chen M S,Proceedings of the 16th International Conference on Distributed Computing Systems,1996年,385页
  • 5Park J S,Mining association rules with adjustable Accuracy,1995年
  • 6Chen M S,Using Multi-attribute predicates for mining classification rules,1995年
  • 7Ester M,Proc 4th Int Symp on Large Spatial Databases(SSD’95),1995年,67页
  • 8Park J S,Proceedings of ACM SIGMOD,1995年,175页
  • 9Han J,Proceedings of the 21th international Conference on Very Large Data Bases,1995年,420页
  • 10Park J S,Proceedings of the 4th Intern’l Conf on Information and Knowledge Management,1995年,31页

共引文献310

同被引文献98

引证文献10

二级引证文献78

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部