期刊文献+

数据挖掘与决策树J48算法在文本分类中的应用 被引量:4

Data Mining And Decision Tree J48 Algorithm Applied in Text Classification
下载PDF
导出
摘要 为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值. Rapid growth data in response to the information society, for users interested in or useful data, data must be to deal with,data mining technology is the application of this kind of need and development. Data mining to get useful data, must be the data types of classification, clustering, and associated processing three different kinds of tasks. For text information classification is one of the main application of data mining and decision tree algorithm using their own advantages and the classification efficiency, and has great application prospect in text processing, especially J48 algorithm with the classification of text information has extensive application value.
作者 胡新海
出处 《甘肃高师学报》 2015年第5期25-29,共5页 Journal of Gansu Normal Colleges
基金 陇南师范高等专科学校校级科研项目"基于决策树的微博垃圾评论检测研究"(2014LSZK02006)
关键词 数据挖掘 文本分类 J48算法 data mining text categorization J48 algorithm
  • 相关文献

参考文献5

  • 1BingLi著.Web数据挖掘[M].俞勇,薛贵荣译.北京:清华大学出版社,2009:56-59.
  • 2C.Castillo, D.Donato, L.Becchetti et al.A Refe- renee Collection for web Spam [C]//.ACM SIGIR Fo- rum, 2006,40(2) : 11-24.
  • 3胡新海.微博垃圾评论检测与预处理技术[J].湖南工程学院学报(自然科学版),2014,24(3):49-52. 被引量:2
  • 4Bing Liu.Web Data Mining[M].USA:Springer- Verlag Berlin Heidelberg, 2007 : 428-447.
  • 5Ruggieri S. Efficient C4.5[J].Knowledge and Da- ta Engineering, 2002,14(2):438-444.

二级参考文献13

  • 1C. Castillo, D. Donato, L. Becchetti. et ak A Reference Collection for web Spare[J]. ACM SIGIR Forum, 2006,40(2) : 11 -24.
  • 2Yardi S,Romerao D, Boyd D et al. Detecting Spare in a Twitter Network[J]. First Monday, 2010, 15(1) : 117-119.
  • 3Wang A. Don't olow me: Twister Spare Detection. Proceedings of 5th International Conference on Securi- ty and Cryptography (SECRYPT) [J] Athens,Z0i0: 12-15.
  • 4Mowbray M. The twittering machine [J]. Journal of Applied Statistics, 2010,17(2) :211-217.
  • 5Bing Liu. Web Data Mining: Exploring Hyperlinks, Con- tents and Usage Data[M]. Springer, 2007 : 428- 447.
  • 6邓冰娜.面向博客的垃圾评论识别方法研究[J].河北大学学报,2011,72(12):66-71.
  • 7Graham-Cumming, J. The Spammers" Compendium[J/ OL]. iattp://www, jgc. org/tsc, html.
  • 8bit. ly[EB/OL], http://bit, ly/, last accessed February 2011.
  • 9Tinyurl [ EB/OL ]. http ://tinyurl. corn, last accessed July 2010.
  • 10BingLi.Web数据挖掘[M].俞勇,薛贵荣译.北京:清华大学出版社,2009.

共引文献1

同被引文献25

引证文献4

二级引证文献40

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部