期刊文献+

Weka期货数据挖掘中连续属性划分策略研究

下载PDF
导出
摘要 数据挖掘过程中的数据预处理是一项很重要的工作。分析了现有分类算法J48直接处理原始期货数据时出现的分类准确率和预测准确率低等弊端。针对期货数据的连续性和时序性特征,在Weka数据挖掘平台下,提出一种面向期货数据的连续属性划分策略,其主要思想是对连续属性采用不同的分段标识方法,从中找出一种最适合期货数据特征的划分机制,进而在有效降低数据过度拟合的前提下,较大提高J48算法的分类准确率和预测准确率。
作者 陈磊
出处 《软件导刊》 2016年第6期173-176,共4页 Software Guide
  • 相关文献

参考文献15

  • 1IAN H WITTEN, EIBE FRANK, MARK A HALL. Data mining practical machine learning tools and techniques[M]. ELSEVIER, 2010.
  • 2IIANHWITTEN,EIBEFRANK,MARKA.数据挖掘:实用机器学习工具与技术[M].李川,译.北京:机械工业出版社,2014.
  • 3Jiawei Han.Michaeline Kamber.数据挖掘概念与技术[M].北京:机械工业出版社,2004
  • 4DAI W,JI W. A MspReduce implementattion of C4.5 decison tree algorithm[J]. International Journal of Database Theory and Appli cation,2014,7(1) :49-60.
  • 5QUINLAN J R. C4.5.-programs for machine learning[M]. Burling- ton: Morgan Kaufmann Publishers, 1993 : 17-42.
  • 6ABELLAN J, MORAL S. Building classification trees using the total uncertainly criterion[J]. Journal of the Royal Statistical Socic t y, Series B : Methodological, 1996,58 ( 1 ) : 3-57.
  • 7HETTICH S,BAY S D. The UCI KDD archive[EB/OL], http:// kdd. ics. uic. edu/.
  • 8QUINLAN J R. Induction of decision tree[J]. Machine learning, 1986(1) :81-106.
  • 9杨学兵,张俊.决策树算法及其核心技术[J].计算机技术与发展,2007,17(1):43-45. 被引量:88
  • 10王毅,高红岩,王晓明.模糊控制理论在新技术评价中的应用[J].太原科技大学学报,2006,27(4):259-262. 被引量:2

二级参考文献20

  • 1谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报,2005,28(9):1570-1574. 被引量:134
  • 2SU C T,HSU J H.An extended CHI2 algorithm for discretization ofreal value attributes[J].IEEE Trans on Knowledge and Data En-gineering,2005,17(3):437-441.
  • 3FAYYAD U M,IRANI K B.Multi-interval discretization of continu-ous-valued attributes for classification learning[C]//Proc of the 13thInternational Joint Conference on Artificial Intelligence.San Mateo,CA:Morgan Kaufmann,1993:1022-1027.
  • 4TSAI C J,LEE C I,YANG Wei-pang.A discretization algorithm basedon class-attribute contingency coefficient[J].Information Sciences,2008,178(3):714-731.
  • 5KURGAN L A,CIOS K J.CAIM discretization algorithm[J].IEEETrans on Knowledge and Data Engineering,2004,16(2):145-153.
  • 6RUIZ F J,ANGULO C,AGELL N.IDD:a supervised interval dis-tance-based method for discretization[J].IEEE Trans on Know-ledge and Data Engineering,2008,20(9):1230-1238.
  • 7JIN R,BREITBART Y,MUOH C.Data discretization unification[J].Knowledge and Information System,2008,19(1):1-29.
  • 8ZIARKO W.Variable precision rough set model[J].Computer andSystem Science,1993,46(1):39-59.
  • 9DEMAR J.Statistical comparisons of classifiers over multiple datasets[J].Journal of Machine Learning Research,2006,7:1-30.
  • 10HETTICH S,BAY S D.The UCI KDD archive[EB/OL].(1999).ht-tp://kdd.ics.uci.edu/.

共引文献110

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部