期刊文献+

R语言在数据预处理中的开发应用 被引量:2

The Application of Data Pretreatment by Using R
下载PDF
导出
摘要 该文针对数据挖掘前期的数据预处理中数据观察和理解的灵活性不足开发周期长的问题,引入统计性语言R语言来开发数据预处理中需要实现的功能,搭建了数据预处理的流程结构,并将数据挖掘中的聚类算法,决策树算法引入前期的数据分析中来,这套应用系统能够方便快捷的观察数据并且根据实际需求来处理数据。最后使其处理电信公司的用户数据,取得了良好的效果。 In terms of the problems rise in the pre-process of data mining's prophase,there is some static language,i.e.the R Language,introduced to realize some necessary functions in the data pre-process,including too long development period and inadequate flexibility on data observation and understanding.The whole application system is not only able to observe data fast and conveniently,but also process the data according to the actual demands.At last,it's convinced that it's liable to dispose users' data of Telecom and obtain a favorable result by adopting this system.
作者 肖颖为 葛铭
出处 《杭州电子科技大学学报(自然科学版)》 2012年第6期165-168,共4页 Journal of Hangzhou Dianzi University:Natural Sciences
关键词 数据预处理 数据挖掘 统计语言 data preprocessing data mining statistical language
  • 相关文献

参考文献5

  • 1David Olson;Yong Shi;吕巍.商业数据挖掘导论[M]北京:机械工业出版社,200741-42.
  • 2刘莉,徐玉生,马志新.数据挖掘中数据预处理技术综述[J].甘肃科学学报,2003,15(1):117-119. 被引量:40
  • 3J.MacQueen. Some methods for classification analysis of multivariate observations[M].Los Angeles:University of California Press,1997.281-289.
  • 4W.Buntine. Learning classification trees[A].London:Chapman and Hall,1993.182-190.
  • 5Richard Roiger;Michael Geatz.数据挖掘教程[M]北京:清华大学出版社,20031-8.

二级参考文献1

共引文献39

同被引文献32

引证文献2

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部