摘要
数据挖掘是从海量数据中提取隐含在其中的、针对某些用户的信息的高级处理过程。属性选择是数据挖掘领域非常重要的一个研究方向,属性选择的好坏对挖掘的性能和结果有着很大的影响。提出了一种新的属性选择算法,即基于信息增益和卡方检验的属性选择算法,并在离网预测模型中得到了应用,取得了相当不错的效果。
Data Mining is an advanced process in which hidden information is picked up for certain users from large volumes of data. Attribute selection is a very important aspect of data mining. It exercises a strong influence on the performance and the result of data mining. A new attribute selection algorithm based on information gain and chi-square is presented, which has a good performance in chum predictive model.
出处
《计算机应用与软件》
CSCD
北大核心
2007年第11期98-99,113,共3页
Computer Applications and Software
关键词
属性选择
数据挖掘
信息增益
卡方检验
Attribute selection
Data mining
Information gain
Chi-square