-
题名基于多值属性和数值属性数据的遗传分类算法
被引量:1
- 1
-
-
作者
黄金才
陈文伟
-
机构
国防科技大学系统工程与数学系
-
出处
《计算机科学》
CSCD
北大核心
2001年第2期119-121,共3页
-
基金
国家自然科学基金97670019
-
文摘
1 引言
传统的遗传分类算法[1]只能够从字符属性(枚举类型,取值有限)中发现分类规则.当属性取值很多时,所得到的规则数目也急剧增加,数据的规律性不能够很好地被认识到.虽然有许多算法可以合并规则,减少规则的数目,但是这种合并是在规则已经得到的情况下进行的,后面的实验可以表明,若合并在搜索过程进行,遗传算法的效率可以得到有效的提高.传统遗传分类算法的另外一个不足是它不能够处理数值属性(连续取值,取值无限).而现实的问题是数据开采面对的数据一般既包含字符属性又包含数值属性(这种数据在本文称之为混合数据),这时传统的遗传分类算法往往无能为力.这些数值属性,如医疗数据中的年龄(AGE)字段,即使在待开采数据集中它的取值是有限的,我们也不能把它与字符属性等同看待,因为它表示含义是连续的.
-
关键词
遗传分类算法
多值属性
数值属性数据
编码
-
Keywords
Genetic Algorithm Classifying rule,Genetic classifying
-
分类号
O242.23
[理学—计算数学]
-