-
题名一个基于高内聚和低耦合的多数据库分类方法
被引量:4
- 1
-
-
作者
曹礼园
李深洛
-
机构
广东财经大学华商学院
广西师范大学计算机科学与信息工程学院
-
出处
《计算机与数字工程》
2016年第7期1226-1229,1342,共5页
-
文摘
数据库分类是多数据库存储、管理和挖掘的预处理技术。目前,不依赖具体应用的多数据库分类的研究甚少,并且忽略内聚度和耦合度,复杂度高。论文提出一个基于高内聚和低耦合的多数据库分类方法,该方法不依赖于具体的应用,避免了聚类结果的不稳定性,且降低了时间复杂度。具体地,该方法名为DHC首先构造一个多目标优化问题,然后利用层次聚类思想构造算法查找最优聚类。利用一个人工数据库和一个现实数据库相似度二维表进行实验,实验表明该方法聚类稳定性强,时间复杂度比BestClassification低,泛化能力强。
-
关键词
数据库聚类
多目标最优化
多数据库挖掘
层次聚类
-
Keywords
database clustering
multicriteria optimization
multi-database mining
hierarchical clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多目标最优化的最小代价决策树构建与实现
被引量:2
- 2
-
-
作者
曹礼园
李深洛
-
机构
广东科技学院
广西师范大学计算机科学与信息工程学院
-
出处
《计算机与数字工程》
2019年第12期3020-3024,共5页
-
基金
国家自然科学基金项目“基于GEP的可拓策略自组织生成理论与方法研究”(编号:61503085)资助
-
文摘
提出一种基于多目标最优化的代价敏感决策树构建方法。将误分类代价、测试代价、等待时间代价和信息增益率作为四个优化目标,利用线性加权和法把多目标最优化问题转化成单目标最优化问题,作为分裂属性选择的准则。然后提出了构建最小代价决策树的具体策略和测试决策树的一个混合测试方法。最后,用该算法和其它两个算法在两个真实的数据集中进行构建、测试,实验结果表明,该方法获得的决策树具有更小的代价,效率更高,泛化能力更强。该方法在医疗诊断中表现尤为突出。
-
关键词
代价敏感
误分类代价
测试代价
等待时间代价
多目标最优化
决策树
-
Keywords
cost sensitive
misclassification costs
test costs
wait time costs
multi-objective optimization
decision tree
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-