-
题名结合近邻传播聚类的选择性集成分类方法
被引量:12
- 1
-
-
作者
孟军
张晶
姜丁菱
何馨宇
李丽双
-
机构
大连理工大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第5期986-993,共8页
-
基金
国家自然科学基金项目(61472061
61672126)~~
-
文摘
从海量的基因微阵列数据中提取出有价值的信息是生物信息学的研究热点.基因微阵列数据具有高维度、小样本和高冗余的特性.因此,提出一种基于相交邻域粗糙集的基因选择方法,挑选出关键基因用于对微阵列数据进行分类.首先利用pathway知识进行基因初步选择,每个pathway单元对应一个基因子集,然后采用基于粗糙集的属性约简方法筛选出无冗余的关键基因.由于pathway知识单元的数量较多,对应生成大量的基分类器,为了进一步提高基分类器之间的差异性和集成的效率,对基分类器进行选择是十分必要的.近邻传播聚类不需要提前设定聚簇数量和起始点并且可以更快速、精确地进行聚类.因此,使用近邻传播聚类方法对基分类器进行分组,产生差异性较大的聚簇,再从每个簇中选择一个分类器构建集成分类器.在拟南芥的生物和非生物胁迫响应相关的微阵列数据集上的实验结果表明:在准确率方面,提出的方法与现有的集成方法相比最多可以提高12%.
-
关键词
选择性集成
近邻传播
通路
相交邻域
基因微阵列数据
-
Keywords
selective ensemble
affinity propagation
pathway
intersection neighborhood
genemicroarray data
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-