-
题名大数据集合中冗余特征排除的聚类算法设计
被引量:9
- 1
-
-
作者
侯莉莎
-
机构
天津大学
北京经贸职业学院
-
出处
《现代电子技术》
北大核心
2018年第14期48-50,54,共4页
-
基金
2014年度天津市教委科研计划项目(20140811)~~
-
文摘
传统microRNA聚类算法对数据的新特征要求较高,未全面分析大数据集内的冗余特征,使得聚类结果均衡性差。因此,提出大数据集合中冗余特征排除的聚类算法,其采用聚类集成算法,在组构造时期通过使用一致的聚类算法抽取各种子集样本,实现大数据冗余特征的排除,获取排除冗余特征的大数据集聚类结果。对得到的大数据聚类特征分类能力以及特征关联性实施度量,采用基于特征聚类以及随机子空间的miRNA识别算法,实现大数据集合冗余特征的聚类。实验结果表明,所提算法具有较高的冗余数据排除性能,该算法下的大数据聚类效果优,具有较高的均衡性。
-
关键词
大数据集
冗余特征排除
聚类算法
特征关联性
随机子空间
miRNA识别算法
-
Keywords
big data set
redundancy feature removal
clustering algorithm
feature correlation
stochastic subspace
miRNA recognition algorithm
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP311
[自动化与计算机技术—计算机软件与理论]
-