-
题名基于泛化中心聚类的不完备数据集填补方法
被引量:11
- 1
-
-
作者
王妍
王凤桐
王俊陆
宋宝燕
石展
-
机构
辽宁大学信息学院
东北大学计算机科学与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第9期2017-2021,共5页
-
基金
国家自然科学基金项目(61472169
61472072)资助
+2 种基金
国家科技支撑计划项目(2012BAF13B08)资助
国家"九七三"重点基础研究发展计划前期研究专项项目(2014CB360509)资助
辽宁省科学事业公益研究基金项目(2015003003)资助
-
文摘
随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统的缺失数据的填补方法大部分都只考虑不完备集中数据完全缺失情况下的填补,然而,在海量数据集中,由于人为或者机械等原因会对数据造成一定程度的损坏,有些数据会完全缺失,而有些数据只是部分缺失,传统的填补方法未对不同程度上损坏的数据进行划分,全部按照完全缺失数据进行填补分析,忽略了部分缺失数据对数据填补结果的影响.因此,提出一种基于泛化中心聚类的填补方法(GCF),采用泛化中心聚类思想对数据进行分簇,并对随机损坏数据与聚类结果一起进行缺失数据的填补,以提高填补后数据集的正确率.实验表明,针对不同缺失度的数据集样本,提出的GCF策略在填补正确率方面都具有良好的表现.
-
关键词
海量数据
不完备数据集
泛化中心聚类
数据损坏度
-
Keywords
mass data
incomplete data
generalized centroids clustering
stochastic damage
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名分类属性数据的泛化中心聚类算法
- 2
-
-
作者
武森
张桂琼
潘静
全敏
-
机构
北京科技大学东凌经济管理学院
-
出处
《运筹与管理》
CSSCI
CSCD
北大核心
2014年第6期37-43,共7页
-
基金
国家自然科学基金资助项目(71271027)
中央高校基本科研业务费专项资金(FRF-TP-10-006B)
高等学校博士学科点专项科研基金(20120006110037)
-
文摘
针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。
-
关键词
聚类算法
泛化中心
分类属性
K-modes
-
Keywords
clustering algorithm
generalized centroid
categorical attribute
K-modes
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名引入稳定学习的多中心脑磁共振影像统计分类方法研究
- 3
-
-
作者
杨勃
钟志锴
-
机构
湖南理工学院信息科学与工程学院
-
出处
《湖南理工学院学报(自然科学版)》
CAS
2024年第1期15-19,共5页
-
基金
湖南省研究生科研创新项目(CX20221231,YCX2023A50)
湖南省自然科学基金项目“面向小样本脑磁共振影像分析的数据生成技术与深度学习方法研究”(2024JJ7208)。
-
文摘
针对现有统计分析方法在多中心统计分类任务上缺乏稳定性的问题,提出一种引入稳定学习的多中心脑磁共振影像的统计分类方法.该方法使用多层3D卷积神经网络作为骨干结构,并引入稳定学习旁路结构调节卷积网络习得特征的稳定性.在稳定学习旁路中,首先使用随机傅里叶变换获取卷积网络特征的多路随机序列,然后通过学习和优化批次样本采样权重以获取卷积网络特征之间的独立性,从而改善跨中心分类泛化性.最后,在公开数据库FCP中的3中心脑影像数据集上进行跨中心性别分类实验.实验结果表明,与基准卷积网络相比,引入稳定学习的卷积网络具有更高的跨中心分类正确率,有效提高了跨中心泛化性和多中心统计分类的稳定性.
-
关键词
多中心脑磁共振影像分析
卷积神经网络
稳定学习
跨中心泛化
-
Keywords
multi-site brain MRI analysis
convolutional neural network
stable learning
cross-site generalization
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-