-
题名混合属性数据深度无监督融合特征学习方法
- 1
-
-
作者
何慧霞
武森
魏桂英
谢嘉瑶
高晓楠
-
机构
北京科技大学经济管理学院
国网能源研究院有限公司
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第7期1852-1864,共13页
-
基金
国家自然科学基金(71971025)
国家社会科学基金重大项目(22&ZD153)。
-
文摘
高质量的特征表示是实现数据精准挖掘的关键。针对现有特征学习方法难以有效提取混合属性数据中不同属性之间关联和数据内部真实信息的问题,提出一种面向混合属性数据的深度无监督融合特征学习模型(DUFERM)。该模型建立了一个双模态自编码器框架,对分类属性和数值属性采用不同路径进行建模,并采用深度多模态融合策略加深两种属性之间的联系;针对分类属性构建基于加权异构网络的离散特征自编码器,充分挖掘分类属性内部的结构和语义信息,针对数值属性构建连续特征自编码器,两个独立的自编码器以联合表示的形式组合在公共潜在表示层中;最后以预训练和联合训练相结合的无监督训练方式获得混合属性数据的融合特征表示。在10个公开数据集上的大量实验表明,所提DUFERM模型在各项评价指标上的综合性能优于现有经典的和新颖的混合属性数据特征学习方法,可以充分提取混合属性数据内部潜在特征,取得高质量的融合特征表示结果并提升下游数据挖掘任务的准确性。
-
关键词
混合属性数据
融合特征学习
无监督
数据挖掘
-
Keywords
mixed attribute data
fusion feature learning
unsupervised
data mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-