-
题名多模态异构大数据混合属性特征匹配筛选算法
- 1
-
-
作者
张燕
-
机构
新疆师范大学
-
出处
《现代电子技术》
北大核心
2024年第3期119-122,共4页
-
基金
新疆师范大学校级教学研究与改革项目(SDJG2022-14)
新疆维吾尔自治区“十四五”重点学科招标课题(23XJKD0202)
国家自然科学基金地区项目(41561100)。
-
文摘
多模态异构大数据混合了多种属性数据,具有数据类型繁杂、数据维度较高的特点,在数据挖掘过程中容易降低多模态异构大数据利用率。为了提高特征匹配紧密度,提出多模态异构大数据混合属性特征匹配筛选算法。建立距离矩阵对多模态异构大数据实施混合属性降维;采用主成分分析法提取降维后的数据主成分,将提取到的主成分作为数据混合属性备选特征;计算主成分互信息,筛选互信息值大于1的数据特征,聚集同属性相似特征,实现特征匹配。在4个多模态异构大数据集中进行应用测试,测试结果表明所提算法匹配紧密度均高于0.8,由此证明,该算法具有较高的混合属性特征匹配质量。
-
关键词
多模态异构大数据
混合属性
距离矩阵
主成分分析法
特征匹配
相似度
-
Keywords
multimodal heterogeneous big data
mixed attribute
distance matrix
PCA
feature matching
similarity
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
-
-
题名基于K-均值聚类的多模态异构大数据检测算法研究
被引量:4
- 2
-
-
作者
闵小翠
-
机构
广州华立科技职业学院
-
出处
《电子设计工程》
2020年第14期63-67,共5页
-
基金
教育部科技发展中心产学研创新基金-“智融兴教”基金课题(2018A01002)
全国高等院校计算机基础教育研究会计算机基础教育教学研究项目(2019-AFCEC-019)
2018年广东省教育厅质量工程-教育教学改革研究与实践项目(GDJG2019284)。
-
文摘
为了解决传统多模态异构大数据检测算法存在的存储极值高、QTI指标低,而导致数据模态混乱的问题,为解决此问题,建立基于K-均值聚类的多模态异构大数据检测算法。以异构语料库作为大数据支撑背景,借助多模态均值分类器,确定相似性检测度量值,搭建基于K-均值聚类的多模态异构体系。在此基础上,利用多模态型TAN检测网络,恢复处于异构状态的大数据结构体,再通过计算粗糙权重水平的方式,实现多模态异构大数据检测算法研究。应用实验结果表明,与MapReduce检测手段相比,应用异构型检测算法后,大数据结构存储极值出现明显的下降趋势,而QTI指标却大幅提升,原始存在的数据体模态混乱行为得到有效控制。
-
关键词
K-均值聚类
多模态异构大数据
异构语料库
相似性度量
粗糙权重
-
Keywords
K⁃means clustering
multimodal heterogeneous big data
heterogeneous corpus
similarity measurement
rough weight
-
分类号
TN929.5
[电子电信—通信与信息系统]
-