-
题名基于属性加权的独依赖条件概率编码方法
- 1
-
-
作者
梁祖鹏
李秋德
胡思贵
-
机构
贵州大学数学与统计学院
贵州医科大学生物与工程学院
-
出处
《运筹与模糊学》
2023年第1期74-87,共14页
-
文摘
包含分类属性和数值属性的混合数据广泛存在于真实世界采集的数据或实验数据,在挖掘或分析这类数据前,通常需要将它们处理(转换/嵌入/表示/编码)为高质量的数值数据。条件概率编码方法(以属性条件独立假设为前提)在大多数情况下能取得不错的性能,但当它面对具有强属性关联的数据集时,性能并不理想。受独依赖值差度量的启发,将放宽属性条件独立的构想应用于条件概率编码方法。此外,还利用属性加权法来优化编码后的数据质量。融合上述这些方法,我们为混合数据的分类编码提出了一个属性加权的独依赖条件概率编码方法。实验结果表明,我们的编码方法可以显著性提高数据转换的质量,从而增强后续数据分析算法的性能。
-
关键词
混合数据分类
条件概率编码
独依赖值差度量
属性加权
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-