分类是数据挖掘中一项非常重要的任务,目前大多分类算法处理的都是数值数据,少数处理符号数据的算法泛化性能不佳。针对这个问题,提出了一种基于组合关联分析的符号数据分类方法(categorical data classifi cation approach based on co...分类是数据挖掘中一项非常重要的任务,目前大多分类算法处理的都是数值数据,少数处理符号数据的算法泛化性能不佳。针对这个问题,提出了一种基于组合关联分析的符号数据分类方法(categorical data classifi cation approach based on combinatorial association analysis,CD_CAA)。通过引入提升度,将符号数据的属性与标签关联起来转化成数值数据后训练模型;在预测过程中,将测试数据与所有可能的类标签进行组合关联分析,将一个实际的测试样本转化为多个虚拟的测试样本,综合分析虚拟样本的假设类别标签,最终得到真实的预测标签。通过组合关联分析,将符号数据转换为数值数据,而转化过程所采用的提升度恰好反映了同一属性对不同类别的不同贡献,提高了模型泛化性能。实验结果表明,与传统机器学习方法相比,所提出的CD_CAA方法能更好地处理符号数据分类任务。展开更多
光学乐谱识别(optical music recognition,OMR)是将纸质的音乐乐谱转化为计算机可以读取的格式。其中音乐符号分类是乐谱识别的重要一个步骤。本文并提出了一种基于DAG-LDM的手写音乐符号分类方法,该方法利用DAG有向无环图结构将二类分...光学乐谱识别(optical music recognition,OMR)是将纸质的音乐乐谱转化为计算机可以读取的格式。其中音乐符号分类是乐谱识别的重要一个步骤。本文并提出了一种基于DAG-LDM的手写音乐符号分类方法,该方法利用DAG有向无环图结构将二类分类器LDM拓展到多类,对于N类音乐符号,需要训练N(N-1)/2个分类器,并依照音乐符号的特征合理排序,防止DAG结构的错误累积效应,用这种DAG结构解决多类分类问题效率高,速度快。在分类器方面,相比支持向量机(support vector machine,SVM)只优化了最小间隔,DAG-LDM还优化了间隔的分布,这更符合音乐符号的样本分布特性,并且具有较强的抗噪性能。本文将这种新DAG_LDM音乐符号分类算法与几种主流的方法进行对比测试,测试结果显示本文提出的新算法对手写音乐符号分类具有更高的分类准确率。且本文提出的算法不仅仅适用于音乐符号识别,还可以用于其他的多类分类问题中。展开更多
文摘分类是数据挖掘中一项非常重要的任务,目前大多分类算法处理的都是数值数据,少数处理符号数据的算法泛化性能不佳。针对这个问题,提出了一种基于组合关联分析的符号数据分类方法(categorical data classifi cation approach based on combinatorial association analysis,CD_CAA)。通过引入提升度,将符号数据的属性与标签关联起来转化成数值数据后训练模型;在预测过程中,将测试数据与所有可能的类标签进行组合关联分析,将一个实际的测试样本转化为多个虚拟的测试样本,综合分析虚拟样本的假设类别标签,最终得到真实的预测标签。通过组合关联分析,将符号数据转换为数值数据,而转化过程所采用的提升度恰好反映了同一属性对不同类别的不同贡献,提高了模型泛化性能。实验结果表明,与传统机器学习方法相比,所提出的CD_CAA方法能更好地处理符号数据分类任务。
文摘光学乐谱识别(optical music recognition,OMR)是将纸质的音乐乐谱转化为计算机可以读取的格式。其中音乐符号分类是乐谱识别的重要一个步骤。本文并提出了一种基于DAG-LDM的手写音乐符号分类方法,该方法利用DAG有向无环图结构将二类分类器LDM拓展到多类,对于N类音乐符号,需要训练N(N-1)/2个分类器,并依照音乐符号的特征合理排序,防止DAG结构的错误累积效应,用这种DAG结构解决多类分类问题效率高,速度快。在分类器方面,相比支持向量机(support vector machine,SVM)只优化了最小间隔,DAG-LDM还优化了间隔的分布,这更符合音乐符号的样本分布特性,并且具有较强的抗噪性能。本文将这种新DAG_LDM音乐符号分类算法与几种主流的方法进行对比测试,测试结果显示本文提出的新算法对手写音乐符号分类具有更高的分类准确率。且本文提出的算法不仅仅适用于音乐符号识别,还可以用于其他的多类分类问题中。