分类技术是数据采掘的基础与核心,建构分类器是分类技术的关键,利用贝叶斯网络可以构造出分类性能较好的分类器。基于BN Toolkit(BNT)软件包利用Matlab语言实现了两种贝叶斯网络分类器(BNC)。分别基于GS算法和K2算法学习分类器结构。用U...分类技术是数据采掘的基础与核心,建构分类器是分类技术的关键,利用贝叶斯网络可以构造出分类性能较好的分类器。基于BN Toolkit(BNT)软件包利用Matlab语言实现了两种贝叶斯网络分类器(BNC)。分别基于GS算法和K2算法学习分类器结构。用UCI(University of california in Irvine)上下载的标准数据集验证所建构的BNC,实验结果表明所建构BNC的分类准确率高于文献中所列的NBC和TANC结果,从而表明所建立分类器的有效性和正确性。最后列出了进一步要做的工作。展开更多
在数据挖掘领域中,不同分类器建立的模型性能不尽相同。对分类器性能的评价是选择优秀分类器的基础。为了更好地对分类器性能进行评估,文中对分类器性能评价标准进行了研究。分析了传统分类器性能评价标准在应用时存在的一些问题,重点...在数据挖掘领域中,不同分类器建立的模型性能不尽相同。对分类器性能的评价是选择优秀分类器的基础。为了更好地对分类器性能进行评估,文中对分类器性能评价标准进行了研究。分析了传统分类器性能评价标准在应用时存在的一些问题,重点介绍了ROC曲线(the Receiver Operating Characteristic curve)和AUC(the area under the ROC curve)评价方法,并剖析了它们的优缺点。对比分析表明,ROC曲线和AUC方法虽然存在着一定的不足,但是在分类器性能评价中所表现出的诱人性质使其必定具有广阔的应用前景。展开更多
文摘分类技术是数据采掘的基础与核心,建构分类器是分类技术的关键,利用贝叶斯网络可以构造出分类性能较好的分类器。基于BN Toolkit(BNT)软件包利用Matlab语言实现了两种贝叶斯网络分类器(BNC)。分别基于GS算法和K2算法学习分类器结构。用UCI(University of california in Irvine)上下载的标准数据集验证所建构的BNC,实验结果表明所建构BNC的分类准确率高于文献中所列的NBC和TANC结果,从而表明所建立分类器的有效性和正确性。最后列出了进一步要做的工作。
基金安徽省教育厅自然科学研究重点项目(the Grand Research Project of Department of Education of Anhui ProvinceChinaunder Grant No.KJ2007A051)+1 种基金安徽省教育厅自然科学研究项目(the Research Project of Department of Education of Anhui ProvinceChinaunder Grant No.2006KJ061B)。
文摘在数据挖掘领域中,不同分类器建立的模型性能不尽相同。对分类器性能的评价是选择优秀分类器的基础。为了更好地对分类器性能进行评估,文中对分类器性能评价标准进行了研究。分析了传统分类器性能评价标准在应用时存在的一些问题,重点介绍了ROC曲线(the Receiver Operating Characteristic curve)和AUC(the area under the ROC curve)评价方法,并剖析了它们的优缺点。对比分析表明,ROC曲线和AUC方法虽然存在着一定的不足,但是在分类器性能评价中所表现出的诱人性质使其必定具有广阔的应用前景。
基金安徽省教育厅自然科学研究重点项目(the Grand Research Project of Department of Education of Anhui Province China under GrantNo.KJ2007A051)+1 种基金安徽省教育厅自然科学研究项目(the Research Project of Department of Education of Anhui Province China underGrant No.2006KJ061B)