-
题名基于广义分布的区间函数型聚类方法
- 1
-
-
作者
孙利荣
蒋晨锴
田颖华
郭宝才
-
机构
浙江工商大学统计与数学学院
浙江工商大学统计数据工程技术与应用协同创新中心
-
出处
《系统科学与数学》
CSCD
北大核心
2024年第8期2496-2514,共19页
-
基金
国家社会科学基金重点项目(23ATJ009)资助课题。
-
文摘
区间函数型聚类是一种用来分析连续型高频数据的方法.已有均匀分布下的区间函数型聚类方法,不能充分利用区间内部的分布信息.而且均匀分布的假设,不符合很多数据的实际分布情况,造成聚类效果和稳定性较差.针对这些问题,文章考虑数据分布的实际情况,使用原始数据的均值和标准差,改进已有的中点-半径法,提出了基于广义分布的区间函数型聚类方法.该方法扩大了区间函数型聚类的使用范围,不仅可以更好地描述区间内部的分布情况,而且能够充分地利用和获取数据信息的内在特征,提高聚类结果的有效性和合理性.使用蒙特卡罗方法,计算聚类效果的内部指标,比较文章所提方法与已有均匀分布下的区间函数型聚类方法的优劣,结果显示文章提出的方法优于已有均匀分布下的区间函数型聚类方法.最后将文章所提方法应用到不同城市的大气污染物浓度的聚类分析中,验证该方法不仅可以有效地解决实际问题,且与已有方法相比具有明显优势.
-
关键词
区间函数型数据
均值-标准差距离
广义分布
聚类分析
-
Keywords
Interval function data
mean-standard deviation distance
generalized distribution
clustering analysis
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-