一种基于高斯混合模型的无监督粗糙聚类方法被引量：8

An unsupervised rough clustering method based on gaussian mixture model

下载PDF

导出

摘要针对数据统计分布的随机性和复杂性,从统计聚类的角度出发,采用高斯混合模型来描述整个数据的概率密度函数,提出了一种基于高斯混合模型的粗糙聚类分析方法.该方法首先利用粗糙集理论的不可区分关系性质以及生成的逻辑规则来设定EM算法的初始近似参数,然后通过Expectation-M axim ization(EM)算法估计各分量概率密度分布的最大似然参数集,最后通过密度分布概率大小来确定类别的归属.与传统的k-m eans聚类算法的试验结果比较表明,该方法是有效的,并且具有较高的聚类精度,用规则集来描述聚类的结果具有可解释性和合理性. Aiming at resolving randomness and complexity of data statistical distribution, the whole data probability density function is described by Gaussian mixture model in the sight of statistical clustering. A rough clustering analysis method based on Gaussian mixture model is proposed. Firstly, the initial parameters of EM obtained by indiscernibility relation and logic rules generated with rough set theory. Secondly, the maximum likelihood parameters of each component probability density distribution can be estimated by EM iterative computation. Finally, the classification is determined through density distribution probability value. Experimental results show that the new method is effective. Compared with conventional k -means clustering algorithm, it has higher clustering precision and the clustering resuhs described by the rule sets are interpretable and rational.

作者何明冯博琴马兆丰傅向华

机构地区西安交通大学计算机科学与技术系

出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第2期256-259,322,共5页 Journal of Harbin Institute of Technology

基金国家高技术研究发展计划资助项目(2003AA1Z2610)

关键词高斯混合模型粗糙集 EM算法聚类 gaussian mixture model rough set EM algorithm clustering

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献15

1JAIN A K, MURTY M N, FLYNN P J. Data clustering:Review [J]. ACM Computing Surveys (CSUR), 1999,31(3) : 264 -323.
2HAN J W, KAMBER M. Data Mining: Concepts and Techniques[M]. San Francisco: Morgan Kaufmann, 2001.
3ZHANG T, RAMAKRISHNAN R, LIVNY M. BIRCH:An efficient data clustering method for very large databases [A]. Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data [C]. New York: ACM Press, 1996. 103- 114.
4GUHA S, RASTOGI R, SHIM K. CURE: An efficient data. clustering method for very large databases [J].ACM SIGMOD Record, 1998, 27(2) : 73 -84.
5KARYPIS G, HAN E H, KUMARL V. CHAMELEON:A hierarchical clustering algorithm using dynamic modeling[J]. Computer, 1999, 32 (8): 68-75.
6ESTER M, KRIEGEL H P, SANDER J, et al. A density2based algorithm for discovering clusters in large spatial databases [A]. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining(KDD'96) [C]. Portland, OR: AAAI Press, 1996.226 - 231.
7ANKERST M, BREUNING M M, KRIEGEL H P, et al.OPTICS: Ordering points to identify the clustering structure [A]. Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data [C]. Philadelphia,Pennsylvania: ACM Press, 1999. 49-60.
8AGRAWAL R, GEHRKE J, GUNOPULOS D, et al.Automatic subspace clustering of high dimensional data for data mining applications [A]. Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data [C]. Data Seattle, Washington: ACM Press, 1998. 94 - 105.
9PAWLAK Z. Rough sets and intelligent data analysis[J]. Information Science, 2002, 147(11):1 - 12.
10LAURITZEN S L. The EM algorithm for graphical association models with missing data [J]. Computational Statistics and Data Analysis, 1995,19 : 191 - 201.

同被引文献97

1高中贵,彭补拙.我国农用地分等定级研究综述[J].经济地理,2004,24(4):514-519. 被引量：46
2伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
3赵吉文,冯志华,刘志刚,张平,李晓峰,孔凡让.混沌理论与小波包分析相结合的状态监测方法研究[J].振动与冲击,2004,23(4):21-25. 被引量：10
4林小莹,王占岐,殳浩.回归分析在农用土地分等中的应用[J].资源环境与工程,2005,19(1):65-69. 被引量：10
5赵征鹏,杨鉴.基于高斯混合模型的非母语说话人口音识别[J].计算机工程,2005,31(6):148-150. 被引量：3
6余鹏,封举富,童行伟.一种新的基于高斯混合模型的纹理图像分割方法[J].武汉大学学报（信息科学版）,2005,30(6):514-517. 被引量：6
7许雯,董林,田家斌.一种改进的高斯混合模型算法[J].信息工程大学学报,2005,6(2):65-67. 被引量：7
8司文武,钱沄涛.一种基于谱聚类的半监督聚类方法[J].计算机应用,2005,25(6):1347-1349. 被引量：11
9汪善勤,周勇,张甘霖.基于GIS的中国土壤分类专家系统设计[J].土壤学报,2005,42(5):705-711. 被引量：11
10胡月明,薛月菊,李波,谢健文,陈飞香,包世泰.从神经网络中抽取土地评价模糊规则[J].农业工程学报,2005,21(12):93-97. 被引量：18

引证文献8

1陈志民,杨敬锋,陈其昌,张嘉琪,陈强.融合监督学习与凝聚层次聚类的土地评价方法[J].计算机工程与应用,2007,43(18):188-190. 被引量：3
2陈志民,薛月菊,杨敬锋,叶志婵,陈剑虹.半监督学习算法在农用地分等中的应用[J].计算机工程与设计,2008,29(23):6133-6135. 被引量：2
3罗绵辉,梁啸.小波包分析及高斯混合模型在汽轮机振动故障诊断中的应用[J].华电技术,2008,30(12):21-23. 被引量：5
4王静,胡益,侍洪波.基于GMM的间歇过程故障检测[J].自动化学报,2015,41(5):899-905. 被引量：16
5王玲,孟建瑶.基于局部分布的贝叶斯自适应共振理论增量聚类算法[J].控制与决策,2018,33(3):471-478. 被引量：1
6刘维.数据挖掘中聚类算法综述[J].江苏商论,2018(7):120-125. 被引量：18
7万仁霞,王大庆,苗夺谦.基于三支决策的高斯混合聚类研究[J].重庆邮电大学学报（自然科学版）,2021,33(5):806-815. 被引量：7
8董雪,万仁霞,苗夺谦,岳晓冬.基于阴影集的三支高斯混合聚类算法[J].广西大学学报（自然科学版）,2023,48(4):958-971.

二级引证文献52

1杨婷,郑雅玲,余帆,李应昆.基于CiteSpace对便秘研究的文献计量学及可视化分析[J].世界最新医学信息文摘,2019,19(76):51-54. 被引量：2
2向培素.聚类算法综述[J].西南民族大学学报（自然科学版）,2011,37(S1):112-114. 被引量：14
3丁晓喜,何清波.基于WPD和LPP的设备故障诊断方法研究[J].新型工业化,2013,2(7):40-49. 被引量：5
4李亭,杨敬锋,陈志民.土地评价中关联规则与C4.5规则的应用比较[J].安徽农业科学,2010,38(13):7145-7147. 被引量：5
5李亭,杨敬锋,陈志民.土地评价中关联规则与C4.5规则的应用比较(英文)[J].Agricultural Science & Technology,2010,11(4):144-147. 被引量：3
6苏昱,李贺山.POSC数据模型在新疆勘探数据库测井专业的应用[J].测井与射孔,2000(1):74-76.
7李泓泽,郭森,王宝.北京市能源消费与生产的灰色关联分析及能源需求预测[J].能源技术经济,2012,24(5):12-16. 被引量：3
8魏曰海.基于成对约束的半监督凝聚层次聚类算法[J].电脑编程技巧与维护,2013(24):97-97.
9张敏,程文明.一种基于局部模型的多工况过程质量预测方法[J].计算机应用研究,2014,31(6):1740-1743. 被引量：2
10丁晓喜,何清波.基于WPD和LPP的设备故障诊断方法研究[J].振动与冲击,2014,33(3):89-93. 被引量：11

1张松敏.有限集上二元关系性质的判定[J].计算机时代,2013(4):51-52.
2陈晓梅.入侵检测中的数据预处理问题研究[J].计算机科学,2006,33(1):81-83. 被引量：13
3周涛.具有自适应参数的粗糙k-means聚类算法[J].计算机工程与应用,2010,46(26):7-10. 被引量：8
4蒋无尘.基于改进的k均值图像分割算法研究[J].科教导刊（电子版）,2014(7):140-140. 被引量：1
5王慎超,苗夺谦,陈敏,王睿智.基于覆盖的粗糙聚类算法[J].电子与信息学报,2008,30(7):1713-1716. 被引量：2
6周凯.基于统计聚类RBF神经网络的孤立点检测研究[J].计算机科学,2006,33(10):196-197. 被引量：5
7陈允杰,张建伟,韦志辉,夏德深,王平安.基于高斯混合模型的活动轮廓模型脑MRI分割[J].计算机研究与发展,2007,44(9):1595-1603. 被引量：13
8张钦礼,王士同.基于expectation maximization算法的Mamdani-Larsen模糊系统及其在时间序列预测中的应用[J].物理学报,2009,58(1):107-112. 被引量：4
9纪洲鹏,周军,何明.基于变精度粗糙集的Web用户聚类方法[J].计算机工程,2010,36(3):44-46. 被引量：2
10卜耀华,姜秀柱,李连习.基于数据场的粗糙聚类算法研究[J].福建电脑,2009,25(8):79-80. 被引量：1

哈尔滨工业大学学报

2006年第2期

浏览历史

内容加载中请稍等...

一种基于高斯混合模型的无监督粗糙聚类方法被引量：8

参考文献15

同被引文献97

引证文献8

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

一种基于高斯混合模型的无监督粗糙聚类方法 被引量：8

参考文献15

同被引文献97

引证文献8

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

一种基于高斯混合模型的无监督粗糙聚类方法被引量：8