双重高斯混合模型的EM算法的聚类问题研究被引量：14

Study of EM Algorithm Based on Dual Gaussian-Mixture-Model

下载PDF

导出

摘要 EM算法是参数估计的重要方法,其算法核心是根据已有的数据来迭代计算似然函数,使之收敛于某个最优值。半监督聚类是利用少部分标签的数据辅助大量未标签的数据进行的聚类分析。文章介绍了一种基于双重高斯混合模型的EM算法,在无监督学习中增加一些已标记的样本,利用已标记的样本得到初始参数,研究了半监督条件下的双重高斯混合模型的EM聚类算法。实验表明,该算法较无监督学习而言,提升了样本的识别率,有良好的聚类性能。这种算法模型也可以作为一种基础模型,具有一定的应用领域。 EM algorithm is an important parameter estimation method. Its core idea is to iteratively compute the likelihood function until it converges to some optimal value for the given data. Semi - supervised clustering employs a small amount of labeled data to aid clustering analysis. The EM algorithm based on dual Gaussian mixture model with the added labeled samples as the initial parameters has been studied in this paper. The experimental results demonstrate that the algorithm increases the recognition rate for samples compared with the unsupervised study and has good clustering ability. Furthermore, the algorithm model can be used as a basic model in other application fields.

作者岳佳王士同

机构地区江南大学信息工程学院

出处《计算机仿真》 CSCD 2007年第11期110-113,共4页 Computer Simulation

关键词双重高斯混合模型期望最大化算法:半监督聚类 Dual gaussian mixture model Expectation maximum algorithm Semi - supervised clustering

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1C Fraley, A E Raftery. How many clusters? Which clustering method?-Answers via model-based cluster analysis [J].The Computer Journal,1998,41:578-588.
2C Fraley, A E Raftery. Model-based clustering, discriminant analysis and density estimation [J].Journal of the American Statistical Association, 2002,97:611-631.
3B Sugato. Semi-supervised clustering by seeding[J].The 19th Int' 1 Conf on Machine Learning,Sydney,2002.
4R Ghani. Combining labelled and unlabeled data for text classification with a large number of categories [C].Proceeding s of the IEEE International Conference on Data Mining, 2001.
5K Bennett, A Demiriz & R Maclin. Exploiting unlabeled data in ensemble methods[C].Proceedings of the SIGKDD International Conference on Knowledge Discovery and Data Mining. 2002.
6B Liu, W S Lee, P S Yu and X Li. Partially Supervised Classification of Text Documents[C]. Proc. 19th Intl. Conf. on Machine Learning. Sydney,Australia, 2002,387-394.
7Kamal Nigam, Andrew Mccallum, Sebastian Thrun, Tom Mitchell. Text Classification from Labeled and Unlabeled Documents using EM[J]. Machine Learning.2000,39:103-134.
8A Banerjee, I Dhillon, J Ghosh and S Sra. A comparative study of generative models for document clustering[C].In Proceedings of The Ninth ACM SIGKDD Conference on knowledge discovery and data mining. 2003.

同被引文献88

1瞿俊,姜青山,Wang Shengrui,董槐林.基于高斯混合模型的层次聚类算法[J].计算机研究与发展,2006,43(z3):321-327. 被引量：3
2苏守宝,刘仁金.基于佳点集遗传算法的聚类技术[J].计算机应用,2005,25(3):643-645. 被引量：7
3冉延平,余昭平,贾利新,康学福.基于混合模型的聚类算法研究[J].河南科学,2005,23(3):324-327. 被引量：3
4黄健熙,吴炳方,曾源,田亦陈.水平和垂直尺度乔、灌、草覆盖度遥感提取研究进展[J].地球科学进展,2005,20(8):871-881. 被引量：24
5秦伟,朱清科,张学霞,李文华,方斌.植被覆盖度及其测算方法研究进展[J].西北农林科技大学学报（自然科学版）,2006,34(9):163-170. 被引量：180
6岳佳,王士同.高斯混合模型聚类中EM算法及初始化的研究[J].微计算机信息,2006,22(11X):244-246. 被引量：51
7谢勤岚.基于EM算法的混合模型的参数估计[J].计算机与数字工程,2006,34(12):42-44. 被引量：6
8王维彬,钟润添.一种基于贪心EM算法学习GMM的聚类算法[J].计算机仿真,2007,24(2):65-68. 被引量：15
9胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20. 被引量：36
10王平波,蔡志明,刘旺锁.混合高斯概率密度模型参数的期望最大化估计[J].声学技术,2007,26(3):498-502. 被引量：21

引证文献14

1贾俊杰,张勤.一种混合递增NEM的空间聚类算法[J].郑州大学学报（工学版）,2009,30(3):130-133.
2王泽,曲政,潘章明.粒度母体混合分布的微粒群算法研究[J].计算机仿真,2010,27(5):105-108.
3山拜.达拉拜,曹红丽,尤努斯.艾沙.基于遗传算法的K-means初始化EM算法及聚类应用[J].现代电子技术,2010,33(15):102-103. 被引量：1
4曹红丽,山拜.达拉拜.混合EM算法研究及聚类应用[J].通信技术,2010,43(11):150-152. 被引量：1
5柳贵东,山拜.达拉拜.基于EM算法的非高斯噪声参数估计[J].通信技术,2011,44(1):151-153. 被引量：3
6肖维.用于高斯混合模型参数估计的EM算法及其初始化研究[J].电子测试,2011,22(6):26-30. 被引量：4
7陈宇,许莉薇.基于高斯混合模型的林业信息文本分类算法[J].中南林业科技大学学报,2014,34(8):114-119. 被引量：3
8党小超,毛鹏鑫,郝占军.基于快速求解高斯混合模型的流量聚类算法[J].计算机工程与应用,2015,51(8):96-101. 被引量：6
9毛家顺,张汝波,杨大伟.基于TLD改进的自动人体检测与实时跟踪算法[J].微型机与应用,2015,34(22):47-49. 被引量：1
10范敬雅,邹玉梅.基于EM算法的高斯混合模型的聚类分析——以2015年各省份GDP为例[J].发展研究,2017,34(6):52-54. 被引量：9

二级引证文献30

1刘城霞.基于MS聚类分析模型的数据挖掘应用探讨[J].计算机与现代化,2012(4):56-60.
2吴雪莲,山拜.达拉拜,李婷婷.小波神经网络用于双模噪声的消噪[J].通信技术,2012,45(9):4-6. 被引量：2
3程莉,许楠.基于信赖域的EM算法进行多径时延估计[J].现代电子技术,2013,36(8):27-30.
4张锋,王盼,陈志军,陈建国.陕北侏罗纪煤田榆神矿区中鸡勘查区煤层厚度混合分布特征及其意义[J].地质学刊,2014,38(3):399-407. 被引量：1
5高霞,李瑞俊.EM算法在不完全数据参数估计中的应用[J].集宁师范学院学报,2015,37(3):102-104. 被引量：3
6沈天跃,章守宇,沈蔚,汪振华.现场海域人工鱼礁分布状态聚类分析[J].水产学报,2015,39(9):1350-1358. 被引量：10
7邢长征,苑聪.一种快速、贪心的高斯混合模型EM算法研究[J].计算机工程与应用,2015,51(20):111-115. 被引量：3
8王艳.儿童摔倒行为图像检测数学建模方法仿真[J].计算机仿真,2016,33(11):452-455. 被引量：1
9赵静,章守宇,沈天跃,沈蔚.人工鱼礁投放误差分布研究[J].水产学报,2016,40(11):1790-1799. 被引量：7
10吕淑宝,王明月,翟祥,陈宇.一种深度学习的信息文本分类算法[J].哈尔滨理工大学学报,2017,22(2):105-111. 被引量：19

1张志斌.集成机器学习方法和应用[J].国外科技新书评介,2012(12):19-19.
2苏丰龙,谢庆华,邱继远,岳振军.基于深度学习的领域实体属性词聚类抽取研究[J].微型机与应用,2016,35(1):53-55. 被引量：7
3姬鹏飞,李远刚,卢盛祺,戴开宇.基于语义Web的旅游路线个性化定制系统[J].计算机工程,2016,42(10):308-317. 被引量：14
4陈季梦,刘杰,黄亚楼,刘天笔,刘才华.基于半监督CRF的缩略词扩展解释识别[J].计算机工程,2013,39(4):203-209. 被引量：2
5徐正国,郑辉,贺亮,姚佳奇.基于局部密度下降搜索的自适应聚类方法[J].计算机研究与发展,2016,53(8):1719-1728. 被引量：6
6闫涛,古乐野,阮波.基于爆炸冲击波模型的粒子群优化算法[J].计算机应用,2014,34(7):2085-2089.
7Dan MA.Design of two-layer switching rule for stabilization of switched linear systems with mismatched switching[J].Control Theory and Technology,2014,12(3):275-283.

计算机仿真

2007年第11期

浏览历史

内容加载中请稍等...

双重高斯混合模型的EM算法的聚类问题研究被引量：14

参考文献8

同被引文献88

引证文献14

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

双重高斯混合模型的EM算法的聚类问题研究 被引量：14

参考文献8

同被引文献88

引证文献14

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

双重高斯混合模型的EM算法的聚类问题研究被引量：14