基于密度-距离的t混合模型流式数据聚类被引量：7

Clustering based on density-distance and t mixture model in flow cytometry data

下载PDF

导出

摘要传统流式数据采用人工设门法分析,效率低下且依赖于专家。近几年,很多自动流式数据聚类算法纷纷被提出,然而针对数据量不多且分布稀疏的小样本类群始终没有很好的解决办法。提出了一种基于密度-距离的t-混合模型流式数据聚类优化方法,能够较好地解决小样本类群区分困难的问题。该方法通过密度-距离中心算法定位各类群的初始中心,作为t-混合算法的初值对样本数据进行处理,通过最大似然估计求出各类群对应的样本数目,从而实现样本聚类。实验表明,与经典模型算法相比,基于密度-距离的t-混合模型优化算法具有更好的稳定性和可靠性,对小样本类群以及混叠的类群具有较强的适应能力。 Traditionally, the flow cytometry data is analyzed manually, which is inefficient and depends on expert experiences. In recent years, a lot of automatic cluster algorithms have been proposed. However, the clustering performance is not satisfied for sparse data with a random distribution. Therefore, this paper presents an automatic clustering method based on density-distance center for t-mixture model algorithm in flow cytometry data, which is suitable for rare samples. The proposed method finds the center of each group by density- distance center algorithm and uses it as the initial value of t-mixture model to estimate the sample data by maximum likelihood estimation. Compared with the classical algorithm, the result shows that the t-mixture model based on density-distance center has better stability and reliability, and can better fit small or mixed samples.

作者赵其杰柯震南陶靖卢建霞 Zhao Qijie Ke Zhennan Tao Jing Lu Jianxia(School of Mechatronics Engineering and Automation, Shanghai University, Shanghai 200072, China Shanghai Key Laboratory of Intelligent Manufacturing and Robotics, Shanghai 200072, China Shanghai Nayan Biotechnology Co. , Ltd,Shanghai 201108, China)

机构地区上海大学机电工程与自动化学院上海市智能制造及机器人重点实验室上海纳衍生物科技有限公司

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第9期2130-2137,共8页 Chinese Journal of Scientific Instrument

基金上海市浦江人才计划(17PJ1432300)项目资助

关键词 t-混合模型密度-距离中心算法流式细胞分析术聚类算法 t-mixture model density-distance center algorithm flow cytometry clustering algorithm

分类号 TH773 [机械工程—精密仪器及机械] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1刘恒,吴迪,苏家仪,杨春勇,侯金.运用高斯混合模型识别动物声音情绪[J].国外电子测量技术,2016,35(11):82-87. 被引量：6
2程振,杨斌,徐友春.用于流式细胞仪的超声聚焦系统的仿真与设计[J].仪器仪表学报,2017,38(6):1547-1553. 被引量：3
3王先文,陈锋,程智,杜耀华,暴洪涛,吴太虎.基于偏斜t混合模型的流式数据自动聚类方法研究[J].电子学报,2014,42(12):2527-2535. 被引量：6
4李菊,李克清,苏勇刚.Markov随机游走和高斯混合模型相结合的运动目标检测算法[J].电子测量与仪器学报,2014,28(5):533-537. 被引量：9
5裴智果,王策,陈忠祥,吴云良.用于流式细胞仪的数据采集系统设计与实现[J].电子测量技术,2015,38(7):84-88. 被引量：3
6张文昌,祝连庆,娄小平,孟晓辰,刘超.基于灰色预测恢复算法的流式细胞仪多参数提取[J].仪器仪表学报,2015,36(7):1660-1665. 被引量：12
7吴云良,裴智果,陈忠祥,严心涛,武晓东.以FPGA为核心的流式细胞仪控制系统设计[J].电子测量技术,2015,38(7):58-61. 被引量：5
8董明利,马闪闪,张帆,潘志康.基于核熵成分分析的流式数据自动分群方法[J].仪器仪表学报,2017,38(1):206-211. 被引量：13
9王先文,王懿男,暴洪涛,程智,杜耀华,吴太虎,陈锋.一种快速自动分析流式数据方法研究[J].军事医学,2015,39(10):736-741. 被引量：2

二级参考文献119

1孟凤,王成儒.多模态背景下快速运动目标检测的研究[J].电子测量技术,2007,30(6):33-35. 被引量：3
2POWER P W, SCHOONEES J A. Understandingbackground mixture models for foregrounds segmen- tation [ C ]. Proceedings of Image and Vision Com- puting, New Zealand : Auckland,2002 : 267-271.
3HU J S,CHUNG W J,WANG J J. A spatial-color mean- shift object tracking algorithm with scale and orientation estimation [ J] Pattern Recognition Letters, 2008 ( 29 ) 2165-2173.
4Satoh C,Dan K, Yamashita T, et al. Flow cytometric parame- ters with little interexaminer variability for diagnosing low- grade myelodysplastic syndromes [ J ]. Leukemia Research, 2008,32(5) :699 - 707.
5Gratama JW, Kraan J, Keeney M, et al. Reduction of variation in T-cell subset enumeration among 55 laboratories using sin- gle-platform, three or four-color flow cytometry based on CD45 and SSC-based gating of lymphocytes [ J] Cytometry, 2002, 50 (2) -92 - 101.
6Van Blerk M, Bernier M, Bossuyt X, et al. National external quality assessment scheme for lymphocyte immunophenotyping in Belgium[J]. Clinical Chemistry and Laboratory Medicine, 2003,41 (3) : 323 - 330.
7Hahne F, Kbodabakhshi AH, Bashashati A, et al. Per-channel basis normalization methods for flow cytometry data [ J ]. Cy- tometry Part A,2010,77(2) : 121 - 131.
8AliBashashati, Ryan R Brinkman. A survey of flow cytometry data analysis methods [ J/OL ]. Advance in Bioinformatics, 2009,2009: Article 1D 584603, doi: 10.1155/2009/584603.
9Demers S, Kim J, Legendre P, et al. Analyzing multivariate flow cytometric data in aquatic sciences[ J]. Cytometry, 1992, 13(3) :291 - 298.
10Willdns MF, Hardy SA, Boddy L, et al. Comparison of five clustering algorithms to classify phytoplankton from flow cy- tometry data[J]. Cytometry,2001,44(3) :210- 217.

共引文献46

1牟文波,李慧,安会苹,程红旭,王凤华,靳洪涛,魏金锋.流式细胞仪在GLP体系下性能验证方法的建立[J].中国比较医学杂志,2020,0(2):27-32. 被引量：1
2王丽平,洪陵成,郭天义.一种针对低浓度应用的高精度微型流式细胞仪[J].微纳电子技术,2019,56(2):133-139.
3曹家梓,宋爱国.基于马尔科夫随机场的纹理图像分割方法研究[J].仪器仪表学报,2015,36(4):776-786. 被引量：46
4周辉,赵凤军,禹卫东.SAR运动目标微动信号模型及微多普勒效应研究[J].电子测量技术,2015,38(11):135-142. 被引量：7
5张文昌,祝连庆,娄小平,刘超,孟晓辰.微球测速聚类分析的流式液路稳定性评估[J].光学精密工程,2016,24(1):30-38. 被引量：1
6汪济洲,鲁昌华,蒋薇薇.一种基于嵌入空间的防遮挡的多目标跟踪算法[J].电子测量与仪器学报,2016,30(2):318-322. 被引量：6
7肖明国,董明利,刘锋,娄小平,祝连庆.基于PCIe总线的数据采集卡设计与实现[J].计算机测量与控制,2016,24(3):252-254. 被引量：9
8孟祥忠,林存海.基于灰色模型企业电能预测系统的研究[J].电子测量技术,2016,39(9):1-3. 被引量：6
9董明利,马闪闪,张帆,潘志康.基于核熵成分分析的流式数据自动分群方法[J].仪器仪表学报,2017,38(1):206-211. 被引量：13
10马闪闪,董明利,张帆,潘志康,祝连庆.基于核主成分分析的流式细胞数据分群方法研究[J].生物医学工程学杂志,2017,34(1):115-122. 被引量：5

同被引文献72

1张宝珍.国外综合诊断、预测与健康管理技术的发展及应用[J].计算机测量与控制,2008,16(5):591-594. 被引量：102
2雷亚国,何正嘉,訾艳阳.基于混合智能新模型的故障诊断[J].机械工程学报,2008,44(7):112-117. 被引量：106
3赵伟,张姝,李文辉.基于K-means算法的高性能空间索引方法[J].计算机工程,2008,34(20):4-6. 被引量：7
4周鑫,张化祥.k-means算法的研究与改进[J].微计算机信息,2008,24(30):269-270. 被引量：7
5韩希先,杨东华,李建中.TKEP:海量数据上一种有效的Top-K查询处理算法[J].计算机学报,2010,33(8):1405-1417. 被引量：16
6陈韡,王雷,蒋子云.基于K-prototypes的混合属性数据聚类算法[J].计算机应用,2010,30(8):2003-2005. 被引量：14
7胡睿,林昭文,柯宏力,马严.一种基于密度和滑动窗口的数据流聚类算法[J].计算机科学,2011,38(5):145-148. 被引量：12
8张旭,何向南,金澈清,周傲英.面向不确定图的k最近邻查询[J].计算机研究与发展,2011,48(10):1871-1878. 被引量：8
9张海杰,姜守旭,邹兆年.不确定图上的高效top-k近邻查询处理算法[J].计算机学报,2011,34(10):1885-1896. 被引量：8
10曹健,李海生,蔡强,郭世龙.图像目标的特征提取技术研究[J].计算机仿真,2013,30(1):409-414. 被引量：32

引证文献7

1李晓兰.人体运动的数据采集系统及识别设计[J].计算技术与自动化,2019,38(2):146-150. 被引量：5
2王俊陆,梅昕苏,丁琳琳,宋宝燕,罗浩.基于多粒度Top-k查询的流式数据事件获取方法[J].辽宁大学学报（自然科学版）,2019,46(3):244-249.
3侯学理,李凯,车力,马晓聪,侯旭鹏.相似性聚类在直升机传动轴健康管理中的研究[J].测控技术,2021,40(2):37-41. 被引量：2
4朱永杰.基于广义线性模型的混合属性数据聚类方法[J].科学技术与工程,2021,21(4):1448-1453. 被引量：4
5王慧东,宋耀莲,田榆杰.一种多属性的时空数据聚类算法分析研究[J].重庆邮电大学学报（自然科学版）,2021,33(4):661-668. 被引量：8
6潘继财.基于广义线性模型的混合属性数据聚类方法[J].信息技术,2021,45(8):6-11. 被引量：1
7陶永辉,王勇.基于初始聚类中心选取的改进K-means算法[J].国外电子测量技术,2022,41(9):54-59. 被引量：7

二级引证文献27

1王瑷珲,胡宁宁,喻俊,卢俊兰,葛祎霏.基于步态数据的机器人鲁棒自适应PD控制[J].控制工程,2021,28(9):1738-1746. 被引量：8
2苗登逢,肖跃雷.基于时空约束密度聚类的职住地识别方法[J].计算机应用研究,2022,39(6):1779-1784. 被引量：2
3文军,徐志航,罗心雨.基于社会网络分析的机场群竞合关系模型[J].科学技术与工程,2022,22(14):5921-5928. 被引量：1
4刘宇宁,王硕,贾谊,陈泽铭,李嘉俊.人体运动数据采集系统设计与实现[J].物联网技术,2022,12(8):130-132. 被引量：1
5张旭辉,吕欣媛,王妙云,魏倩楠,王恒,杜昱阳.数据传感设备在上肢康复训练中的应用研究[J].传感器与微系统,2022,41(8):45-48. 被引量：3
6黄玉婧,徐智,单添敏,曹亮,王景霖,沈勇.基于多尺度空间的直升机滚动轴承故障诊断[J].测控技术,2022,41(10):52-57. 被引量：1
7龙霄汉,常兴治,花健.基于惯性传感器的人体行为数据采集系统[J].常州信息职业技术学院学报,2022,21(6):38-43. 被引量：1
8张新宇,陈鹏,顾海硕.基于经验约束规则和证据理论的入室盗窃案件嫌疑人异常轨迹检测[J].中国人民公安大学学报（自然科学版）,2022,28(4):61-66.
9马小东,赵凡,任芃锟.基于时空数据的驻留行为特征可视分析[J].计算机工程,2023,49(2):105-111. 被引量：1
10刘惠中,邓浩宗.基于曲线拟合的自动压滤机脱水过程优化[J].科学技术与工程,2023,23(2):542-549.

1郝美薇,戴华林,郝琨.基于密度的K-means算法在轨迹数据聚类中的优化[J].计算机应用,2017,37(10):2946-2951. 被引量：8
2闫婷婷.数学建模中的高维数据挖掘技术优化研究[J].计算机测量与控制,2017,25(9):158-160. 被引量：1
3赵海心,徐胜利,王正华,王博,陈钢.实-壳混合模型温度场计算方法研究"[J].热力透平,2017,46(3):199-204.
4陈庭木,王宝祥,刘艳,徐波,邢运高,杨波,徐大勇.三因素裂随机试验设计及其统计分析[J].宜春学院学报,2017,39(6):88-92. 被引量：2
5沈咏辉.基于PLC的全自动洗衣机的控制与设计[J].黑龙江科技信息,2017(14):15-15.
6戈国梁.基于大数据模糊K均值聚类的英语教学能力评估算法研究[J].现代电子技术,2017,40(20):31-33. 被引量：10
7陈庭木,王宝祥,杨波,迟铭,李键,宋兆强,徐大勇.3因素随机裂区试验设计及其统计分析[J].安徽农业科学,2017,45(25):3-5. 被引量：3
8潘德国,屈福政,谢正义,孙杰锋.基于蒙特卡罗法的汽车起重机起重臂结构可靠性分析[J].起重运输机械,2017(9):72-76. 被引量：3
9回厚霖,张鹏,黄荣浩,季鹤,蒋瑾彧,王新杰.混合模型在福建省粗叶榕生物量模型中的应用[J].西北林学院学报,2017,32(5):91-97. 被引量：4
10曹旭峰,江国华.一种适用于流式大数据系统测试的数据生成方法[J].计算技术与自动化,2017,36(3):139-145. 被引量：3

仪器仪表学报

2017年第9期

浏览历史

内容加载中请稍等...

基于密度-距离的t混合模型流式数据聚类被引量：7

参考文献9

二级参考文献119

共引文献46

同被引文献72

引证文献7

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于密度-距离的t混合模型流式数据聚类 被引量：7

参考文献9

二级参考文献119

共引文献46

同被引文献72

引证文献7

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于密度-距离的t混合模型流式数据聚类被引量：7