基于模糊K-means聚类算法的区域数据智能分析方法被引量：2

Intelligent analysis method of regional data based on fuzzy K⁃means clustering algorithm

下载PDF

导出

摘要文中对医疗行业的区域化群体数据挖掘方法进行了研究。通过引入模糊数学理论中的隶属度概念,使得K-means算法在分类时不再按照聚类中心来严格划分数据点,提升了数据点分类的稳定性,使算法在迭代的过程中更容易收敛。同时,引入了Hadoop平台下的MapReduce模型对所提算法进行并行化处理,将数据划分为不同的数据切片,使每个切片在不同的计算节点上完成聚类。以河北某地区的实际医保数据为样本进行了算法测试,在聚类精度上,模糊K-means算法相较于传统算法提升了约8.19%。基于文中搭建的分布式存储系统计算集群,当采用8节点进行并行计算时,算法的Speedup与Scaleup分别为3.6和0.58,通过充分利用每个计算节点的计算资源,有效降低了运行时间成本。 This paper studies the group data mining method of medical industry.By introducing the concept of membership degree in fuzzy mathematics theory,K-means algorithm does not strictly divide data points according to the cluster center in classification,improves the stability of data point classification,and makes the algorithm more easily convergent in the process of iteration.At the same time,the MapReduce model under Hadoop platform is introduced to parallel the proposed algorithm,and the data is divided into different data slices,so that each slice can cluster on different computing nodes.Based on the actual medical insurance data in a certain area of Hebei Province,the algorithm test is carried out.The fuzzy K-means algorithm is improved by about 8.19%in clustering accuracy compared with the traditional algorithm.When eight nodes are used for parallel computing,the Speedup and Scaleup of the algorithm are 3.6 and 0.58 respectively.By making full use of the computing resources of each computing node,the running time cost is effectively reduced.

作者支建勋 ZHI Jianxun(The First Affiliated Hospital of Hebei North University,Zhangjiakou 075000,China)

机构地区河北北方学院附属第一医院

出处《电子设计工程》 2022年第10期46-49,54,共5页 Electronic Design Engineering

基金河北省人力资源和社会保障研究课题(JRS-2020-3014)。

关键词模糊数学 K-MEANS 数据挖掘医疗数据分布式计算 fuzzy mathematics K⁃means data mining medical data distributed computing

分类号 TN99 [电子电信—信号与信息处理] TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1任燕.基于MapReduce与距离的离群数据并行挖掘算法[J].计算机系统应用,2018,27(2):151-156. 被引量：4
2张航,张欣,张平康,李琪.基于MapReduce的并行加权FIUT算法[J].微电子学与计算机,2018,35(7):41-44. 被引量：1
3徐健,陈志德,龚平,王可可.基于区块链网络的医疗记录安全储存访问方案[J].计算机应用,2019,39(5):1500-1506. 被引量：64
4彭彦彬,田野,彭新光.一种端到端的医疗无线体域网轻量认证协议[J].计算机工程,2017,34(6):73-77. 被引量：7
5张利华,蓝凡,姜攀攀,蒋腾飞.基于双区块链的医疗记录安全存储与共享方案[J].计算机工程与科学,2019,41(9):1581-1587. 被引量：24
6张志昌,周侗,张瑞芳,张敏钰.融合双向GRU与注意力机制的医疗实体关系识别[J].计算机工程,2020,46(6):296-302. 被引量：11
7易东义,邓根强,董超雄,祝苗苗,吕周平,朱岁松.基于图卷积神经网络的医保欺诈检测算法[J].计算机应用,2020,40(5):1272-1277. 被引量：9
8金玮,潘伟华.基于物联网技术的远程智能医疗系统设计[J].微型电脑应用,2020,36(5):113-116. 被引量：11
9姚剑锋.基于大数据的医疗保险信息安全隐私保护研究[J].微型电脑应用,2020,36(11):168-170. 被引量：7
10杨睿,苏丹,刘超,高松,闫磊.基于网络编码技术的医疗保险数据更新方法[J].信息技术,2020,44(4):107-110. 被引量：4

二级参考文献64

1沈伟.电子病历给医疗行为带来的变革[J].医学信息学杂志,2007,28(4):346-347. 被引量：8
2电子病历基本规范(试行)[J].中国卫生质量管理,2010,17(4):22-23. 被引量：3
3周晶.基于条件随机域模型的中文实体关系抽取[J].计算机工程,2010,36(24):192-194. 被引量：2
4朱晓峰,李玲娟,徐小龙,陈建新.基于MapReduce的关联规则增量更新算法[J].计算机技术与发展,2012,22(4):115-118. 被引量：15
5史长琼,黄智豪.基于Kerberos的RFID双向认证协议[J].计算机工程,2013,39(5):127-131. 被引量：3
6刘松,果乃福,谢帆,张丽,李淼.UC安全的双向口令认证密钥协商协议[J].计算机工程,2014,40(2):140-143. 被引量：2
7石刚,王生原,董渊,嵇智源,甘元科,张玲波,张煜承,王蕾,杨斐.同步数据流语言可信编译器的构造[J].软件学报,2014,25(2):341-356. 被引量：18
8李亚子,尤斌,王晖,钱庆.医疗保险信息泄露案例分析及对我国安全隐私保护的借鉴水[J].医学信息学杂志,2014,35(2):6-12. 被引量：9
9徐大庆,杨岳湘.无线体域网移动安全服务应用研究[J].计算机工程与设计,2014,35(5):1593-1597. 被引量：1
10张秀梅,徐建武,程煜华,杨公亮.基于知识库的临床决策支持系统构建[J].中华医院管理杂志,2014,30(6):472-475. 被引量：33

共引文献143

1魏东晓,刘颖.区块链技术在医疗行业中的应用研究进展[J].中国数字医学,2021,16(12):89-92. 被引量：11
2鹿晓培.关于加强医疗保险基金会计核算和财务管理的思考[J].纳税,2020,14(28):74-75. 被引量：10
3刁树宝.大数据背景下医疗保险信息化建设的问题探究[J].现代经济信息,2021(22):38-39.
4管青山,单祥年,谢维,周晓雷.AT基因突变与食管癌及结肠癌的关系[J].南京铁道医学院学报,2000,19(1):5-7.
5潘淼鑫,林甲祥,陈崇成,叶晓燕.基于C-SOM和Spark的并行空间离群挖掘方法及应用[J].地球信息科学学报,2019,21(1):128-136. 被引量：4
6张俊松,张启坤,甘勇,孟颍辉.适用于无线医疗传感网的身份认证协议[J].北京邮电大学学报,2018,41(4):104-109. 被引量：3
7阚运奇.基于案例驱动的研究生程序设计类课程教学方案[J].无线互联科技,2018,15(24):85-86.
8彭海峰,鄢涛.基于区块链技术的分布式协作通信网络构建[J].数字技术与应用,2019,37(6):87-87.
9徐勤亚.区块链技术在医疗领域的应用研究综述[J].价值工程,2019,38(24):298-298. 被引量：4
10杨明,丁龙,许艳.基于区块链的医疗数据云存储共享方案[J].南京信息工程大学学报（自然科学版）,2019,11(5):590-595. 被引量：20

同被引文献11

1李建中,李英姝.大数据计算的复杂性理论与算法研究进展[J].中国科学：信息科学,2016,46(9):1255-1275. 被引量：10
2刘旭,陈云波,施昆,黄强.结合Canopy-K-means算法和出租车轨迹数据的公交车站预测方法[J].测绘通报,2018(11):63-68. 被引量：5
3张仕斌,黄曦,昌燕,闫丽丽,程稳.大数据环境下量子机器学习的研究进展及发展趋势[J].电子科技大学学报,2021,50(6):802-819. 被引量：10
4陆春悦,郭躬德,林崧.基于量子计数的贝叶斯二元分类算法[J].南京师大学报（自然科学版）,2021,44(4):117-121. 被引量：2
5沈秀娟,薛烁.一种加权K-means聚类算法及其应用[J].曲靖师范学院学报,2022,41(3):1-7. 被引量：4
6周晓伟,潘清眉,谢俊秀.基于K-Means算法的通信运营商区域发展效益评估[J].数字技术与应用,2022,40(5):121-123. 被引量：2
7周善添,苏凌云,张衡,徐珑玮.基于K-means算法的低碳疫苗配送中心选址研究[J].物流工程与管理,2022,44(5):96-100. 被引量：6
8郭秀娟,李庆凯,孟庆楠,马玉贤.基于朴素贝叶斯算法分析鸢尾花数据集分类[J].工业和信息化教育,2022(6):82-84. 被引量：5
9孙一榕,郑国华.故障共享单车回收站选址库存问题模型及算法[J].工业工程与管理,2022,27(6):95-105. 被引量：5
10毕文豪,周杰,张安,刘力.杂波环境下基于最大熵模糊聚类的JPDA算法[J].系统工程与电子技术,2023,45(7):1920-1927. 被引量：1

引证文献2

1陈超,吴晖,万庆,王二振.基于优化聚类簇后K-means算法的通用飞机售后保障方法[J].教练机,2023(4):52-56.
2侯敏,张仕斌,黄曦.量子模糊朴素贝叶斯分类算法[J].电子科技大学学报,2024,53(1):149-154.

1王天皓.基于改进模糊K-means算法的大数据处理方法[J].电子技术与软件工程,2021(22):187-189. 被引量：1
2杨永国.基于自适应高斯混合模型的软件测试用例集约简算法研究[J].计算机测量与控制,2021,29(6):46-50. 被引量：4
3祖广政,朱冬元.基于模糊数学理论改进B-S模型的数据资产定价模型[J].中国资产评估,2022(3):24-34. 被引量：9
4马晓岩.基于混合聚类算法的大学生心理健康分析[J].电子设计工程,2022,30(10):22-26. 被引量：1
5运晨超,黄毅臣,赵微,薛璐璐,杨亮.基于大数据分析的科技成果数据融合方法研究[J].微型电脑应用,2022,38(4):113-116. 被引量：1
6NIE Shiqiang,WU Weiguo,ZHANG Chi,ZHANG Chen.PALES: Optimizing Secure Data Deletion in SSDs via Page Group and Reprogram Speedup[J].Chinese Journal of Electronics,2022,31(1):40-51.
7Yan Liu,Wei-Dong Li,Tao Lin,Wen-Xing Fang,Simon C.Blyth,Ji-Lei Xu,Miao He,Kun Zhang.Muon reconstruction with a convolutional neural network in the JUNO detector[J].Radiation Detection Technology and Methods,2021,5(3):364-372. 被引量：1
8苗青林,张晓丰,高杨军,刘显光,秦丕胜.双通道深度卷积神经网络的航空发动机剩余使用寿命预测方法[J].空军工程大学学报（自然科学版）,2022,23(2):12-18. 被引量：3
9张骥,刘凯,丁阳.Speedup of self-propelled helical swimmers in a long cylindrical pipe[J].Chinese Physics B,2022,31(1):403-416.
10张云静,詹思延,王胜锋.医疗保险数据在肿瘤心脏病学领域的应用与挑战[J].药物流行病学杂志,2022,31(4):271-279.

电子设计工程

2022年第10期

浏览历史

内容加载中请稍等...

基于模糊K-means聚类算法的区域数据智能分析方法被引量：2

参考文献12

二级参考文献64

共引文献143

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于模糊K-means聚类算法的区域数据智能分析方法 被引量：2

参考文献12

二级参考文献64

共引文献143

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于模糊K-means聚类算法的区域数据智能分析方法被引量：2