高维类不平衡冠心病数据的变量选择
摘要
近几年,随着大数据概念的不断升温,学术界及产业界对不平衡数据处理问题的研究热情仍未消退,且呈现逐渐升温的趋势,医疗数据成为其重要处理对象。医疗数据的特征是高度不平衡性、变量相关性程度高且维度高。该文首先对数据集进行相关性分析,得出变量间存在严重的相关性,变量之间存在相关性会对分类结果产生影响。
出处
《数字技术与应用》
2022年第9期129-132,共4页
Digital Technology & Application
参考文献4
-
1李勇,刘战东,张海军.不平衡数据的集成分类算法综述[J].计算机应用研究,2014,31(5):1287-1291. 被引量:75
-
2徐玲,尹婷婷,俞吉,朱裕林.冠心病冠状动脉粥样硬化发生的危险因素多因素Logistic分析[J].临床和实验医学杂志,2019,18(6):626-629. 被引量:41
-
3路航.早发冠心病的危险因素及冠脉病变特点分析[J].中国疗养医学,2019,28(4):348-351. 被引量:5
-
4杨日东,李琳,陈秋源,华赟鹏,周毅.基于不平衡分类的原发性肝癌患者无病生存期预测研究[J].生物医学工程研究,2019,38(1):27-31. 被引量:3
二级参考文献59
-
1WU Xin-dong,KUMAR V,QUINLAN J R,et al.Top 10 algorithms in data mining[J].Knowledge and Information Systems,2008,14(1):1-37.
-
2CHAWLA N V,JAPKOWICZ N,KOTCZ A.Editorial:special issue on learning from imbalanced data sets[J].ACM SIGKDD Explorations Newsletter,2004,6(1):1-6.
-
3HE Hai-bo,GARCIA E A.Learning from imbalanced data[J].IEEE Trans on Knowledge and Data Engineering,2009,21(9):1263-1284.
-
4TING K M.A comparative study of cost-sensitive boosting algorithms[C]//Proc of the 17th International Conference on Machine Learning.2000:983-990.
-
5FAN Wei,STOLFO S J,ZHANG Jun-xin,et al.AdaCost:misclassification cost-sensitive boosting[C]//Proc of the 16th International Conference on Machine Learning.1999:97-105.
-
6SUN Yan-min,KAMEL M S,WONG A K C,et al.Cost-sensitive boosting for classification of imbalanced data[J].Pattern Recognition,2007,40(12):3358-3378.
-
7GALAR M,FERNNDEZ A,BARRENCHEA E,et al.EUSBoost:enhancing ensembles for highly imbalanced data-sets by evolutionary undersampling[J].Pattern Recognition,2013,46(12):3460-3471.
-
8JOSHI M V,KUMAR V,AGARWAL R C.Evaluating boosting algorithms to classify rare classes:comparison and improvements[C]//Proc of IEEE International Conference on Data Mining.Washington DC:IEEE Computer Society,2001:257-264.
-
9GUO Hong-yu,VIKTOR H L.Learning from imbalanced data sets with boosting and data generation:the DataBoost-IM approach[J].SIGKDD Exploration Newsletter,2004,6(1):30-39.
-
10FREUND Y,SCHAPIRE R.A desicion-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer & System Sciences,1997,55(1):119-139.
共引文献118
-
1赵继华,赵文淑,赵付英,姜岳,刘玉江.全科-专科团队协同管理冠心病的实践体会[J].慢性病学杂志,2021(7):1001-1004. 被引量:2
-
2李村合,姜宇,李帅.基于不等距超平面距离的模糊支持向量机[J].计算机系统应用,2020(10):185-191. 被引量:6
-
3龚海燕.早发冠心病患者危险因素及冠脉特点探讨[J].心理月刊,2020,0(9):159-159. 被引量:1
-
4陈捷,周峰,刘金波,王宏宇.基于聚类的冠心病患者药物治疗模式及人群异质性研究[J].中华临床医师杂志(电子版),2022,16(10):1012-1018.
-
5郭守仁.拥抱“世外桃源”奥克兰(下)[J].科技潮,2000(3):34-37.
-
6李勇.结合欠抽样与集成的软件缺陷预测[J].计算机应用,2014,34(8):2291-2294. 被引量:7
-
7刘宁.一种两层结构集成的协同分类算法[J].微型电脑应用,2015,31(5):33-35.
-
8李勇.本科机器学习课程教改实践与探索[J].计算机教育,2015(13):63-66. 被引量:25
-
9闵行,褚晶辉,吕卫.组合降采样极限学习机[J].信息技术,2015,39(11):159-162.
-
10肖鹰,吴哲夫,张彤,王中友.一种基于特征选择的不平衡数据分类算法[J].集成技术,2016,5(1):68-74. 被引量:5