网络拓扑特征的不平衡数据分类被引量：4

Imbalanced data classification of network topology characteristics

下载PDF

导出

摘要现实中的数据集普遍具有非均衡性。针对不平衡分类问题,建立数据集网络结构来充分挖掘隐藏在样本点位置信息外的拓扑特征,分析网络节点的连接特性并赋予节点不同的效率。计算待测节点与每个子网络的相似性测度,依据新型的概率模型,进一步推算出该节点与各子网络的整体性测度。构建了一种基于网络拓扑特征的不平衡数据分类方法,算法中引入不平衡因子c用以减小由正负类样本数量差异所带来的影响。实验结果表明,该算法能有效提高分类精度,特别是对拓扑特征明显的数据集,在分类性能和适应能力上相比传统分类方法都得到进一步提升。 This paper aims to solve the imbalanced data classification problem,which has been proven to be common in real applications.The dataset network structure is established to fully mine the topological features hidden outside the position information of sample points,analyze the connection characteristics of network nodes,and give these nodes dif-ferent efficiencies.The similarity measure between the node to be tested and each sub-network is calculated,and the in-tegrity measure between the node and each sub-network is further calculated according to the new probability model.A classification method of imbalanced data based on network topology features is constructed.An imbalanced factor c is introduced into the algorithm to reduce the influence caused by the difference in the number of positive and negative samples.The experimental results show that the algorithm can effectively improve the classification accuracy,espe-cially for datasets with significant topological features.The classification performance and adaptability are further im-proved compared with the traditional classification method.

作者普事业刘三阳白艺光 PU Shiye;LIU Sanyang;BAI Yiguang(School of Mathematics and Statistics,Xidian University,Xi’an 710126,China)

机构地区西安电子科技大学数学与统计学院

出处《智能系统学报》 CSCD 北大核心 2019年第5期889-896,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(61877046) 陕西省自然科学基金项目(2017JM1001)

关键词不平衡数据相似度网络结构准确率拓扑物理特征 imbalanced data similarity network structure accuracy rate topology physical feature

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1程险峰,李军,李雄飞.一种基于欠采样的不平衡数据分类算法[J].计算机工程,2011,37(13):147-149. 被引量：21
2张银峰,郭华平,职为梅,范明.一种面向不平衡数据分类的组合剪枝方法[J].计算机工程,2014,40(6):157-161. 被引量：12
3顾苏杭,王士同.基于数据点本身及其位置关系辅助信息挖掘的分类方法[J].模式识别与人工智能,2018,31(3):197-207. 被引量：13
4赵自翔,王广亮,李晓东.基于支持向量机的不平衡数据分类的改进欠采样方法[J].中山大学学报（自然科学版）,2012,51(6):10-16. 被引量：16

二级参考文献41

1陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：51
2He Haibo, Edwardo A. Learning from Imbalanced Data[J]. IEEE Trans. on Knowledge and Data Engineering, 2009, 21(9): 1263- 1284.
3Chawla N V, Japkowicz N, Kolcz A. Editorial: Special Issue on Learning from Imbalanced Data Sets[J]. SIGKDD Explorations,2004, 6(1): 1-6.
4Batista G E A, Prati R C, Monard M C. A Study of the Behavior of Several Methods for Balancing Machine Learning TrainingData[J]. ACM SIGKDD Explorations Newsletter, 2004, 6(1): 20-29.
5Fawcett T. An Introduction to ROC Analysis[J]. Pattern Recognition Letters, 2006, 27(8): 861-874.
6Tan P N, Steinbach M, Kumar V. Introduction to Data Mining[M]. Boston, Massachusetts, USA: Addison Wesley, 2005.
7He Haibo, Garcia E A. Learning from Imbalanced Data[J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(9): 1263-1284.
8Friedman J H, Bogdan E P. Predictive Learning via Rule Ensemble[J]. Annals of Applied Statistics, 2008, 2(3): 916-954.
9Tan P, Steinbach M, Kumar V. 数据挖掘导论[M]. 范明, 范宏建, 译. 北京: 人民邮电出版社, 2008.
10Partalas I, Tsoumakas G, Vlahavas I P. An Ensemble Pruning Primer[C]//Proc. of Workshop on Applications of Supervised and Unsupervised Ensemble Methods. Berlin, Germany: Springer-Verlag, 2009: 1-13.

共引文献51

1刘海青,李智桥,李元诚.基于C-lightGBM的用户窃电检测[J].计算机应用研究,2020,37(S01):298-300. 被引量：11
2郑凌铭,舒胜文,陈彬,吴涵,黄建业,钱健.强台风环境下基于格点化和支持向量机的10 kV杆塔受损量预测方法[J].高电压技术,2020,46(1):42-51. 被引量：12
3刘应东,孙秉珍.基于元胞自动机的小样本集分类算法[J].计算机工程,2012,38(7):155-157. 被引量：2
4杨智明,俞洋,乔立岩,王钢.基于偏置经验特征映射的电路故障诊断方法[J].仪器仪表学报,2013,34(7):1595-1602. 被引量：4
5谢娜娜,房斌,吴磊.不均衡数据集上文本分类方法研究[J].计算机工程与应用,2013,49(20):118-121. 被引量：11
6丁福利,孙立民.处理不平衡样本集的欠采样算法[J].计算机工程与设计,2013,34(12):4345-4350. 被引量：7
7丁福利,孙立民.基于支持向量机的不平衡样本分类研究[J].科学技术与工程,2014,22(3):81-85. 被引量：7
8刘余霞,刘三民,刘涛,王忠群.一种新的过采样算法DB_SMOTE[J].计算机工程与应用,2014,50(6):92-95. 被引量：12
9闵建.基于加权支持向量机的热轧带钢弯曲质量预测[J].热加工工艺,2018,47(23):165-167. 被引量：1
10韩芳,孙立民.不平衡样本集的欠采样算法研究[J].福建电脑,2014,30(12):16-18.

同被引文献36

1张宁,周双男,宫嫚,宋雪艾,孙永强,景婧,周超,罗生强,肖小河.FibroScan评价复方鳖甲软肝片抗纤维化的疗效[J].临床肝胆病杂志,2013,29(10):760-763. 被引量：14
2李森,谢翔,李国林,王志华.一种基于颜色结构光的投影仪摄像头触摸板人机交互系统[J].微电子学与计算机,2019,36(1):61-65. 被引量：14
3魏葆春,甘发旺.物联网多层设备信息通信数据分类识别仿真[J].计算机仿真,2019,36(1):425-428. 被引量：3
4顾玉萍,程龙生.基于MTS-AdaBoost的不平衡数据分类研究[J].计算机应用研究,2018,35(2):346-348. 被引量：10
5张宇,包研科,邵良杉,刘威.面向分布式数据流大数据分类的多变量决策树[J].自动化学报,2018,44(6):1115-1127. 被引量：17
6霍东雪,刘辉,尚振宏,李润鑫.一种异构集成学习的儿科疾病诊断方法研究[J].计算机应用与软件,2018,35(6):54-57. 被引量：7
7严伟.基于人机交互的动态手势多触摸点识别仿真[J].计算机仿真,2018,35(10):428-431. 被引量：2
8刘洋,刘洋1,许立雄.适用于海量负荷数据分类的高性能反向传播神经网络算法[J].电力系统自动化,2018,42(21):96-103. 被引量：37
9程健,杨凌凯,崔宁,郭一楠.基于流形嵌入过采样的非平衡数据分类方法[J].中国矿业大学学报,2018,47(6):1325-1333. 被引量：11
10刘东启,陈志坚,徐银,李飞腾.面向不平衡数据分类的复合SVM算法研究[J].计算机应用研究,2018,35(4):1023-1027. 被引量：23

引证文献4

1王金焱.分布式网络混合云数据分类捕获方法研究[J].安阳工学院学报,2020,19(6):59-62. 被引量：1
2陈莹,黄永彪,谢瑾.人工智能辅助下人机交互隔空手势识别模型[J].计算机仿真,2021,38(3):360-364. 被引量：5
3朱敏捷,李建华,周灵刚.基于巡检机器人的电缆卷筒减速器故障诊断技术[J].机械与电子,2022,40(12):20-23. 被引量：1
4刘佳星,张宏烈,刘艳菊,张惠玉,刘彦忠.基于改进随机森林的肝硬化诊断预测研究[J].计算机科学与应用,2019,9(10):1928-1938. 被引量：1

二级引证文献8

1孙建召,赵进超.种群随机化遗传算法在仿生机械手姿态的应用研究[J].机床与液压,2022,50(15):59-64.
2来言芳.基于人机交互的亲子游戏机手势视觉感应识别系统设计[J].自动化与仪器仪表,2022(7):266-269.
3陆骏.基于人工智能的网络复杂数据分类方法研究[J].信息记录材料,2022,23(8):195-197. 被引量：1
4丁宏,陶晓峰,陆春艳,张士成.基于RWT-SVM的台区配电网日前负荷预测研究[J].南京信息工程大学学报（自然科学版）,2023,15(3):330-336. 被引量：5
5赵法强,黄梁英,樊绍胜,欧阳峰,黄明星.配网电缆沟机器人巡检系统探究[J].今日自动化,2023(5):65-67.
6郑奕捷,李翠玉,郑祖芳.RNN循环神经网络的服务机器人交互手势辨识[J].机械设计与制造,2024(4):282-285.
7黄华.龙门吊轨道交叉下连续箱梁移位工序AI识别模型[J].结构工程师,2024,40(2):184-191.
8刘静,陈旭,刘士亚,张君,张志飞.一种数据融合的乳腺癌分类模型[J].计算机科学与应用,2019,9(12):2293-2302.

1赵晓敏,陈永进,白璐.流动青少年心理健康状况调查[J].中小学心理健康教育,2018(19):4-10.
2黄庆康,宋恺涛,陆建峰.应用于不平衡多分类问题的损失平衡函数[J].智能系统学报,2019,14(5):953-958. 被引量：8
3张涛.不平衡数据分类研究及在疾病诊断中的应用[J].黄河科技学院学报,2019,21(5):15-22. 被引量：5
4张宗堂,王森,孙世林.一种针对不平衡数据分类的集成学习算法[J].山东大学学报（工学版）,2019,49(4):8-13. 被引量：14
5王蕾,赵志强,余红梅,郑楚楚,黄雪倩,武淑琴,罗艳虹.基于重采样和集成学习的弥漫大B细胞淋巴瘤患者复发风险预测模型[J].中国卫生统计,2019,36(4):588-592. 被引量：5
6任世杰,安建平,徐湛,卜祥元.MB-OFDM UWB接收机IQ不平衡和载波频偏的联合估计与补偿[J].北京理工大学学报,2018,38(7):739-743. 被引量：2
7王忠震,黄勃,方志军,高永彬,张娟.改进SMOTE的不平衡数据集成分类算法[J].计算机应用,2019,39(9):2591-2596. 被引量：32
8刘兆辉,李铭浩,肖延丽,彭磊.基于深度学习的医学图像配准[J].电子制作,2019,27(18):52-53. 被引量：4
9概率与不确定性[J].语数外学习（高中版）（上）,2019,0(8):49-52.
10林鸿伟,叶家玮.面向多用户协同感知的电力系统无功电压调节[J].电工技术,2019(18):121-123. 被引量：1

智能系统学报

2019年第5期

浏览历史

内容加载中请稍等...

网络拓扑特征的不平衡数据分类被引量：4

参考文献4

二级参考文献41

共引文献51

同被引文献36

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

网络拓扑特征的不平衡数据分类 被引量：4

参考文献4

二级参考文献41

共引文献51

同被引文献36

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

网络拓扑特征的不平衡数据分类被引量：4