基于各类支持度阈值独立挖掘的关联改进算法被引量：14

An associative classification algorithm based on various class-support thresholds and independent mining rules

下载PDF

导出

摘要关联分类及较多的改进算法很难同时既具有较高的整体准确率又有较好的小类分类性能。针对此问题,提出了一种基于类支持度阈值独立挖掘的关联分类改进算法—ACCS。ACCS算法的主要特点是:(1)根据训练集中各类数量大小给出每个类类支持度阈值的设定方法,并基于各类的类支持度阈值独立挖掘该类的关联分类规则,尽量使小类生成更多高置信度的规则;(2)采用类支持度对置信度相同的规则排序,提高小类规则的优先级;(3)用综合考虑置信度和提升度的新的规则度量预测未知实例。在多个数据集上的实验结果表明,相比多种关联分类改进算法,ACCS算法有更高的整体分类准确率,且在不平衡数据上也能取得较好的小类分类性能。 Associative classification algorithm and its existing improved algorithms cannot achieve both high overall accuracy and good minority class classification.To solve this problem,we propose an improved associative classification algorithm based on various class-support thresholds(ACCS)independent mining rules.Its main featuresare:(1)ACCS sets the support threshold of each class according to the class size in the training data,and extracts the associative classification rule of each class separately based on the class-support threshold in order to get higher confidence rules of minority classes;(2)ACCS uses the class-support threshold to rank the rules with the same confidence for increasing the priority of the minority classes;(3)ACCS combines confidence and lift degrees together to predict unknown instances.The experimental results on multiple datasets show that ACCS can achieve higher overall classification accuracy than the existing associative algorithms,and can also get good minority class classification performance in imbalanced data.

作者周忠眉李家辉 ZHOU Zhong-mei;LI Jia-hui(School of Computer Science,Minnan Normal University,Zhangzhou 363000;Key Laboratory of Data Science and Intelligence Application,Fujian Province University,Zhangzhou 363000,China)

机构地区闽南师范大学计算机学院数据科学与智能应用福建省高等学校重点实验室

出处《计算机工程与科学》 CSCD 北大核心 2019年第11期2088-2094,共7页 Computer Engineering & Science

基金福建省自然科学基金(2018J01545)

关键词关联分类类支持度阈值类支持度分类准确率 associative classification class support threshold class support classification accuracy

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1黄再祥,周忠眉,何田中,郑艺峰.改进的多类不平衡数据关联分类算法[J].模式识别与人工智能,2015,28(10):922-929. 被引量：11

二级参考文献19

1Liu B, Hsu W, Ma Y M. Integrating Classification and Association Rule Mining// Proc of the 4th International Conference on Know- ledge Discovery and Data Mining. New York, USA, 1998:80-86.
2Quinlan J R. C4.5 : Programs for Machine Learning. San Francis- co, USA: Morgan Kaufmann, 1992.
3Li W M, Han J W, Pei J. CMAR: Accurate and Efficient Classifi- cation Based on Multiple Class-Association Rules // Proc of the IEEE International Conference on Data Mining. San Jose, USA, 2001 : 369-376.
4Simon G J, Kumar V, Li P W. A Simple Statistical Model and Association Rule Filtering for Classification//Proc of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Diego, USA, 2011 : 823-831.
5Yu K, Wu X D, Ding W, et al. Causal Associative Classification //Pmc of the 11 th IEEE International Conference on Data Mining. Vancouver, Canada, 2011 : 914-923.
6Chen C H, Chiang R D, Lee C M, et al. Improving the Perfor- mance of Association Classifiers by Rule Prioritization. Knowledge- Based Systems, 2012, 36:59-67.
7Huang Z X, Zhou Z M, He T Z. Resolving Rule Conflicts Based on Nafve Bayesian Model for Associative Classification. Journal of Digital Information Management, 2014, 12( 1 ) : 36-43.
8Cerf L, Gay D, Selmaoui-Foleher N, et al. Parameter-Free Classi- fication in Multi-class Imbalanced Data Sets. Data & Knowledge Engineering, 2013, 87 : 109-129.
9Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules //Proc of the 20th International Conference on Very Large Data Bases. Santiago, Chile, 1994:487-499.
10Han J W, Pei J, Yin Y W. Mining Frequent Patterns without Can- didate Generation. Sigmod Record, 2000, 29(2) : 1-12.

共引文献10

1杜利敏,徐扬.基于Biased-SVM的非平衡半监督分类算法[J].河南大学学报（自然科学版）,2017,47(4):481-489. 被引量：3
2杨建林,刘扬.基于关联分类算法的PU学习研究[J].数据分析与知识发现,2017,1(11):12-18. 被引量：1
3吴萌,侯凌燕,杨大利.基于多类不平衡分类的改进AdaBoost算法研究[J].北京信息科技大学学报（自然科学版）,2018,33(1):76-81.
4赵兴锋,付冬梅,裴梓博,李晓刚.分段式剂量响应函数优化及碳钢腐蚀等级判别方法[J].腐蚀与防护,2018,39(10):805-809. 被引量：3
5刘恺,包月青,赵先锋.改进的软件缺陷预测模型研究[J].浙江工业大学学报,2019,47(2):225-229. 被引量：5
6李家辉,周忠眉.基于多次学习和关联度的关联分类改进算法[J].南京大学学报（自然科学版）,2019,55(4):564-572. 被引量：1
7王凯亮,陆俊,徐志强,齐增清,龚钢军,王赟.基于先验知识与DBM采样的类不平衡用电数据分类方法[J].电力系统自动化,2019,43(20):57-64. 被引量：11
8孙瑜.不平衡数据集中少数类关联规则挖掘的研究与应用[J].电子技术与软件工程,2023(3):233-236.
9王子恒,李鹏,陈静.基于特征选择和模糊类支持度的模糊分类关联规则挖掘算法[J].软件,2023,44(8):15-22. 被引量：2
10李家辉,周忠眉.关联分类及其改进算法综述[J].科技通报,2018,0(8):140-144. 被引量：6

同被引文献208

1王玉光,齐文升,马家驹,阮连国,卢幼然,李旭成,赵昕,张忠德,刘清泉.新型冠状病毒肺炎中医临床特征与辨证治疗初探[J].中医杂志,2020,61(4):281-285. 被引量：752
2熊庭旺,吴芹,刘杰,刘波,徐云燕,王丽娜,张成宸,张玮,石京山.基于神经递质途径抗焦虑中药及其复方研究进展[J].中国中药杂志,2020,45(1):14-19. 被引量：39
3王妍.基于关联规则的自适应学习[J].计算机产品与流通,2019,0(12):235-235. 被引量：3
4周敏,宗秋,赵建平,许淑云,贾鹏.炎症因子在新型冠状病毒肺炎中的作用及对预后的影响[J].内科急危重症杂志,2020(4):283-287. 被引量：16
5王海南,孙艳舫,杨淑莲,王会朋.急性髓系白血病不同中医证型舌象特点及相关性分析[J].辽宁中医杂志,2022,49(2):4-7. 被引量：1
6李银娟,范荣霞,李岩,刘龙,漆璐,王兴河.我国吸入制剂临床试验登记现状分析[J].中国临床药理学杂志,2020,36(4):447-449. 被引量：9
7代敏,彭成.草果的化学成分及其药理作用研究进展[J].中药与临床,2011,2(4):55-59. 被引量：59
8朱文锋.创立以证素为核心的辨证新体系[J].湖南中医学院学报,2004,24(6):38-39. 被引量：301
9章津铭,傅超美,许丽佳,瞿燕,胡慧玲.煨制川木香的止泻作用及其物质基础研究[J].时珍国医国药,2010,21(12):3161-3163. 被引量：12
10吴霞,毕赢,王一涛.前胡化学成分及药理作用的研究进展[J].食品与药品,2010,12(11):442-445. 被引量：27

引证文献14

1林海香,卢冉,陆人杰,许丽,赵正祥,白万胜.基于LDA-CLCBA组合模型的高速铁路道岔故障诊断[J].电子测量与仪器学报,2022,36(3):251-259.
2武晏屹,田硕,雷会霞,李宁,苗明三.基于数据挖掘的中药增强机体免疫功能用药规律分析[J].中药药理与临床,2020,36(1):41-45. 被引量：43
3武晏屹,叶琳,苗明三.基于数据挖掘的中药雾化吸入治疗下呼吸道感染用药规律分析[J].中药药理与临床,2020,36(4):47-51. 被引量：5
4杨井荣,侯向宁.正负关联规则数据挖掘算法研究[J].计算机技术与发展,2020,30(11):64-68. 被引量：5
5陈子琴,陈佳,陈贝,张艳琳,王昆秀,罗志辉,顾骁磊,闫鹏,陈松.基于数据挖掘新型冠状病毒肺炎患者易感体质特征及用药规律[J].北京中医药大学学报,2021,44(3):238-244. 被引量：13
6杨井荣,柳军.基于有序树的时空关联规则数据挖掘的应用[J].计算机技术与发展,2021,31(6):19-23. 被引量：6
7吴爱华,陈出新.分布式数据库中关系数据正负关联规则挖掘[J].计算机仿真,2021,38(9):344-347. 被引量：8
8栾哲宇,李小娟,李杨,陈杨.基于数据挖掘探讨中医药治疗感染后咳嗽的潜方规律[J].现代中西医结合杂志,2021,30(31):3472-3476. 被引量：5
9尤丽艳,蒋东晓,兰济乐,阮叶萍.中药方剂治疗肠易激综合征用药规律分析[J].浙江中医药大学学报,2021,45(10):1162-1168. 被引量：1
10李娜芬,郑芳萍,李晨瑶,陈秋旻,林宝华,姚向阳,黄献钟,赵能江,吴彩胜,颜智力,陈学勤.基于真实世界数据挖掘厦门地区中医论治境外输入新型冠状病毒肺炎用药规律[J].中医药通报,2022,21(10):37-41.

二级引证文献91

1张瑾,李秀敏,苗明三.基于数据挖掘的中药鲜药临床应用特点分析[J].中药药理与临床,2021,37(6):181-185. 被引量：8
2杨影,房栩丞,郑萍.自拟愈合汤口服对肛周脓肿患者术后创面愈合的影响[J].新疆中医药,2022,40(3):34-36. 被引量：1
3高伟,赵春梅,丁乾.清热利湿益肾解毒方剂治疗宫颈上皮内瘤变的疗效及对GDF-15、Wnt-11、LRP-6表达的影响[J].四川中医,2023,41(4):156-159.
4李雪,白俊杰,杜庆红,徐雅,薛贝珊.新型冠状病毒肺炎恢复期的中医证治综述[J].四川中医,2022,40(7):20-23. 被引量：3
5赵亚林,邓博文,张厚君,赵毅,徐林,穆晓红.基于因子和聚类分析痉挛型脑瘫用药规律[J].辽宁中医杂志,2021,48(9):6-10. 被引量：4
6王博,叶琳,吴作敏,王瑞,苗明三.柴黄姜术合剂提取工艺的优化[J].河南中医,2020,40(7):1105-1108. 被引量：1
7马传贵,张志秀.茯苓的中医药研究现状与临床治疗进展[J].食用菌,2020,42(4):4-8. 被引量：13
8惠香香,苗明三.基于对调控机体氧化应激的中药的数据挖掘对新冠肺炎中用药的特点分析[J].中国比较医学杂志,2020,30(7):78-84. 被引量：6
9吴雁,林劲榕,闫超.培土方对肺心病缓解期免疫指标的影响[J].中外医学研究,2020,18(26):60-62.
10胡进,张欢,陈辉,朱阳春,黄敏,谢周涛.361例新型冠状病毒肺炎患者中药治疗用药规律分析[J].药物评价研究,2020,43(9):1685-1692. 被引量：4

1杨露,赵伶珊,庄小云.数据挖掘技术在农产品物流配送中的研究[J].合肥学院学报（综合版）,2018,35(2):87-92. 被引量：1
2金婷,谭文安,孙勇,赵尧.模糊多目标进化的社会团队形成方法[J].计算机科学,2019,46(2):315-320. 被引量：1
3李家辉,周忠眉.关联分类及其改进算法综述[J].科技通报,2018,0(8):140-144. 被引量：6
4王芳,夏丽华,陈智斌,崔文君,刘志根,潘翠红.基于关联规则面向对象的海岸带海水养殖模式遥感识别[J].农业工程学报,2018,34(12):210-217. 被引量：17
5张国兰.高原地区护理干预对置留针老年患者安全隐患影响[J].医学信息（医学与计算机应用）,2014(27):264-264.
6陈操,童巍,吴平平.一种应用于自动化轨道式集装箱门式起重机陆侧集卡自动化的新型控制系统[J].港口装卸,2019,0(5):46-50.
7陈璐.复方丹参滴丸联合阿司匹林治疗老年缺血性脑卒中疗效、安全性分析[J].今日健康,2016,15(6):84-84. 被引量：1
8李鹏飞.基于不平衡数据和神经网络算法的通信光缆故障预测分析[J].信息系统工程,2019,0(10):137-138. 被引量：4
9庄敏,仇夏,徐毅君.不同置管手法对置胃管成功率的临床应用[J].医学信息（医学与计算机应用）,2014,0(12):300-300. 被引量：1
10田伟刚,于丽君.非甾体抗炎药物临床应用分析与研究[J].今日健康,2016,15(3):137-137. 被引量：1

计算机工程与科学

2019年第11期

浏览历史

内容加载中请稍等...

基于各类支持度阈值独立挖掘的关联改进算法被引量：14

参考文献1

二级参考文献19

共引文献10

同被引文献208

引证文献14

二级引证文献91

相关作者

相关机构

相关主题

浏览历史

基于各类支持度阈值独立挖掘的关联改进算法 被引量：14

参考文献1

二级参考文献19

共引文献10

同被引文献208

引证文献14

二级引证文献91

相关作者

相关机构

相关主题

浏览历史

基于各类支持度阈值独立挖掘的关联改进算法被引量：14