中医临床不均衡数据疾病分类方法研究被引量：3

Research on classification of diseases of clinical imbalanced data in traditional Chinese medicine

下载PDF

导出

摘要基于欠采样的不均衡数据分类算法是一种随机数据优化算法,但它不能最好地反映中医临床原始数据的分布并解决数据的特征冗余问题。提出了基于预测风险的最远病例不均衡装袋算法(PRFS-FPUSAB)。该算法中首先基于欠采样提出了改进的抽样方式尽可能地反映原始数据分布,然后结合集成学习、预测风险标准提高不均衡的分类性能并进行特征选择。在中医临床采集的经络电阻数据上的实验结果表明,该算法改善了曲线下面积并且选择的特征也符合中医学相关理论。 An algorithm based on under-sampling unbalanced data classification is a stochastic data optimization algorithm. However, in traditional Chinese medicine （TCM）, it is difficult to best reflect the distribution of original clinical data to solve the problem of feature redundancy in data. Therefore, in this paper, the PRFS-FPUSAB algorithm is proposed. In the algorithm, an improved sampling method is proposed based on under-sampling. The original data distribution is reflected as much as possible; then, the classification is improved by combining integrated learning, prediction risk, and feature selection. The experimental results on meridian resistance data collected from TCM show that the algorithm improves the area under the curve, and the selected characteristics are also in accordance with TCM theory.

作者潘主强张林张磊李国正颜仕星

机构地区西南石油大学计算机科学学院中国中医科学院中医临床基础医学研究所中国中医科学院中医药数据中心上海金灯台信息科技有限公司

出处《智能系统学报》 CSCD 北大核心 2017年第6期848-856,共9页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(81503680) 中央级公益性科研院所基本科研业务费专项资金项目(ZZ0908032) 全民健康保障信息化工程中医药研究项目(215005)

关键词中医临床不均衡数据分类原始数据分布特征选择 Chinese medicine clinical imbalance data classification initial data distribution feature selection

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1邹永杰,周继鹏,王桂香,林传权,陈蔚文.基于特征提取的分类集成在脾虚证诊断中的应用[J].计算机应用与软件,2010,27(3):22-25. 被引量：4
2朱明,陶新民.基于随机下采样和SMOTE的不均衡SVM分类算法[J].信息技术,2012,36(1):39-43. 被引量：13
3潘主强,张林,颜仕星,李国正,张磊.中医睡眠情绪类疾病不均衡数据的分类研究[J].济南大学学报（自然科学版）,2017,31(1):55-60. 被引量：3
4谢娜娜,房斌,吴磊.不均衡数据集上文本分类方法研究[J].计算机工程与应用,2013,49(20):118-121. 被引量：11
5赵自翔,王广亮,李晓东.基于支持向量机的不平衡数据分类的改进欠采样方法[J].中山大学学报（自然科学版）,2012,51(6):10-16. 被引量：16
6陶新民,郝思媛,张冬雪,徐鹏.不均衡数据分类算法的综述[J].重庆邮电大学学报（自然科学版）,2013,25(1):101-110. 被引量：66
7康世瑜.基于数据挖掘和特征选择的入侵检测模型[J].微电子学与计算机,2011,28(8):74-76. 被引量：5
8刘天羽,李国正.齿轮故障不均衡分类问题的研究[J].计算机工程与应用,2010,46(20):146-148. 被引量：2
9刘天羽,李国正.滚动轴承故障诊断中数据不均衡问题的研究[J].计算机工程与科学,2010,32(5):150-153. 被引量：7

二级参考文献127

1徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
2陈丽丽,李卫,管晓宏,祝春华.一种基于网络的入侵检测系统的研究与实现[J].微电子学与计算机,2004,21(6):129-131. 被引量：6
3麦美琦,郭澄泓.质子泵抑制剂Lansoprazole和Pantoprazole的药理与临床[J].国外医药（合成药．生化药．制剂分册）,1993,14(5):279-281. 被引量：4
4王永炎.完善中医辨证方法体系的建议[J].中医杂志,2004,45(10):729-731. 被引量：241
5陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：51
6熊军,李凤英,沈玉娣.齿轮故障诊断技术应用综述[J].机床与液压,2005,33(12):12-15. 被引量：7
7苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386
8龚燕冰,倪青,王永炎.中医证候研究的现代方法学述评(一)——中医证候数据挖掘技术[J].北京中医药大学学报,2006,29(12):797-801. 被引量：96
9陈斌,冯爱民,陈松灿,李斌.基于单簇聚类的数据描述[J].计算机学报,2007,30(8):1325-1332. 被引量：18
10Wolpertand D H, Macready W G. No free lunch theorems for search[J].IEEE TEC, 1997,1 ( 1 ) :67 -S2.

共引文献113

1杨鸿雁,田英杰.机器学习在食品安全风险预警及抽检方案制订中的应用研究[J].管理评论,2022,34(11):315-323. 被引量：3
2骆魁永.一种面向不均衡数据集的CHI特征选择改进算法[J].商丘师范学院学报,2021,37(6):9-13.
3郑凌铭,舒胜文,陈彬,吴涵,黄建业,钱健.强台风环境下基于格点化和支持向量机的10 kV杆塔受损量预测方法[J].高电压技术,2020,46(1):42-51. 被引量：14
4朱庆文.重中之重:加强和改进思想政治工作[J].理论学习（浙江）,2000(2):42-42.
5胡玲,陈冠林,陈蔚文.脾虚理论及其应用——脾胃学说传承与应用专题系列(4)[J].中医杂志,2012,53(14):1174-1177. 被引量：11
6陶新民,郝思媛,张冬雪,徐鹏.不均衡数据分类算法的综述[J].重庆邮电大学学报（自然科学版）,2013,25(1):101-110. 被引量：66
7林冬茂,薛德黔.一种基于无监督免疫优化分层的网络入侵检测算法[J].计算机科学,2013,40(3):180-182. 被引量：14
8郑舞,刘国萍.常见数据挖掘方法在中医诊断领域的应用概况[J].中国中医药信息杂志,2013,20(4):103-107. 被引量：16
9宋群,张骏,智永锋.基于集成PU学习数据流分类的入侵检测方法[J].微电子学与计算机,2013,30(7):173-176.
10杨智明,俞洋,乔立岩,王钢.基于偏置经验特征映射的电路故障诊断方法[J].仪器仪表学报,2013,34(7):1595-1602. 被引量：4

同被引文献51

1唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
2沈自尹.系统生物学和信息医学在中西医结合中的应用[J].中西医结合学报,2006,4(2):111-113. 被引量：22
3郭荣坤,王忠东.ANN测井相分析方法研究[J].地球物理学进展,1996,11(2):53-65. 被引量：2
4程妍,刘仲林.计算生物学——一门充满活力的新兴交叉学科[J].科学学与科学技术管理,2006,27(3):11-15. 被引量：11
5杜娟,姜丽丽,陈红丽.不均衡数据集文本分类中少数类样本生成方法研究[J].计算机应用研究,2009,26(10):3731-3734. 被引量：5
6李鹏祥.随机抽样中必要样本容量的确定[J].赤峰学院学报（自然科学版）,2009,25(9):18-19. 被引量：11
7薛林福,潘保芝.用自组织神经网络自动识别岩相[J].长春科技大学学报,1999,29(2):144-148. 被引量：17
8陶新民,郝思媛,张冬雪,徐鹏.不均衡数据分类算法的综述[J].重庆邮电大学学报（自然科学版）,2013,25(1):101-110. 被引量：66
9吴建鑫,周志华,沈学华,陈兆乾.一种选择性神经网络集成构造方法[J].计算机研究与发展,2000,37(9):1039-1044. 被引量：27
10陈波,李明月,丁沙沙,洪寿海,赵雪,徐媛,张阔,于海龙,郭义.Research progress on regulations on nerve-endocrine-immune network by acupuncture[J].World Journal of Acupuncture-Moxibustion,2014,24(4):49-53. 被引量：22

引证文献3

1齐玉东,丁海强,赵锦超,孙明玮.基于biRNN的海军军械不均衡文本数据集处理方法[J].计算机与现代化,2019,0(12):21-26. 被引量：3
2郭义,王江,陈波,邓斌,刘阳阳,郭永明,赵雪,李柠岑,李宛蓉,张阔,徐媛,郭扬,何丽云,刘保延.论计算针灸学[J].世界中医药,2020,15(7):953-960. 被引量：15
3谌丽,王才志,宁从前,刘英明,王浩.基于机器学习的鄂尔多斯盆地陇东地区长7段岩相测井识别方法[J].油气藏评价与开发,2023,13(4):525-536. 被引量：2

二级引证文献20

1荣培晶,陈瑜,王瑜,赵亚楠,张帅.面向未来的中国医学——针灸篇[J].世界科学技术-中医药现代化,2021,23(8):2884-2888. 被引量：9
2刘敬萱,王锐卿,张子迪,贾春生.中国耳针不同流派比较与分析[J].中国针灸,2020,40(12):1363-1368. 被引量：13
3谌爱华,蒋冰,王妙华,吴嘉萍,杨雨婷,贺福元,邓凯文.治疗缺血性脑卒中的网络针灸学研究[J].针灸临床杂志,2021,37(5):50-56. 被引量：7
4魏晓雅,张娜,李金玲,石广霞,王丽琼,屠建锋,刘存志,王旭.基于磁共振成像和机器学习的针刺镇痛神经标志物研究现状[J].针刺研究,2021,46(6):505-509. 被引量：8
5尹海燕,王绪,余曙光,唐勇.针灸材料学:针灸学科新分支[J].针刺研究,2021,46(6):515-517. 被引量：2
6吴冬,孙汉旭,荣培晶,戴如君,廉海红,孙静宜.针灸与人工智能学科交叉的现状与策略探讨[J].针刺研究,2021,46(6):541-545. 被引量：10
7李海燕,高博,熊婕,崔蒙.中医药信息学基本理论与学科体系研究新进展[J].医学信息学杂志,2021,42(11):29-35. 被引量：1
8王明乾,邓鹏,倪林.基于Attention-CNN的武器装备语料分类方法[J].舰船电子工程,2022,42(2):102-106.
9王曦廷,卢涛.中医药认知计算:概念、框架与路径[J].中华中医药杂志,2022,37(1):35-40. 被引量：6
10廖清阳,王军,胡凯强,宋尧,宗志亚,范俊秋.基于深度并行CNN-BiLSTM的能源互联网电负荷和热负荷联合预测模型[J].中国测试,2022,48(4):146-153. 被引量：10

1李夏蔚,朱岩岩.某院107例抗肿瘤药物致不良反应报告的相关因素分析[J].抗感染药学,2017,14(8):1529-1532. 被引量：5
2孙悦铭,杨颖.浅析国有企业内部审计风险控制[J].中国市场,2017(28):199-200. 被引量：1
3王崴.高职院校外国留学生学习动机与自我评价对升学意愿影响的研究[J].价值工程,2017,36(36):133-135.
4张广南,饶元.基于集成学习的温室育种智能决策算法[J].西南科技大学学报,2017,32(4):78-81.
5林志宏,池宏,许保光.基于卷积神经网络的公安案件文本语义特征提取方法研究[J].数学的实践与认识,2017,47(17):127-140. 被引量：4
6戴炳媛,张凯.南京某大学本科生对生殖健康的“知信行”调查[J].中华疾病控制杂志,2017,21(11):1184-1186. 被引量：10
7俸茗娟.支原体肺炎患儿采用阿奇霉素序贯疗法的疗效和安全性[J].数理医药学杂志,2018,31(1):58-60. 被引量：1
8高莲,张榆锋,阎金娥,李支尧,章克信,熊敏,韩素雅.基于解析速度仿真动脉瘤超声多普勒血流信号[J].系统仿真学报,2017,29(12):2972-2979. 被引量：1
9庞逸群,范宗祥.基于法向偏差的三维激光扫描数据简化研究[J].水能经济,2017,0(10):101-101.
10顾涛勇,郭建胜,李正欣,王健,王腾蛟.基于插值-拟合-迁移学习算法的机载设备故障概率预测[J].系统工程与电子技术,2018,40(1):114-118. 被引量：4

智能系统学报

2017年第6期

浏览历史

内容加载中请稍等...

中医临床不均衡数据疾病分类方法研究被引量：3

参考文献9

二级参考文献127

共引文献113

同被引文献51

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

中医临床不均衡数据疾病分类方法研究 被引量：3

参考文献9

二级参考文献127

共引文献113

同被引文献51

引证文献3

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

中医临床不均衡数据疾病分类方法研究被引量：3