中医临床疾病数据多标记分类方法研究被引量：1

Research on Multi-Label Classification Method of Traditional Chinese Medicine Clinical Disease Data

下载PDF

导出

摘要 WML-kN N(weighted multi-label k nearest neighbor)算法中近邻点个数取固定值,而没有考虑样本数据的实际特点,可能会将相似度高的点排除在近邻集外,或者将相似度低的点包含在近邻集内,这些都会影响分类器的性能。而中医(traditional Chinese medicine,TCM)临床获得的关于疾病的数据很可能是多标记的,同时由于病例的特殊性,每个病例可能具有不同的相似近邻集。因此,对WML-kNN算法进行了改进,提出WML-GkN N(WML-granular kNN)算法。该算法通过粒计算对粒度空间进行控制,从而确定近邻点集,使得邻域内的样本点有高相似性。在中医临床采集的经络电阻数据上的实验结果显示,WML-GkNN算法提高了分类性能。 WML-kNN （weighted multi-label k nearest neighbor） learning algorithm, the number of neighbor points from fixed value, without considering the actual characteristics of the sample data, may make the high similarity point excluded from the neighbor set, or the low similarity point contained in the neighbor set, which will affect the performance of classifier. Traditional Chinese medicine （TCM） clinical data on the disease are likely to have multipie labels, and because of the particularity of the sample, each sample may have different similarity neighbors. This paper improves the WML-kNN algorithm and proposes WML-GkNN （WML-granular kNN） algorithm. In WML- GkNN algorithm, the granular control is used to control the granularity space, and the set of neighbors is deter- mined, so that the sample points in the neighborhood have high similarity. The experimental results on the meridian resistance data collected by TCM show that the WML-GkNN algorithm improves the classification performance.

作者潘主强张林张磊李国正颜仕星 PAN Zhuqiang1, ZHANG Lin1, ZHANG Lei2, LI Guozheng3, YAN Shixing4(1. School of Computer Science, Southwest Petroleum University, Chengdu 610500, China; 2. Institute of Basic Research in Clinical Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 3. National Data Center of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 4. Shanghai Menorah Information Technology Co., Ltd., Shanghai 201800, Chin)

机构地区西南石油大学计算机科学学院中国中医科学院中医临床基础医学研究所中国中医科学院中医药数据中心上海金灯台信息科技有限公司

出处《计算机科学与探索》 CSCD 北大核心 2018年第8期1295-1304,共10页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金No.81503680 中央级公益性科研院所基本科研业务费专项资金No.ZZ0908032 全民健康保障信息化工程中医药项目研究No.215005~~

关键词中医临床数据多标记学习粒计算权重 Chinese medicine clinical data multi-label learning granular computing weight

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1赵海峰,余强,曹俞旦.基于粒计算的多标签懒惰学习算法[J].计算机科学,2014,41(12):160-163. 被引量：2
2葛雷,李国正,尤鸣宇.多标记学习的嵌入式特征选择[J].南京大学学报（自然科学版）,2009,45(5):671-676. 被引量：12
3张敏灵.一种新型多标记懒惰学习算法[J].计算机研究与发展,2012,49(11):2271-2282. 被引量：39
4支联合,周文刚,谭素敏.基于多尺度特征提取的t检验方法分析fMRI数据[J].中国生物医学工程学报,2015,34(4):492-495. 被引量：1
5陈小波,吴涛,高正龙.基于粒计算的K近邻多标签学习算法[J].计算机工程,2012,38(22):167-170. 被引量：4
6张顺,张化祥.用于多标记学习的K近邻改进算法[J].计算机应用研究,2011,28(12):4445-4446. 被引量：10
7邹永杰,周继鹏,王桂香,林传权,陈蔚文.基于特征提取的分类集成在脾虚证诊断中的应用[J].计算机应用与软件,2010,27(3):22-25. 被引量：4
8汤进,黄莉莉,赵海峰,罗斌.使用自适应线性回归的多标签分类算法[J].华南理工大学学报（自然科学版）,2012,40(9):69-74. 被引量：7

二级参考文献125

1王永炎.完善中医辨证方法体系的建议[J].中医杂志,2004,45(10):729-731. 被引量：242
2李丹,李国正,陆文聪.用于药物活性预报的Co-Training方法[J].计算机科学,2006,33(12):159-161. 被引量：3
3龚燕冰,倪青,王永炎.中医证候研究的现代方法学述评(一)——中医证候数据挖掘技术[J].北京中医药大学学报,2006,29(12):797-801. 被引量：96
4Schapire R E, Singer Y. Boostexter: A boosting-based system for text categorization. Machine Learning, 2000, 39 (2--3):135-168.
5McCallum A. Multi-label text classification with a mixture model trained by EM. Working Notes of the AAAI' 99 Workshop on Text Learning. Orlando: AAAI, 1999.
6Boutell M R, Luo J, Shen X, et al. Learning multi-label scene classification. Pattern Recognition, 2004, 37(9): 1757-1771.
7Yin Z, Zhou Z H. Multi-label dimensionality reduction via dependency maximization. Proceedings of the 23^rd AAAI Conference on Artificial Intelligence, Chicago, IL: AAAI, 2008, 1503-1505.
8Yu K, Yu S P, Tresp V. Multi-label informed latent semantic indexing. Proceedings of the 28^th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, New York, NY:ACM, 2005, 258--265.
9Moody J, Utans J. Principled architecture selection for neural networks: Application to corporate bond rating prediction. Moody J E, Hanson S J, Lippmann R P. Neural Information Processing Systems 4. Morgan Kaufmann Publishers, Inc. 1992, 683-690.
10Guyon I, Elisseeff A. An introduction to variable and feature selection. Journal of Machine Learning Research, 2003, 3:1157-1182.

共引文献68

1张煜东,霍元铠,吴乐南,董正超.降维技术与方法综述[J].四川兵工学报,2010,31(10):1-7. 被引量：29
2刘端阳,邱卫杰.基于加权SVM主动学习的多标签分类[J].计算机工程,2011,37(8):181-182. 被引量：7
3张永波,游录金,陈杰新.基于模拟退火的多标记数据特征选择[J].计算机工程与设计,2011,32(7):2494-2496. 被引量：6
4刘端阳,邱卫杰.基于平均期望间隔的多标签分类主动学习方法[J].计算机工程,2011,37(15):168-170. 被引量：1
5邵欢,李国正,刘国萍,王忆勤.多标记中医问诊数据的症状选择[J].中国科学：信息科学,2011,41(11):1372-1387. 被引量：9
6胡玲,陈冠林,陈蔚文.脾虚理论及其应用——脾胃学说传承与应用专题系列(4)[J].中医杂志,2012,53(14):1174-1177. 被引量：11
7刘子锋,范冰冰,郑伟平.基于Eucalyptus网站云的资源调度[J].计算机系统应用,2012,21(10):174-178.
8郑舞,刘国萍.常见数据挖掘方法在中医诊断领域的应用概况[J].中国中医药信息杂志,2013,20(4):103-107. 被引量：16
9何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
10赵玉丹,王倩,范九伦,刘颖,高梓铭.基于模糊KNN的刑侦图像场景分类[J].计算机应用研究,2014,31(10):3158-3160. 被引量：9

同被引文献9

1郝春风,王忠民.一种用于大规模文本分类的特征表示方法[J].计算机工程与应用,2007,43(15):170-172. 被引量：12
2广凯,潘金贵.一种基于向量夹角的k近邻多标记文本分类算法[J].计算机科学,2008,35(4):205-206. 被引量：6
3张顺,张化祥.用于多标记学习的K近邻改进算法[J].计算机应用研究,2011,28(12):4445-4446. 被引量：10
4李学明,李海瑞,薛亮,何光军.基于信息增益与信息熵的TFIDF算法[J].计算机工程,2012,38(8):37-40. 被引量：48
5危凌云,李灿东,黄文金,姚明龙,黄守清,杨雪梅.中医体质类型分布及兼杂规律研究[J].山东中医药大学学报,2016,40(2):102-104. 被引量：18
6彭长根,丁红发,朱义杰,田有亮,符祖峰.隐私保护的信息熵模型及其度量方法[J].软件学报,2016,27(8):1891-1903. 被引量：57
7陈科文,张祖平,龙军.文本分类中基于熵的词权重计算方法研究[J].计算机科学与探索,2016,10(9):1299-1309. 被引量：11
8李峰,苗夺谦,张志飞,张维.基于互信息的粒化特征加权多标签学习k近邻算法[J].计算机研究与发展,2017,54(5):1024-1035. 被引量：22
9龚静,黄欣阳.基于隐性语义索引的多标签文本分类集成方法[J].计算机工程与设计,2017,38(9):2556-2561. 被引量：6

引证文献1

1吕庆莉.基于信息增益的中医体质多标记分类方法研究[J].中国中医药信息杂志,2019,26(6):97-100.

1罗彦妮,覃冬华,欧世宁,陈浪,韦宁,玉双成.缺血性脑卒中脑白质病变对认知功能及预后影响的研究[J].广西医科大学学报,2018,35(4):506-508. 被引量：7
2Loai AI Abeach,Samia Nefti-Meziani,Theo Theodoridis,Steve Davis.A Variable Stiffness Soft Gripper Using Granular Jamming and Biologically Inspired Pneumatic Muscles[J].Journal of Bionic Engineering,2018,15(2):236-246. 被引量：8
3Yue-peng ZOU,Ji-hong OUYANG,Xi-ming LI.Supervised topic models with weighted words:multi-label document classification[J].Frontiers of Information Technology & Electronic Engineering,2018,19(4):513-523. 被引量：1
4Hasan Ghafori,Hamid Reza Ebrahimi.Numerical and experimental study of an innovative pipeline design in a granular pneumatic-conveying system[J].Particuology,2018,16(3):196-203. 被引量：1
5Joanna Wicacke,Marek Molenda,Mateusz Stasiak.Effect of number of granulometric fractions on structure and micromechanics of compressed granular packings[J].Particuology,2018,16(4):88-95. 被引量：2
6宋宗斌,杨雪滢,封文星,席忠红,李烈娟,石玉仁.Decaying solitary waves propagating in one-dimensional damped granular chain[J].Chinese Physics B,2018,27(7):388-392.
7梁伍七,李斌,许磊,江克勤.基于对数似然比的中文文本分类特征选择研究[J].安庆师范大学学报（自然科学版）,2018,24(1):45-50. 被引量：1
8黄维华,吕田明,李焕敏,杜淑华,杨灿洪,袁师其.血清载脂蛋白AI、B及其比值与脑白质变性严重程度的相关性[J].南方医科大学学报,2018,38(8):992-996. 被引量：11

计算机科学与探索

2018年第8期

浏览历史

内容加载中请稍等...

中医临床疾病数据多标记分类方法研究被引量：1

参考文献8

二级参考文献125

共引文献68

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

中医临床疾病数据多标记分类方法研究 被引量：1

参考文献8

二级参考文献125

共引文献68

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

中医临床疾病数据多标记分类方法研究被引量：1