一种新的兼类文本分类方法被引量：1

New Multi-label Text Classification Algorithm

下载PDF

导出

摘要提出了一种基于超椭球的兼类文本分类算法。对每一类样本,在特征空间求得一个包围该类样本的最小超椭球,使得各类样本之间通过超椭球隔开。对待分类样本,通过判断其是否在超椭球内确定其类别。若没有超椭球包围待分类样本,则通过隶属度确定其所属类别。在标准数据集Reuters 21578上的实验结果表明,该方法较超球方法提高了分类精度和分类速度。 A new multi-label text classification algorithm based on hyper ellipsoidal was proposed in this paper.For every class,the smallest hyper ellipsoidal that contains the samples of the class is structured,which can divide the class samples from others.For the sample to be classified,its class is confirmed by the hyper ellipsoidal that surrounds it.If the sample is not surrounded by any hyper ellipsoidal,the membership is used to confirmed its class.The experiments were done on Reuters 21578 and the experiment results show that the algorithm has a higher performance on classification speed and classification precision compare with hyper sphere algorithm.

作者秦玉平陈一荻王春立王秀坤

机构地区渤海大学工学院大连海事大学信息科学技术学院大连理工大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2011年第11期204-205,224,共3页 Computer Science

基金国家自然科学基金项目(60603023) 国家基础研究重大项目(973)研究专项(2001CCA00700) 辽宁省教育厅重点实验室项目(LS2010180)资助

关键词超椭球兼类分类缩放因子隶属度 Hyper ellipsoidal Multi-label classification Extension factor Membership

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1Yang Yi-ming. An Evaluation of Statistical Approaches to Text Categorization[J]. Journal of Information Retrieval, 1999 ( 1 ) : 69-90.
2Mecallum A, Nigam K. A Comparison of Event Models for Nai ve Bayes Text Classification[C] // AAAI Workshop on Learning for Text Categorization. Madison, 1998 : 509-516.
3Han J, Kamber M. Data Mining : Concepts and Techniques[ M]. Beijing .. Higher Education Press, 2001.
4林士敏,田凤占,陆玉昌.贝叶斯学习、贝叶斯网络与数据采掘[J].计算机科学,2000,27(10):69-72. 被引量：34
5Takahashi F, Abe S, Decision-Tree-Based Multiclass Support Vee tor Machines[C]//International Conference on Neural Information Processing. Singapore, 2002 :1418-1422.
6Platt J, Cristianini N, Shawe-Taylor J. Large Margin DAGs for Multiclass Classification[C]//Advances in Neural Information Processing Systems. Cambridge, MA; MIT Press, 2000 : 547 553.
7Tax D,Duin R. Uniform Object Generation for Optimizing Oneclass Classifiers[J]. Journal of Machine Learning Research, 2001 (2):155-173.
8王晔,黄上腾.基于支持向量机的文本兼类标注[J].计算机工程与应用,2006,42(2):182-185. 被引量：10
9秦玉平,王秀坤,王春立.实现兼类样本类增量学习的一种算法[J].控制与决策,2009,24(1):137-140. 被引量：2
10高俊祥,杜海清,刘勇.采用光照不变特征的椭球法运动阴影检测[J].北京邮电大学学报,2009,32(5):109-113. 被引量：4

二级参考文献37

1唐发明,王仲东,陈绵云.支持向量机多类分类算法研究[J].控制与决策,2005,20(7):746-749. 被引量：90
2孔锐,张冰.一种快速支持向量机增量学习算法[J].控制与决策,2005,20(10):1129-1132. 被引量：31
3张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958. 被引量：84
4朱美琳,杨佩.基于支持向量机的多分类增量学习算法[J].计算机工程,2006,32(17):77-79. 被引量：11
5Vapnik V.The Nature of Statistical Learning Theory[M].Springer Verlag, 1995.
6Vapnik V.Statistical Learning Theory[M].New York, Wiley, 1998.
7Weston J,Watkins C.Multiclass Support Vector Machines[R].TR CS- DTR9804,Department of Computer Science Egham,Surrey TW 200EX, England, 1998.
8K Müller,S Mika,G Rae tsch.An Introduction to Kernel-Based Learning Algorithms[J].IEEE Neural Networks, 2001 ; 12 (2) : 181 -201.
9Y Lee,Y Lin,G Wahba.Multicategory Support Vector Machines[R]. TECHNICAL REPORT,No 1043,2001.
10K P Bennett.Combining support vector and mathematical programming methods for classification[J].In:B Scholkopf,C J C Burges,A J Smola eds.Advances in Kernel Methods:Support Vector Learning,The MIT Press, Cambridge, MA, 1999 : 307-326.

共引文献50

1胡振宇.基于贝叶斯网络的统计推断与问题求解[J].广西师范大学学报（哲学社会科学版）,2000,36(S2):200-206. 被引量：2
2阿布都外力.买买提.贝叶斯不确定性推理及其在往复式压缩机故障诊断中的应用[J].化工装备技术,2005,26(2):65-70. 被引量：2
3张玲华,杨震,郑宝玉.基于模糊分类器及多层前馈神经网络混合结构的说话人辨认[J].通信学报,2005,26(11):68-75. 被引量：4
4陈小佳,沈成武.既有桥梁的贝叶斯网络评估方法[J].武汉理工大学学报（交通科学与工程版）,2006,30(1):132-135. 被引量：5
5王瑞祥,崔利锐.基于贝叶斯网络的中医专家系统构建方法[J].中国医药导报,2007,4(03S):58-58. 被引量：11
6易江芳,佟冬,程旭.使用贝叶斯网络的高效模拟矢量生成方法[J].计算机辅助设计与图形学学报,2007,19(5):616-621. 被引量：7
7丁彦蕊,蔡宇杰,孙俊,须文波.基于SVM和KNN的蛋白质耐热性分类[J].计算机工程与应用,2007,43(16):228-230. 被引量：2
8叶佩,江涛.基于BP特征筛选的模糊聚类手写体数字识别[J].武汉理工大学学报,2007,29(6):128-130. 被引量：1
9秦玉平,艾青,王秀坤,李祥纳,刘卫江.基于支持向量机的兼类文本分类算法研究[J].计算机工程与设计,2008,29(2):408-410. 被引量：8
10李艳美,张卓奎.基于贝叶斯网络的数据挖掘方法[J].计算机仿真,2008,25(2):87-89. 被引量：14

同被引文献11

1孙晋文,肖建国.基于SVM的中文文本分类反馈学习技术的研究[J].控制与决策,2004,19(8):927-930. 被引量：16
2王晔,黄上腾.基于支持向量机的文本兼类标注[J].计算机工程与应用,2006,42(2):182-185. 被引量：10
3Vapnik V. The Nature of Statistical I.earning Theory [M]. New York:Springer, 1995.
4Joachims T. Text Categorization with Support Vector Ma- chines:Learning with Many Relevant Feature [ A] // Procee- dings of ECML-98, 10th European Conference on Machine Learning[C]. Berlin Springer, 1998 .. 137-142.
5Bennett K P. Combining Support Vector and Mathematical Pro- gramming Methods for Classification[A]//Advances in Kernel MethodsSupport Vector Learning[C]. Cambridge, MA: MIT press, 1999 307-326.
6Krebel U G. Pairwise Classification and Support Vector Ma- chines [A] ff Advances in Kernel Methods: Support Vector Learning[C]. Cambridge, MA: MIT press, 1999 : 255-268.
7Platt J C, Cristianini N, Shawe-Taylor J. Large Margin DAGs for multielass elassifieation[A] ff Advances in Neural Informa- tion Processing Systems[C]. Cambridge, MA: MIT Press, 2000 547-553.
8Wei X K, Huang G ]3. Mahalanobis Eillpsoidal Learning Ma- chine for One Class Classifieatian[C] ff International Conference on Machine Learning and Cybernetics. 2007 3528-3533.
9秦玉平,王秀坤,李祥纳,王春立.基于超球支持向量机的兼类文本分类算法研究[J].计算机工程与应用,2008,44(19):166-168. 被引量：2
10李建民,李永新,薛贞霞.基于马氏椭球学习机的监督野点探测[J].计算机工程与应用,2009,45(13):200-202. 被引量：3

引证文献1

1秦玉平,王祎,伦淑娴,王秀坤.基于超椭球支持向量机的兼类文本分类算法[J].计算机科学,2013,40(11A):98-100. 被引量：4

二级引证文献4

1田浩兵,朱嘉钢,陆晓.基于特征贡献度加权高斯核函数的粗糙one-class支持向量机[J].计算机科学,2015,42(6):239-242. 被引量：2
2李中胜,刘林.一种改进高斯核度量的HEC算法在变压器故障诊断中的应用[J].广东电力,2016,29(12):104-109. 被引量：4
3黄细凤.基于聚类的文本分类算法框架研究[J].计算机与数字工程,2021,49(1):21-25.
4潘袁湘,黄林,牛新征.融合语义增强的中文短文本分类方法研究[J].计算机与数字工程,2022,50(3):586-590.

1丛瑞雪,崔丽鸿.应用模糊支持向量机进行英文情感分类[J].数学的实践与认识,2016,46(1):197-201. 被引量：3
2李斌.隶属度确定对模糊控制系统稳定性影响的研究[J].长江科学院院报,2009,26(8):88-91. 被引量：2
3张秋余,竭洋,李凯.模糊支持向量机中隶属度确定的新方法[J].兰州理工大学学报,2009,35(4):89-93. 被引量：21
4王俊卿,黄莎白,史泽林,于海斌.基于模糊测度的目标匹配算法[J].红外与激光工程,2005,34(2):212-215. 被引量：2
5程志伟.试论基于模糊聚类算法的资源整合[J].电脑知识与技术,2012,8(11X):8006-8009.
6王亚萍,李便霞.试论基于模糊聚类算法的资源整合[J].科技致富向导,2012(35):142-142.
7石澄贤,吴建成,赵志新,费忠华.集成模糊特征的Snakes模型分割图像纹理[J].光电工程,2009,36(6):86-90.
8史伟,王洪伟,何绍义.模糊本体结构及基于NGD的隶属度确定[J].同济大学学报（自然科学版）,2012,40(11):1715-1719. 被引量：1
9张刚,马宗民,邓立国,蔡志平.基于内容图像检索中针对显著方向的有向滤波器[J].东北大学学报（自然科学版）,2007,28(7):978-981. 被引量：1
10徐袭,许国荣,张虎.基于FCM与粗糙集的连续数据知识挖掘方法[J].海军工程大学学报,2006,18(1):103-107. 被引量：6

计算机科学

2011年第11期

浏览历史

内容加载中请稍等...

一种新的兼类文本分类方法被引量：1

参考文献12

二级参考文献37

共引文献50

同被引文献11

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种新的兼类文本分类方法 被引量：1

参考文献12

二级参考文献37

共引文献50

同被引文献11

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种新的兼类文本分类方法被引量：1