基于SVM技术的文本分类研究被引量：2

Research of Text Classification Base on SVM Technology

下载PDF

导出

摘要 SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应用。 SVM takes structural error theory, condition quadratic optimization theory and kernel space theory foundation, so it can preferably solve machine learning problems such as model selection, excessive learning, non-linear problem, the cruse of dimensionality and so on. SVM is quite suitable to be used in the field of text classification.In this paper, the advantages and new problems of SVM in text classification are discussed and an improved active learning method is proposed. It makes small-scale labeled training set get good classification effect and quite suitable to be used in those fields facing difficulty of labeling large-scale training set or costing a lot to do so.

作者祝磊

机构地区湖北工业大学计算机学院

出处《软件导刊》 2006年第12期26-28,共3页 Software Guide

关键词文本分类 SVM技术支持向量主动学习 text classification support vector active learningn

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1庄东,陈英.基于加权近似支持向量机的文本分类[J].清华大学学报（自然科学版）,2005,45(S1):1787-1790. 被引量：16
2张健沛,徐华.支持向量机(SVM)主动学习方法研究与应用[J].计算机应用,2004,24(1):1-3. 被引量：51
3萧嵘,王继成,孙正兴,张福炎.一种SVM增量学习算法α-ISVM[J].软件学报,2001,12(12):1818-1824. 被引量：85

二级参考文献4

1VAPNIKVN 张学工译.统计学习理论的本质[M].清华大学出版社,2000..
2Christopher J.C. Burges. A Tutorial on Support Vector Machines for Pattern Recognition[J] 1998,Data Mining and Knowledge Discovery(2):121～167
3谭立球,谷士文,费耀平.个人化电子邮件自动过滤系统的设计[J].计算机应用,2002,22(6):54-55. 被引量：17
4侯风雷,王炳锡.基于说话人聚类和支持向量机的说话人确认研究[J].计算机应用,2002,22(10):33-35. 被引量：11

共引文献146

1吴静,刘衍珩,孟凡雪.入侵检测中的多分类SVM增量学习算法[J].北京工业大学学报,2009,35(12):1697-1702. 被引量：3
2杨迎春.能想多远,就能走多远——上海利策投资管理公司总经理查大兵谈用人标准[J].成才与就业,2005(21):31-32.
3桂卫华,李勇刚,阳春华,陈志盛.基于改进聚类算法的分布式SVM及其应用[J].控制与决策,2004,19(8):852-856. 被引量：13
4孙正兴,彭彬彬,丛兰兰,孙建勇,张斌.在线草图识别中的用户适应性研究[J].计算机辅助设计与图形学学报,2004,16(9):1207-1215. 被引量：10
5张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量：1
6张斌,孙正兴,孙建勇,彭彬彬.在线草图识别中用户手绘习惯建模方法[J].计算机科学,2004,31(6):194-198. 被引量：5
7代六玲,黄河燕,陈肇雄.一种用于文本分类的语义SVM及其在线学习算法[J].计算机工程与应用,2004,40(36):11-14. 被引量：2
8曹建芳,郑家恒.基于SVM的汉语动词短语识别[J].咸阳师范学院学报,2004,19(6):32-34. 被引量：3
9曾嵘,刘建成,蒋新华.一种基于支持向量机的增量学习算法[J].铁道科学与工程学报,2005,2(1):94-96.
10史朝辉,王晓丹,杨建勋.一种SVM增量训练淘汰算法[J].计算机工程与应用,2005,41(23):187-189. 被引量：11

同被引文献17

1王蒙.话说《红楼梦》后四十回[J].红楼梦学刊,1991(2):21-44. 被引量：6
2陈大康.从数理语言学看后四十回的作者——与陈炳藻先生商榷[J].红楼梦学刊,1987(1):293-318. 被引量：54
3李贤平.《红楼梦》成书新说[J].复旦学报（社会科学版）,1987,29(5):3-16. 被引量：66
4王晓霞,尹四清.一种基于支持向量机的分类算法[J].山西电子技术,2007(3):17-18. 被引量：2
5VAPNIKV N. The nature of statistical learning theory[ M] . New York : Springer- Verlag , 1995.
6SergiosTheodoridi,KonstantinosKoutroumba.模式识别(第三版)[M].李晶皎,等,译.北京:电子工业出版社.2006:12.
7孙晓明,马少平.基于写作风格的作者识别中国中文信息学会第五届全国会员代表大会暨成立二十周年学术会议论文集[c].北京:清华大学出版社,2001,198—204.
8http://www.csie.ntu.edu.tw/-cjlin/libsvm/.
9李英.基于词性选择的文本预处理方法研究[J].情报科学,2009,27(5):717-719. 被引量：7
10韦博成.《红楼梦》前80回与后40回某些文风差异的统计分析(两个独立二项总体等价性检验的一个应用)[J].应用概率统计,2009(4):441-448. 被引量：19

引证文献2

1张凯,张明允.基于SVM的《红楼梦》写作风格研究[J].贵阳学院学报（自然科学版）,2011,6(1):55-57. 被引量：2
2王光慈,汪洋.基于FastText的短文本分类[J].电子设计工程,2020,28(3):98-101. 被引量：5

二级引证文献7

1吕英杰,范静,刘景方.基于文体学的中文UGC作者身份识别研究[J].现代图书情报技术,2013(9):48-53. 被引量：11
2施政.《红楼梦》研究中的统计方法综述[J].吉林省教育学院学报,2019,35(1):151-156. 被引量：3
3梁泽鹏,李直达.基于机器学习的舆情预警模型的设计与实现[J].广东公安科技,2020,28(3):1-5.
4张焱博,郭凯.基于Fasttext和多融合特征的文本分类模型[J].计算机仿真,2021,38(7):461-466. 被引量：6
5方博平,郭佳怡,陆欣怡,王梦怡,宋涛.基于文本挖掘技术的智慧政务舆情分析研究[J].科技风,2021(34):86-88. 被引量：1
6周末,宋玉蓉,宋波,苏晓萍.融合自注意力机制的D-BGRU文本分类模型[J].微电子学与计算机,2021,38(12):8-16. 被引量：5
7黄丽,胡丹妮,李普.银行客户交易场景智能分类[J].科技智囊,2023(4):70-76.

1赵颖,谌兰樱,张忠琼.基于SVM技术的入侵检测方式[J].电子技术与软件工程,2017(9):189-189.
2李昆仑,赵俊忠,黄厚宽,田盛丰.基于SVM技术的入侵检测[J].信息与控制,2003,32(6):495-499. 被引量：11
3殷淑娥,田伟,王建芳.Svm技术在电子商务售后评价情感倾向分析中的应用[J].湖北科技学院学报,2013,33(7):13-15.
4彭晓冰,李启顺,王丽珍,朱玉全.面向SVM的隐私保护方法研究进展[J].江苏大学学报（自然科学版）,2017,38(1):78-85. 被引量：3
5肖杰,李秀鹏,史会余,谢政廷.基于Kinect的跨平台人机交互系统的研究和实现[J].电脑编程技巧与维护,2016(2):20-20. 被引量：2
6董琴.SVM技术在网络GPC算法中的应用研究[J].自动化与仪表,2010,25(8):36-39.
7Qisheng Yan,Xiaofei Yan.Application of SVM in Feather and Down Category Recognition[J].通讯和计算机（中英文版）,2006,3(1):108-112. 被引量：5
8张召,业宁,业巧林.基于纹理提取和SVM技术的自动木材缺陷识别[J].计算机工程与应用,2009,45(23):219-223. 被引量：12
9宁朝.基于SVM技术的英文字符识别方法[J].大众科技,2005,7(8):160-161. 被引量：2
10尚月赟,马龙飞,叶登攀.基于熵特征融合的拷贝检测方法研究[J].计算机工程与应用,2012,48(16):80-84. 被引量：1

软件导刊

2006年第12期

浏览历史

内容加载中请稍等...

基于SVM技术的文本分类研究被引量：2

参考文献3

二级参考文献4

共引文献146

同被引文献17

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于SVM技术的文本分类研究 被引量：2

参考文献3

二级参考文献4

共引文献146

同被引文献17

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于SVM技术的文本分类研究被引量：2