基于数据融合的组合特征提取方法的研究被引量：1

Research on combination feature selection method based on data fusion

下载PDF

导出

摘要针对Web文本的特征提取方法多种多样,但均存在各自的不足且对数据集偏斜问题普遍没有很好的解决能力,针对该问题采用BNS特征提取算法和Odds特征提取算法基于数据融合思想进行Web文本特征提取并用支持向量机进行分类。在保持BNS算法对于数据集偏斜问题的解决能力的基础上用Odds算法提高BNS算法的精确度。实验结果表明,用数据融合思想将这两种方法结合可以有效弥补两种方法各自的不足,并能提高分类准确率。 There are a lot of methods to select features of Web text, but they all have their own disadvantages, to solve this problem, the features of web text are selected by BNS metrics and Odds metrics based on data fusion and are classified by support vector machines. We can let Odds metrics improve the precision of BNS metrics based on keeping BNS metrics＇s capability of resolving class skew. The experimental results indicate that combining these based on data fusion can greatly improve disadvantages of each method and improve the precision of text classify.

作者谈佳宁朱玉全陈耿翟国

机构地区江苏大学计算机科学与通信工程学院

出处《计算机工程与设计》 CSCD 北大核心 2009年第10期2529-2532,共4页 Computer Engineering and Design

关键词特征提取数据集偏斜数据融合支持向量机 WEB文本分类 feature selection class skew data fusion support vector machines web text classification

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Forman G.An extensive empirical study of feature selection mettics for text classification[J].Joumal of Machine Learning Research,2003,3(1):1533-7928.
2苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：383
3庞景安.Web文本特征提取方法的研究与发展[J].情报理论与实践,2006,29(3):338-340. 被引量：17
4Lawrence A Klein.多传感器数据融合理论及应用[M].戴亚平,刘征,郁光辉,译.北京理工大学出版社,2004.
5谷立臣,张优云.基于神经元的多传感器数据级融合研究[J].机械工程学报,2003,39(7):89-93. 被引量：10
6Tom M Mitchell.机器学习[M].曾华军,张银奎,译.北京:机械工业出版社,2007.
7李战明,陈若珠,张保梅.同类多传感器自适应加权估计的数据级融合算法研究[J].兰州理工大学学报,2006,32(4):78-82. 被引量：32

二级参考文献18

1赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
2于津凯,王映雪,陈怀楚.一种基于N-Gram改进的文本特征提取算法[J].图书情报工作,2004,48(8):48-50. 被引量：17
3王建会,王洪伟,申展,胡运发.一种实用高效的文本分类算法[J].计算机研究与发展,2005,42(1):85-93. 被引量：20
4李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
5刘明吉.基于协同演化的文本特征获取算法[J].计算机工程,2005,31(4):85-87. 被引量：3
6唐晓文.基于本体论的文本特征提取[J].电脑与信息技术,2005,13(1):36-38. 被引量：11
7张鹏飞,李赟,刘建毅,钟义信.基于相对词频的文本特征抽取方法[J].计算机应用研究,2005,22(4):23-26. 被引量：9
8孙皓莹,蒋静坪.基于参数估计的多传感器数据融合[J].传感器技术,1995,14(6):32-36. 被引量：34
9翟翌立.基于总均方误差最小条件下的多传感器最优数据融合算法.吉林工学院学报,1996,17(7):82-84.
10Martinerie F. Data fusion and tracking using hmms in a distributed sensor network. IEEE Transactions on Aerospace and Electronic Systems, 1997, 33(1): 11 -28.

共引文献437

1李林,刁磊,唐詹,柏召,周晗,郭旭超.基于BERT_Stacked LSTM的农业病虫害问句分类方法[J].农业机械学报,2021,52(S01):172-177. 被引量：5
2姚学恒,张萍,闫立伟,操诚.基于机器学习的企业秘密文档自动分类方法[J].产业与科技论坛,2020,19(7):44-45.
3杨波,王再明,段凤春.风机远程监测及故障诊断系统的设计与实现[J].黄石理工学院学报,2007,23(2):16-19. 被引量：2
4谷立臣,段志善.信息融合在轧机测试与故障诊断中的应用[J].振动工程学报,2004,17(z1):317-319.
5张小艳,李强.基于SVM的分类方法综述[J].科技信息,2008(28):344-345. 被引量：23
6王辉,左万利,袁华.一种基于质心与本体的文本分类方法[J].计算机研究与发展,2007,44(z2):6-11. 被引量：3
7徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
8袁志坚,贾焰.基于误差反馈的高速Web文本流快速近似分类[J].计算机研究与发展,2007,44(z3):13-17.
9贾志洋,高炜,王勇刚.结合信息检索技术的半监督文本分类方法[J].苏州大学学报（自然科学版）,2012,28(1):34-39. 被引量：1
10陈思,钱铭宇,刘昌明.文本分类技术研究进展[J].电脑编程技巧与维护,2009(S1):22-24.

同被引文献5

1姚宝成,韩学东.基于信息熵的D-S证据理论及其在传感器融合中的应用[J].计算机工程与设计,2007,28(11):2711-2713. 被引量：7
2李冬,梁山.基于加速度传感器的老年人跌倒检测装置设计[J].传感器与微系统,2008,27(9):85-88. 被引量：43
3石欣,熊庆宇,雷璐宁.基于压力传感器的跌倒检测系统研究[J].仪器仪表学报,2010,31(3):715-720. 被引量：54
4张辉宜,沈晖,陶永.嵌入式数据融合系统的设计与实现[J].计算机工程与应用,2011,47(2):65-67. 被引量：3
5霍宏伟,张宏科,Youzhi XU.基于室内无线传感器网络射频信号的老年人跌倒检测研究[J].电子学报,2011,39(1):195-200. 被引量：24

引证文献1

1任子良,李勇.基于二次判断的无线多传感器跌倒监测系统[J].计算机工程与设计,2012,33(5):1785-1789. 被引量：1

二级引证文献1

1万航,陈立潮,潘理虎,谢斌红,张英俊.基于智能视频监控的老人跌倒识别算法研究[J].太原科技大学学报,2013,34(4):245-249. 被引量：5

1庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2):123-128. 被引量：33
2吕益民,王恒,葛振宇,沈坚,戴澜.大数据技术在目标行为分析中的应用[J].电子世界,2016,0(12):169-170.
3李建林.一种基于PCA的组合特征提取文本分类方法[J].计算机应用研究,2013,30(8):2398-2401. 被引量：24
4李艳玲,戴冠中,余梅.基于反馈信息的特征权重调整方法[J].计算机工程,2009,35(2):206-207. 被引量：3
5刁显峰.浅论高职院校的C语言教学[J].网友世界,2013(22):108-108.
6李启青,程承旗,郭仕德,何华伟.面向遥感图像BNs分类的预处理技术及算法实现[J].计算机工程,2006,32(16):271-273. 被引量：1
7艾玲梅,郭春.基于组合特征提取与多级SVM的轮胎花纹识别[J].计算机工程与应用,2013,49(20):179-182. 被引量：10
8肖媛娥,康永平,贺卫东,谭云兰.网络监听技术在计算机网络实验中的实现[J].煤炭技术,2011,30(2):195-196. 被引量：6
9何奇.3G时代电子政务对解决公共信息不对称的作用——基于委托代理视角的分析[J].广西职业技术学院学报,2009,2(4):22-23.
10伍忠东,王飞.基于PCA-GA-DBNs的人脸识别算法研究[J].西北师范大学学报（自然科学版）,2016,52(3):43-48. 被引量：2

计算机工程与设计

2009年第10期

浏览历史

内容加载中请稍等...

基于数据融合的组合特征提取方法的研究被引量：1

参考文献7

二级参考文献18

共引文献437

同被引文献5

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于数据融合的组合特征提取方法的研究 被引量：1

参考文献7

二级参考文献18

共引文献437

同被引文献5

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于数据融合的组合特征提取方法的研究被引量：1