基于神经网络与贝叶斯的混合文本分类研究
被引量:3
Research of Hybrid Text Classifier Based on BP Neural Network and Nave Bayesian Approach
摘要
采用向量空间模型(VSM)描述文本,利用隐性语义索引(LSI)技术进行特征重构与降维,构造了BP神经网络文本分类器。将朴素贝叶斯分类技术与前者结合构造了一种混合文本分类器。实验结果表明混合分类器分类准确度和分类速度得到提高。
出处
《情报杂志》
CSSCI
北大核心
2007年第5期34-36,共3页
Journal of Intelligence
参考文献8
-
1李晓黎,刘继敏,史忠植.概念推理网及其在文本分类中的应用[J].计算机研究与发展,2000,37(9):1032-1038. 被引量:57
-
2T Joachims.Text Categorization with Support Vector Machines:Learning with Many Relevant Features.PECML1998,Springer.
-
3韩家新,何华灿.SVMDT分类器及其在文本分类中的应用研究[J].计算机应用研究,2004,21(1):23-24. 被引量:15
-
4Salton G,McGill MJ.Introduction to Modern Information Retrieval.New York:McGraw-Hill,1983.
-
5Dumais S T,Furnas G W,Landauer T K,et al.Using Latent Semantic Analysis to Improve Information Retrieval.In:ACM.Proceedings of CHI′88:Conference on Human Factors in Computing.New York:ACM,1988.
-
6刘贵龙,王慧玲,宋柔.矩阵的奇异值分解在文本分类研究中的应用[J].计算机工程,2002,28(12):17-18. 被引量:14
-
7Hechi Nielsen R.Theory of the Back Propagation Neural Network.Proceeding of IJCNN,1989;1(1).
-
8Mc Callum A,et al.A Comparison of Event Models for Naive Bayes Text Classification.AAAI-98 Workshop on Learning for Text Categorization,Madison,Wisconsim:AAAI Press,1998.
二级参考文献7
-
1[1]Berry M W,Dumais S T.Using Linear Algebra for Intelligent Information Retrieval. SIAM Review, 1995,37(4):573 -595
-
2史忠植,高级人工智能,1998年,206页
-
3陆汝钤,人工智能,1996年
-
4Lang K,Int’ l Conf on Machine Learning ( ICML ),1995年,331页
-
5Yang Y,Proc of the Seven-teenth Int’ l ACM SIGIR Conf on Research and Development in I,1994年,13页
-
6石纯一,人工智能原理,1993年
-
7李晓黎,刘继敏,史忠植.概念推理网及其在文本分类中的应用[J].计算机研究与发展,2000,37(9):1032-1038. 被引量:57
共引文献80
-
1张莉.网页自动分类技术概念分析[J].娄底职业技术学院学报(职教与经济研究),2007(2):58-62.
-
2朱丽红,赵燕平.Web挖掘研究综述[J].情报杂志,2004,23(7):2-5. 被引量:16
-
3李莹,张晓辉,王华勇,常桂然.一种应用向量聚合技术的KNN中文文本分类方法[J].小型微型计算机系统,2004,25(6):993-996. 被引量:13
-
4杨创新,彭宏,杨沛.一种基于主题树模型的Web主题检索算法[J].计算机工程与应用,2004,40(16):184-187.
-
5杨创新.一种基于主题的Web预取算法研究[J].机电工程技术,2004,33(6):35-36.
-
6许增福,梁静国,田晓宇.基于FVSM和自组织映射网络的Web文本自动分类方法[J].哈尔滨工业大学学报,2004,36(9):1168-1172. 被引量:2
-
7张莉,康耀红,王曙光,张春元.中文网页自动分类现状的研究[J].福建电脑,2004,20(5):3-4. 被引量:1
-
8张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量:1
-
9杨创新,彭宏,莫卓斌.基于N层向量空间模型的Web主题检索算法[J].广东自动化与信息工程,2004,25(3):7-9.
-
10徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量:56
同被引文献34
-
1叶菲,罗景青,俞志富.一种改进的并行处理SVM学习算法[J].微电子学与计算机,2009,26(2):40-43. 被引量:6
-
2屈军,林旭.文本分类中特征提取方法的比较与分析[J].现代计算机,2007,13(4):10-13. 被引量:8
-
3刘幺和,陈睿,彭伟,周蕾.一种BP神经网络学习率的优化设计[J].湖北工业大学学报,2007,22(3):1-3. 被引量:14
-
4白莉媛,黄晖,刘素华,阎秋玲.基于自助平均的朴素贝叶斯文本分类器[J].计算机工程,2007,33(15):190-192. 被引量:5
-
5McCaUum A, Nigam K. A comparison of event models for naive bayes text classification. AAAI-98 Workshop on Learning for Text Categorization. Madison, Wisconsim(32).
-
6Joachims T. Text categorization with support vector machines: Learning with many relevant features. European Conference on Machine Learning (ECML). Chemnitz, Germany. 1998. 137-142.
-
7Ruiz ME, Srinivasan E Hierarchical neural networks for text categorization. Pro. of SIGIR-99, 22nd ACM International Information Retrieval. 1999(32). 281-282.
-
8Guo GD, Wang H, Bell D, Bi YX, Greer KR. An kNN Model-based Approach and Its Application in Text Categorization. CICLing 2004, LNCS 2945, 2004. 559--570.
-
9Debole F, Scbastiani E An analysis of the relative hardness of recuters-21578 subsets. Journal of the American Society for Information Science and Technology,2004,56(6): 584--596.
-
10Bengio Y. Learning deep architectures for A/. Foundations and Trends in Machine I_emag, 2009, 2(1): 1-127.
引证文献3
-
1夏火松,刘建.基于VSM的文本分类挖掘算法综述[J].情报探索,2010(9):18-21. 被引量:4
-
2陈翠平.基于深度信念网络的文本分类算法[J].计算机系统应用,2015,24(2):121-126. 被引量:42
-
3田欢,李红莲,吕学强,周建设,夏红科.基于改进BP神经网络的学术活动文本分类[J].北京信息科技大学学报(自然科学版),2018,33(5):38-44. 被引量:5
二级引证文献51
-
1曾静静,李翔,林祥.基于Map-Reduce构建高效文本聚类系统[J].信息安全与通信保密,2011,9(5):98-100.
-
2刘亚明,马力,舒惠.基于后缀树的文本聚类算法[J].西安邮电学院学报,2012,17(1):62-66. 被引量:4
-
3石国庆,刘守仁,杨永林,倪健宏,皮文辉,王志杰.毛质优秀的美利奴“U”系羊新类群[J].中国草食动物,2000,2(1):24-25.
-
4刘峰,李煜,吕学强,李卓.查询主题分类方法研究[J].现代图书情报技术,2015(4):10-17. 被引量:4
-
5冯长敏,张炳江.基于BP神经网络的分段函数连续优化处理[J].北京信息科技大学学报(自然科学版),2019,34(1):18-22. 被引量:5
-
6董芷艺,谢章伟,崔展齐.基于开发者模型的问题修复者推荐方法[J].北京信息科技大学学报(自然科学版),2019,34(3):64-67.
-
7高强,阳武,李倩.基于稀疏差异深度信念网络的绝缘子故障识别算法[J].电测与仪表,2016,53(1):19-25. 被引量:11
-
8高俊平,张晖,赵旭剑,杨春明,李波.基于特征词的Web领域知识分类研究[J].软件导刊,2016,15(2):9-11.
-
9刘广秀,宋单单.基于Adaboost框架下自动编码器提升方法的文本分类[J].电子世界,2016,0(11):195-195. 被引量:1
-
10周晓莉,张丰,杜震洪,曹敏杰,刘仁义.基于CRBM算法的时间序列预测模型研究[J].浙江大学学报(理学版),2016,43(4):442-451. 被引量:9
-
1陈世立,高野军.基于神经网络与贝叶斯的混合文本分类研究[J].电脑开发与应用,2006,19(12):27-29.
-
2徐戈,王厚峰.自然语言处理中主题模型的发展[J].计算机学报,2011,34(8):1423-1436. 被引量:231
-
3袁径三.使文本文件变为EXE文件的一个方法[J].科技通报,1997,13(5):308-311.
-
4薄文彦,付文兰,张凤英.聚类算法的改进的研究[J].网络安全技术与应用,2011(6):23-25.
-
5王永贵,林琳,刘宪国.结合双粒子群和K-means的混合文本聚类算法[J].计算机应用研究,2014,31(2):364-368. 被引量:16
-
6包学超,孙强,李生红.隐性语义的SVM文本分类模型[J].信息安全与通信保密,2005,27(5):29-31. 被引量:5
-
7陈彦明,杨鸿雁.用VB实现向数据库中添加图片与文字混合文本的一种方法[J].鞍山师范学院学报,2004,6(4):65-66.
-
8高伟,肖攸安,刘冬生.基于VB6.0的多语音合成系统的实现[J].武汉理工大学学报(信息与管理工程版),2008,30(6):869-872. 被引量:1
-
9陈根方,詹国华.两文本动态匹配算法的改进及应用[J].杭州教育学院学报,1999,3(6):38-40.
-
10王震,李仁发,李彦彪,田峥.一种并行中英文混合多模式匹配算法[J].计算机工程,2014,40(4):318-320.