垃圾短信的智能识别和实时处理被引量：7

Intellectual Recognition and Real-time Processing of the Junk Short Message

下载PDF

导出

摘要本文提出了短信语义和号码特征相结合的垃圾信息智能识别方法。在分类器的设计上,采用了BP神经网络与支撑矢量机(SVM)的分类集成技术,使得分类识别效果明显。垃圾短信的学习样本识别正确率达99.86%,测试样本识别正确率达到97.4%。由于本文方法提取的特征构成了稀疏矩阵,因此大大缩短了机器学习时间,使得系统具有实时学习和实时提高分类能力的功能。 In this paper, an intellectual recognition method with the features of the number combined with short message＇s semantic is taken out. Considering the design of collecting classifier, both the BP neural network and the support vector machine （for short SVM） are adopted. Therefore the effect of classifying and recognizing is obvious. Correct rate reaches 99.86% as for learning samples and is up to 97.4% as for testing samples, Based on the features forming sparse-matrix, learning time is shorter and the function of real-tlme learning and improving the classifying ability is held.

作者何蔓微袁锐刘建胜王贵新

机构地区中国移动通信集团重庆有限公司数据维护中心重庆大为软件公司

出处《电信科学》北大核心 2008年第8期61-64,共4页 Telecommunications Science

关键词垃圾短信 BP神经网络 SVM 机器学习 junk short message, BP neural network, SVM, machine learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1许建宏,李慧.移动短信业务发展中存在的问题及解决方案探讨[J].邮电设计技术,2004(6):25-29. 被引量：6
2张燕,傅建明.垃圾短信的识别与追踪研究[J].计算机应用研究,2006,23(3):245-247. 被引量：21
3Sebastiani F. Machine learning in automated text categorization. ACM Computing Surveys, 2002,34(1).
4Bigi B. Using Kullback-1eibler distance for text categorization. In: Proc of the 25th European Conf on Information Retrieval (ECIR-03), Pisa, Springer-Verlag, 2003.
5Li F, Yang Y. A loss function analysis for classification methods in text categorization. In: Proc of the ICML 2003, Washington, USA,2003.
6http://www.nlplab.com/chinese/source.htm
7加卢什金[俄].神经网络理论.北京:清华大学出版社,2002.
8Lanckriet G, Cristianini N, Bartlett P, et al. Learning the kernel matrix with semidefinte programming. J Mach Learn Res, 2004(5).
9Amari S, Wu S. Improving support vector machine classifiers by modifying kernel functions. Neural Networks, 1999, 12(6).
10Smits G, Jordan E. Improved SVM regression using mixtures Of kernels .In : IJCNN, Honolulu,USA, 2002.

二级参考文献4

1许建宏,李慧.移动短信业务发展中存在的问题及解决方案探讨[J].邮电设计技术,2004(6):25-29. 被引量：6
2濮青.基于网络拒绝服务攻击的技术分析与安全策略[J].计算机应用研究,2003,20(3):71-75. 被引量：16
3李厂.浅谈短信服务的实现技术[J].电力系统通信,2003,24(8):25-26. 被引量：6
4刘洋.关注暗潮涌动的短信“泛滥”[J].电信建设,2003(3):48-50. 被引量：1

共引文献26

1黄健刚.基于J2ME的手机垃圾短信过滤器的研究[J].魅力中国,2009(26):169-170.
2沈超,黄卫东.数据挖掘在垃圾短信过滤中的应用[J].电子科技大学学报,2009,38(S1):21-24. 被引量：6
3赵琼,王玮,张梦.垃圾短信规制的法律探究[J].法制与社会,2008(13):89-90. 被引量：1
4王立群.五言唐诗刻铜墨盒赏析[J].收藏界,2005(11):77-78.
5张燕,傅建明.垃圾短信的识别与追踪研究[J].计算机应用研究,2006,23(3):245-247. 被引量：21
6刘建奇,陈寅生,王以刚.客户端举报、运营商管理的垃圾短信治理[J].信息安全与通信保密,2006,28(11):142-144. 被引量：1
7张海雷,曹菲菲,陈文亮,任飞亮,王会珍,朱靖波.基于多层次特征集成的中文实体指代识别[J].中文信息学报,2007,21(5):126-130. 被引量：1
8黎路,秦卫平.浅析贝叶斯分类方法在手机垃圾短信过滤系统中的应用[J].科技广场,2007(7):96-98. 被引量：3
9范晶,刘菊新,陈峰,徐从富.基于Hash函数和贝叶斯方法的垃圾短信在线过滤系统[J].计算机应用,2008,28(4):1084-1086. 被引量：7
10黄文良,陈纯,罗云彬.一种高效垃圾短信过滤系统的实现[J].电信科学,2008,24(5):61-67. 被引量：5

同被引文献35

1费洪晓,戴宏伟,肖新华.Snort中BM模式匹配算法的研究与改进[J].计算机系统应用,2007,16(8):113-116. 被引量：6
2何效金.垃圾短信过滤系统的设计与实现[D].成都:电子科技大学,2009.
3万晓枫,惠孛.基于贝叶斯分类法的智能垃圾短信过滤系统[J].实验科学与技术,2013,11(5):44-47,76.
4Schmidhuber J. Deep learning in neural networks:an over- view [ J]. Neural Networks,2015,61 ( 1 ) :85 - 117.
5Bengio, Ducharme R, Vincent P, et al. A neural probabilistic language model [ J ]. Journal of Machine Learning Research, 2003(3) :1137 - 1155.
6Mikolov T, Chen K, Corrado G, et al. Efficient estimation of word representations in vector space [ C]. Scottsdale, Arizo- na : ICLR Workshop ,2013.
7Hinton G E, Osindero S, The Y W. A fast learning algorithm for deep belief nets [ J ]. Neural Computation, 2006 ( 18 ) : 1527 - 1554.
8Tieleman. Training restricted bohzmann machines using ap- preximations to the likelihood gradient [ C]. Helsinki, Fin- land : ICML, 2008.
9Kazuhiro Shin - ike. A two phase method for determining the number of neurons in the hidden layer of a 3 - Layer neural network [ C ]. Taipei, Taiwan: SICE Annual Conference,2010.
10LE Q V.Building high-level features using large scale unsupervised learning[C]//Proceedings of 2013 IEEE International Conference on Acoustics,Speech and Signal Processing.Vancouver:IEEE,2013:8595-8598.

引证文献7

1齐晓莉.垃圾彩信监控系统建设探讨[J].电信工程技术与标准化,2011,24(5):47-51.
2秦建,孙秀锋,吴春明.“垃圾短信”监控的中文多模式模糊匹配算法[J].西南大学学报（自然科学版）,2013,35(3):168-172. 被引量：4
3王贵新,彭娟,郑孝宗.垃圾短信过滤系统的构建[J].科学咨询,2016(1):61-62.
4王贵新,彭娟,郑孝宗.垃圾短信过滤系统的构建[J].电子技术与软件工程,2016(4):51-51.
5王贵新,郑孝宗,张浩然,张小川.基于Word2vec的短信向量化算法[J].电子科技,2016,29(4):49-52. 被引量：4
6王贵新,郑孝宗,张浩然,张小川.利用深度置信网络的中文短信分类[J].现代电子技术,2016,39(9):37-40. 被引量：3
7汪健,吴鹏,雷刚.基于改进的BP神经网络短信分类算法研究[J].装备制造与教育,2022,36(2):66-68.

二级引证文献11

1刘小敏,王昊,李心蕾,邓三鸿.不同特征粒度在微博短文本分类中作用的比较研究[J].情报科学,2018,36(12):126-133. 被引量：10
2王贵新,郑孝宗,张浩然,张小川.利用深度置信网络的中文短信分类[J].现代电子技术,2016,39(9):37-40. 被引量：3
3叶志雄,朱丽芳,刘钢庭,李启文,王丹弘.基于Hadoop平台的内容相似度与PageRank的垃圾短信识别融合模型[J].广东通信技术,2016,36(9):5-9.
4巫喜红.改进的KR模式匹配算法的研究与实现[J].西南师范大学学报（自然科学版）,2016,41(10):124-129. 被引量：1
5刘方园,王水花,张煜东.深度置信网络模型及应用研究综述[J].计算机工程与应用,2018,54(1):11-18. 被引量：53
6王睿,赵勇.基于Dubbo框架的短信平台的开发与设计[J].电子设计工程,2018,26(18):118-122. 被引量：1
7王玮.基于VAE-DBN双模型的智能文本分类方法[J].计算机与现代化,2018,0(12):77-84. 被引量：5
8许凯波,罗广祥,孙震辉.基于深度信念网络的乳腺肿瘤辅助诊断研究[J].计算机与数字工程,2019,47(3):582-586. 被引量：3
9姜猛,王子牛,高建瓴.基于异构数据联合训练的中文分词法[J].电子科技,2019,32(4):29-32. 被引量：6
10卢佳伟,陈玮,尹钟.融合TextRank算法的中文短文本相似度计算[J].电子科技,2020,33(10):51-56. 被引量：5

1雷蕾,陆新泉.P2P环境下基于小世界特性的信任机制[J].情报杂志,2009,28(B12):66-69.
2李明,贾波.基于神经网络的P2P流量识别方法[J].杭州电子科技大学学报（自然科学版）,2011,31(4):152-156. 被引量：1
3邢立宁,陈英武,刘荷君.基于多规则实时学习神经网络的时间序列预测模型[J].计算机工程,2006,32(12):199-201. 被引量：1
4郭丙炎,常明,朱林,周济.工程图形扫描输入后的智能识别方法[J].中国机械工程,1992,3(6):5-7. 被引量：9
5尚钢,张翔,饶文碧,钟珞.结构损伤智能识别方法[J].武汉理工大学学报,2003,25(11):83-85. 被引量：4
6张琪,吴亚锋,徐建.主成分分析与遗传神经网络在制冷系统故障诊断中的应用[J].计算机测量与控制,2016,24(9):23-27. 被引量：8
7廖飒,黄光明.基于GA-BP算法的模糊神经网络控制器研究[J].科学技术与工程,2008,8(15):4126-4128. 被引量：2
8田大新,刘衍珩,魏达.ARTNIDS:基于自适应谐振理论的网络入侵检测系统[J].计算机学报,2005,28(11):1882-1889. 被引量：8
9胡东滨,曾钊伟,陈晓红,丁军.基于本体的决策问题智能分析方法及其应用[J].运筹与管理,2016,25(1):93-99.
10张磊.利用统计特征结合神经网络的P2P流量识别方法[J].计算机安全,2010(5):48-50. 被引量：4

电信科学

2008年第8期

浏览历史

内容加载中请稍等...

垃圾短信的智能识别和实时处理被引量：7

参考文献11

二级参考文献4

共引文献26

同被引文献35

引证文献7

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

垃圾短信的智能识别和实时处理 被引量：7

参考文献11

二级参考文献4

共引文献26

同被引文献35

引证文献7

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

垃圾短信的智能识别和实时处理被引量：7