期刊文献+

基于Word2vec的短信向量化算法 被引量:4

An Algorithm for Vectoring SMS Based on Word2vec
下载PDF
导出
摘要 针对目前垃圾短信过滤效果有待提高的问题,提出一种新的短信特征提取方法。该方法采用了建立在深度学习理论基础上的最新成果和Word2vec工具。基于中文短信的内容和结构特点,利用该工具设计了一个短信向量化算法。该算法能有效地将每条短信与一个向量对应,在深度置信网络上利用该算法对垃圾短信进行分类实验。实验结果表明,推广性能比已有报道结果提高了约5%。 This paper proposes a new method of feature extraction of SMS for better spam message filtering.The method uses the latest results and tools of Word2 vec based on deep learning theory. With the content and structure characteristics of Chinese short messages in mind,an algorithm of Vectoring SMS is designed based on this tool.The algorithm can effectively match each text message with a vector. The classification's experiments on the spam messages are carried out using the proposed algorithm on the deep belief networks. The results show that the performance of the proposed algorithm is improved by 5% compared with the previously reported results.
出处 《电子科技》 2016年第4期49-52,共4页 Electronic Science and Technology
基金 国家自然科学基金资助项目(60443004) 校内科研基金资助项目(2014xcxtd05 2014xzky05)
关键词 深度置信网络 深度学习 短信 向量化 deep belief nets deep learning short messages vectoring
  • 相关文献

参考文献13

  • 1何蔓微,袁锐,刘建胜,王贵新.垃圾短信的智能识别和实时处理[J].电信科学,2008,24(8):61-64. 被引量:7
  • 2张永军,刘金岭.基于特征词的垃圾短信分类器模型[J].计算机应用,2013,33(5):1334-1337. 被引量:11
  • 3李慧,叶鸿,潘学瑞,段震,张燕平.基于SVM的垃圾短信过滤系统[J].计算机安全,2012(6):34-38. 被引量:13
  • 4万晓枫,惠孛.基于贝叶斯分类法的智能垃圾短信过滤系统[J].实验科学与技术,2013,11(5):44-47,76.
  • 5胡龙茂.中文文本分类技术比较研究[J].安庆师范学院学报(自然科学版),2015,21(2):49-53. 被引量:3
  • 6Schmidhuber J. Deep learning in neural networks:an over- view [ J]. Neural Networks,2015,61 ( 1 ) :85 - 117.
  • 7Bengio, Ducharme R, Vincent P, et al. A neural probabilistic language model [ J ]. Journal of Machine Learning Research, 2003(3) :1137 - 1155.
  • 8Mikolov T, Chen K, Corrado G, et al. Efficient estimation of word representations in vector space [ C]. Scottsdale, Arizo- na : ICLR Workshop ,2013.
  • 9Hinton G E, Osindero S, The Y W. A fast learning algorithm for deep belief nets [ J ]. Neural Computation, 2006 ( 18 ) : 1527 - 1554.
  • 10Tieleman. Training restricted bohzmann machines using ap- preximations to the likelihood gradient [ C]. Helsinki, Fin- land : ICML, 2008.

二级参考文献101

共引文献101

同被引文献28

引证文献4

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部