基于Word2Vec的疫情虚假信息检测方法被引量：3

Word2Vec-based false information detection system of epidemic situation

下载PDF

导出

摘要在面临突发大型公共事件时虚假信息的广泛传播将具有极大的破坏性。虚假信息的传播将严重干扰疫情的救治工作,针对以往传统分类模型存在特征稀疏,准确率不高等问题。提出了一种基于Word2Vec的疫情虚假信息检测方法。该方法使用Word2Vec模型训练词向量,解决了传统向量空间模型的特征稀疏问题,再引入TFIDF对词向量进行加权,最终将处理过后的数据输入到SVM模型。通过在国内新闻平台爬取的数据集上的实验验证,该方法较之传统方法,对虚假信息的检测在准确率上有4%以上的提升。 The widespread dissemination of false information in the face of sudden large-scale public incidents will be extremely destructive.The dissemination of false information will seriously interfere with the treatment of the epidemic.In response of the problems of sparse features and low accuracy in traditional classification models in the past,this paper proposes a method for detecting false information about the epidemic based on Word2 Vec.This method uses the Word2 Vec model to train word vectors,then solves the feature sparse problem of the traditional vector space model,and introduces TFIDF to weight the word vectors,finally inputs the processed data into the SVM model.Through the experimental verification on the data set crawled by the domestic news platform,this method has more than 4%improvement in the accuracy of detecting false information compared with the traditional method.

作者齐浩翔马莉媛朱翌民 QI Haoxiang;MA Liyuan;ZHU Yimin(School of Electronic and Electrical Engineering,Shanghai University of Engineering Science,Shanghai 201620,China)

机构地区上海工程技术大学电子电气工程学院

出处《智能计算机与应用》 2021年第10期134-138,共5页 Intelligent Computer and Applications

关键词疫情 Word2Vec 神经网络 SVM 文本分类 epidemic Word2Vec neural network SVM text classification

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1邓君,孙绍丹,王阮,宋先智,李贺.基于Word2Vec和SVM的微博舆情情感演化分析[J].情报理论与实践,2020,43(8):112-119. 被引量：46
2张谦,高章敏,刘嘉勇.基于Word2vec的微博短文本分类研究[J].信息网络安全,2017(1):57-62. 被引量：48
3陈武,梁刚,杨进.一种改进的SVM算法在入侵检测中的应用[J].计算机安全,2013(6):2-7. 被引量：4

二级参考文献38

1马传香,李庆华,王卉.入侵检测研究综述[J].计算机工程,2005,31(3):4-6. 被引量：26
2张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：120
3Lee S. Heinbuch D., Training a neural-network basic intrusion detector to recognize novel attacks, IEEE Transactions on Systems, Man and Cybernetics, Part A, 2001, 31 (4) : 294-299.
4B.Balajinath, S. V. Raghavan, Intrusion detection through learning behaviormodel, Computer Communication, 2001, 24 (2) : 1202-1212.
5Ye, N. , A markov chain model of temporal behavior for anomaly detection, In Workshop on Information Assurance and Security, West Point, NY, June 2000.
6Vapnik V. N. , The nature of statistical learning theory, New York : Sp ringer-Verlag, 1995.
7S. Mukkamala, G. I. Janoski, A. H. Sung, Intrusion detection using support vector machines, Proceedings of the High Performance Computing Symposium-HPC 2002, pp. 178-183, San Diego, April 2002.
8B.Scholkopf, A. Smola, K. R. Muller, Nonlinear component analysis as a kernel eigenvatue problem, Neural Computation, 1998, 10 ( 5 ) , 1299-1319.
9Stairs G F, Jordaan EM. Imp roving SVM regression using mixtures of kernels[C] // Proceedings of the 2002 International Joint Conference on Neural-Networks. Hawaii: lEEk, 2002, 3:278522790.
10SUN Jun, FENG Bin, XU Wenbo. Particle swarm optimization with particles having quantum behavior [C]// Congress on Evolutionary Computation, 2004 (58) 40-43.

共引文献94

1王君泽,詹若贤,李怡,杜洪涛.融合主题与细粒度情感特征的气候变化微博舆情分析研究[J].信息技术与管理应用,2023(4):87-104.
2孟旭,谢靖,李春旺.基于核心主题特征的作者身份识别研究[J].知识管理论坛,2023(5):351-364.
3孙红,黎铨祺,赵娜.基于双层树状支持向量机的观点挖掘与倾向分析[J].智能计算机与应用,2021,11(3):44-47. 被引量：3
4俞定国,孙学敏,朱琳,刘良模.情感社会学理论下突发公共卫生事件中网民情感倾向研究[J].传媒论坛,2023,6(19):4-7.
5李秀茹,王晓,李朋朋,李绪红,罗安.Word2vec和支持向量机的POI自动分类方法[J].测绘科学,2022,47(6):195-203. 被引量：4
6韩耀廷,许志伟,刘利民.基于Storm云平台的增量文本分类机制研究[J].内蒙古工业大学学报（自然科学版）,2018,37(4):279-286.
7陈桂林,王生光,徐静妹,李雷.基于GA和组合核的SVM入侵检测算法[J].计算机技术与发展,2015,25(2):148-151. 被引量：4
8GUL Khan Safi Qamas,尹继泽,潘丽敏,罗森林.基于深度神经网络的命名实体识别方法研究[J].信息网络安全,2017(10):29-35. 被引量：16
9邬明强,张奎.结合TFIDF方法与Skip-gram模型的文本分类方法研究[J].电子技术与软件工程,2018(6):162-163.
10刘钢,李宗晨,郭建伟.基于卷积神经网络的文档特征提取方法[J].江苏科技信息,2018,35(14):21-23.

同被引文献73

1肖瑞,胡冯菊,裴卫.基于BiLSTM-CRF的中医文本命名实体识别[J].世界科学技术-中医药现代化,2020,22(7):2504-2510. 被引量：24
2肖水源.《社会支持评定量表》的理论基础与研究应用[J].临床精神医学杂志,1994,4(2):98-100. 被引量：3827
3林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
4李鹤,张平宇,程叶青.脆弱性的概念及其评价方法[J].地理科学进展,2008,27(2):18-25. 被引量：418
5赵军.命名实体识别、排歧和跨语言关联[J].中文信息学报,2009,23(2):3-17. 被引量：50
6宋雪雁,王萍.信息采纳行为概念及影响因素研究[J].情报科学,2010,28(5):760-762. 被引量：56
7孙镇,王惠临.命名实体识别研究进展综述[J].现代图书情报技术,2010(6):42-47. 被引量：94
8曹锦丹,王畅,梅松丽,贺伟.信息焦虑量表编制及其信效度检验[J].图书情报工作,2011,55(2):29-32. 被引量：24
9田铁杰,冮勇,李春光.大学生焦虑、抑郁水平与预见就业风险认知的关系[J].现代教育管理,2012(8):115-119. 被引量：6
10翟剑锋.深度学习在自然语言处理中的应用[J].电脑编程技巧与维护,2013(18):74-76. 被引量：13

引证文献3

1孔静静,于琦,李敬华,于彤,张竹绿,田野,祖雅琪.实体抽取综述及其在中医药领域的应用[J].世界科学技术-中医药现代化,2022,24(8):2957-2963. 被引量：2
2白桢文,黄涛,秦小兵,吴健.基于改进FastText算法的整车检测质量问题判定[J].北京汽车,2022(5):27-32.
3陈娟,谢丹,阿卜杜萨拉木·喀伍力,邓胜利.疫情防控背景下政府辟谣信息接受意愿的影响因素及其组态研究——基于脆弱性理论[J].情报科学,2023,41(5):50-58.

二级引证文献2

1易钧汇,查青林.中医症状信息抽取研究综述[J].计算机工程与应用,2023,59(17):35-47. 被引量：1
2吴佳泽,李坤宁,陈明.基于预训练模型及条件随机场的中医医案命名实体识别[J].中医药信息,2023,40(9):38-45.

1乔舒言.疫情之下的大数据采集与个人隐私保护[J].法治,2021(8):46-48.
2卫巍.全媒体时代传统媒体与新媒体融合发展路径研究[J].西部广播电视,2021,42(22):54-56. 被引量：9
3李清雯.新收入准则中税会差异表现和风险防控策略[J].会计师,2021(16):16-17. 被引量：1
4董晨宇,丁依然,许莹琪.2021年西方传播学研究年度报告[J].新闻记者,2022(2):38-57. 被引量：7
5曾宪堂,孙昊.高速公路短时交通流预测方法对比分析[J].公路,2022,67(2):366-370. 被引量：9
6王润泽,张月琴,秦琪琦,张泽华,郭旭敏.多视角多注意力融合分子特征的药物-靶标亲和力预测[J].计算机应用,2022,42(1):325-332. 被引量：2
7鲍彤,李颜汝.新媒体时代中韩网络新闻语篇的翻译策略[J].新闻研究导刊,2021,12(24):58-60. 被引量：2
8薛绍文.在英语词汇教学中培养学生思维品质[J].江苏教育,2022(19):72-73.
9陈柯,柴启栋.基于词向量空间模型的机器翻译质量评价分析——以石油术语有道翻译为例[J].中国科技术语,2022,24(2):21-25. 被引量：2
10与国际学术出版传播规范同步[J].中国组织工程研究,2022,26(21).

智能计算机与应用

2021年第10期

浏览历史

内容加载中请稍等...

基于Word2Vec的疫情虚假信息检测方法被引量：3

参考文献3

二级参考文献38

共引文献94

同被引文献73

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Word2Vec的疫情虚假信息检测方法 被引量：3

参考文献3

二级参考文献38

共引文献94

同被引文献73

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Word2Vec的疫情虚假信息检测方法被引量：3