网评贴文自动生成方法研究被引量：1

Method for Automatically Generating Online Comments

导出

摘要【目的】为反制社交网络中的恶意信息、引导正确的舆论走向,提出一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。【方法】通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,提高生成贴文与真实网评贴文的语序结构及语义特征的相似性;通过将SeqGAN的判别器修改为TCN与注意力机制层相结合的模型的方式,提高生成贴文的语句通顺度。【结果】与基线模型相比,利用TSeqGAN生成的网评贴文BLEU-2(0.79935)、BLEU-3(0.60396)、BLEU-4(0.47642)、KenLM(-27.67029)指标值更高,PPL(0.75247)指标值更低。【局限】生成贴文的词汇量及语言风格受制于已有的真实贴文,网评贴文自动生成方法的适用情景受限。【结论】本文模型生成的网评贴文具有更高的语序正确性和语法正确性,与真实贴文的内容相似性也更高,能够在社交网络中引导正确的舆论走向。 [Objective]This paper proposes a Temporal Sequence Generative Adversarial Network(T-SeqGAN)automatically generating online comments,aiming to counteract malicious information on social networks and guide the correct direction of public opinion.[Methods]First,we modified the Sequence Generative Adversarial Network(SeqGAN)generator to a Seq2Seq structure.Then,we used the bidirectional gated recurrent unit(BiGRU)and the sequential convolutional neural network(TCN)as the skeleton network of the encoder and decoder,respectively.Next,we improved the similarity of the syntactic structure and semantic features between the generated posts and the real online comments.Finally,we modified the discriminator of SeqGAN to a model combing TCN and attention mechanism layers to improve the fluency of generated posts.[Results]Compared with the baseline model,the comments generated by the proposed model have significantly higher BLEU-2(0.79935),BLEU-3(0.60396),BLEU-4(0.47642),and KenLM(-27.67029)metrics,as well as lower PPL(0.75247)metrics.[Limitations]The vocabulary and language style of the generated posts are limited by actual posts,and the applicability of our method is limited.[Conclusions]The comments generated by the proposed model have higher syntactic and grammatical correctness and higher similarity to the real-world ones,which can guide the correct direction of public opinion on social networks.

作者刘欣然徐雅斌李继先 Liu Xinran;Xu Yabin;Li Jixian(Beijing Key Laboratory of Network Culture and Digital Communication,Beijing University of Information Science and Technology,Beijing 100101,China;School of Computer Science,Beijing University of Information Science and Technology,Beijing 100101,China;School of Humanities and Education,Beijing Open University,Beijing 100081,China)

机构地区北京信息科技大学网络文化与数字传播北京市重点实验室北京信息科技大学计算机学院北京开放大学人文与教育学院

出处《数据分析与知识发现》 CSCD 北大核心 2023年第4期101-113,共13页 Data Analysis and Knowledge Discovery

基金国家自然科学基金项目(项目编号:61672101) 网络文化与数字传播北京市重点实验室开放课题(项目编号:ICCD XN004) 信息网络安全公安部重点实验室开放课题(项目编号:C18601)的研究成果之一。

关键词网评贴文序列生成式对抗网络时序卷积神经网络 Seq2Seq Social Network Comment Posts SeqGAN TCN Seq2Seq

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1程新斌.对重大舆情与突发事件舆论引导研究的分析与对策[J].西南民族大学学报（人文社会科学版）,2022,43(2):235-240. 被引量：12
2余晓青.意识形态网络舆情应对机制研究[J].南京邮电大学学报（社会科学版）,2021,23(5):37-47. 被引量：6
3严丹,何军,刘红岩,杜小勇.考虑评级信息的音乐评论文本自动生成[J].计算机科学与探索,2020,14(8):1389-1396. 被引量：2
4韩虎,孙天岳,赵启涛.引入自编码机制对抗网络的文本生成模型[J].计算机工程与科学,2020,42(9):1704-1710. 被引量：2
5朱向其,张忠林,李林川,马海云.基于改进词性信息和ACBiLSTM的短文本分类[J].计算机应用与软件,2021,38(12):179-186. 被引量：5
6高巍,马辉,李大舟,于沛.基于双编码器的中文文本摘要技术的研究与实现[J].计算机工程与设计,2021,42(9):2687-2695. 被引量：6
7邹智,吴铁洲,张晓星,张智敏.基于贝叶斯优化CNN-BiGRU混合神经网络的短期负荷预测[J].高电压技术,2022,48(10):3935-3945. 被引量：30
8何天文,王红.基于语义语法分析的中文语句困惑度评价[J].计算机应用研究,2017,34(12):3538-3542. 被引量：12

二级参考文献81

1贺敏,王丽宏,杜攀,张瑾,程学旗.基于有意义串聚类的微博热点话题发现方法[J].通信学报,2013,34(S1):256-262. 被引量：12
2唐承亮,肖海青,向华政.基于文字RGB颜色变化的脆弱型文本数字水印技术[J].计算机工程与应用,2005,41(36):6-8. 被引量：21
3华琳,阎岩,张建.关于对诊断一致性Kappa系统的探讨[J].数理医药学杂志,2006,19(5):518-520. 被引量：64
4朱力.突发事件的概念、要素与类型[J].南京社会科学,2007(11):81-88. 被引量：114
5宋人杰,潘智勇,王震宇.基于模糊逻辑与神经网络的短期负荷预测[J].华北电力技术,2007(12):17-19. 被引量：3
6李英辉,侯肖霞,郭增欣,曲昀卿.面向对象的人工神经网络负荷预测遗传算法[J].石家庄职业技术学院学报,2007,19(6):30-32. 被引量：3
7李文波,孙乐,张大鲲.基于Labeled-LDA模型的文本分类新算法[J].计算机学报,2008,31(4):620-627. 被引量：103
8万国成,王汉华.最小二乘法在配网馈线年度负荷预测中的应用[J].电气应用,2008,27(9):32-34. 被引量：4
9曾润喜,徐晓林.网络舆情突发事件预警系统、指标与机制[J].情报杂志,2009,28(11):52-54. 被引量：185
10赵红梅,刘群.机器翻译及其评测技术简介[J].术语标准化与信息技术,2010(1):36-41. 被引量：11

共引文献67

1于凯,杨富义.社会安全事件网络舆情多属性演化分析与知识图谱构建[J].情报工程,2022,8(4):14-30. 被引量：2
2张未,余成波,王士彬,何鑫,陈佳.基于EMD-MTL-LSTM的多特征综合能源负荷预测[J].云南电业,2023(9):13-18.
3汤鲲,陈思思.基于GRU+LDA的群聊主题挖掘[J].计算机与现代化,2018(12):72-76. 被引量：1
4张宏,阮泽楠.基于情感主题的音乐分类研究[J].软件导刊,2019,18(7):15-18.
5张莹,亚森·艾则孜,吴顺祥.利用N-gram和语义分析的维吾尔语文本相似性检测方法[J].计算机应用研究,2019,36(9):2722-2725. 被引量：1
6严春满,王铖.卷积神经网络模型发展及应用[J].计算机科学与探索,2021,15(1):27-46. 被引量：63
7柳伟,孟凡阳,谭旭.一种基于对抗MSE度量的自编码网络优化方法[J].深圳信息职业技术学院学报,2020,18(6):51-58.
8高毅.基于BERT预训练模型的古汉语自动分词方法研究[J].电子设计工程,2021,29(22):28-32. 被引量：3
9张雷,谭慧雯,张璇,韩龙.基于LDA模型的高校师德舆情演化及路径传导研究[J].情报科学,2022,40(3):144-151. 被引量：16
10宋晓琴,杨波.主流媒体应对突发事件网络舆情的困境与对策研究[J].新闻研究导刊,2022,13(5):61-63. 被引量：2

同被引文献3

1林志兴,王立可.基于深度特征和Seq2Seq模型的网络态势预测方法[J].计算机应用,2020,40(8):2241-2247. 被引量：14
2李雪晴,王石,王朱君,朱俊武.自然语言生成综述[J].计算机应用,2021,41(5):1227-1235. 被引量：19
3刘晓明,张兆晗,杨晨阳,张宇辰,沈超,周亚东,管晓宏.在线社交网络文本内容对抗技术[J].计算机学报,2022,45(8):1571-1597. 被引量：6

引证文献1

1李晨阳,张龙,郑秋生,钱少华.基于扩散序列的多元可控文本生成[J].计算机应用,2024,44(8):2414-2420.

1王璐.浅谈5G时代的信息传播与舆论引导[J].中文科技期刊数据库（全文版）社会科学,2022(3):196-198.
2雷桂林.汉语非常规语序中的主观性——试析“兄弟”“弟兄”的语义分工[J].对外汉语研究,2022(2):15-28.
3赵晓兴.新媒体环境下事业单位思想政治教育开展方式研究[J].中文科技期刊数据库（全文版）社会科学,2023(6):151-154.
4高云.自媒体时代如何进行舆论引导[J].中国报业,2023(9):40-41.
5石玉全,安文旭.浅谈初中英语写作训练的几点策略[J].中文科技期刊数据库（全文版）教育科学,2023(8):95-98.
6雷晓云.融媒体时代新闻编辑的创新及融合能力探析[J].传播力研究,2023,7(18):10-12.
7征稿启事[J].青少年法治教育,2023(3):72-72.
8章龙.守正创新当好新闻“把关人”[J].中国地市报人,2023(5):105-106. 被引量：1
9《遥测遥控》投稿须知[J].遥测遥控,2023,44(4):29-29.
10余国鹏.重大主题评论写作把握好分寸尺度探析[J].社会主义论坛,2023(5):54-55.

数据分析与知识发现

2023年第4期

浏览历史

内容加载中请稍等...

网评贴文自动生成方法研究被引量：1

参考文献8

二级参考文献81

共引文献67

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

网评贴文自动生成方法研究 被引量：1

参考文献8

二级参考文献81

共引文献67

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

网评贴文自动生成方法研究被引量：1