基于GAN的中文虚假评论数据集生成方法被引量：1

Chinese fake review dataset generation method based on adversarial generation network

下载PDF

导出

摘要针对互联网虚假评论大肆横行,在虚假评论研究领域却没有完全公开的中文数据集可供中文虚假评论检测研究的问题,提出了一种基于生成对抗网络的中文虚假评论数据生成模型.首先,对生成器生成的文字序列通过蒙特卡洛搜索获取一批样本;然后,采用强化学习方法将判别器、分类器和重构器的反馈化为奖励分数;最后,传回生成器,对生成器进行参数优化,以生成贴近真实世界的具有相应类标签属性及特征的虚假评论数据.以BLEU值为评估指标,实验结果表明,所提出的模型在本文数据集上取得了更好的BLEU值,具有较好的生成效果. In order to solve the problem that fake reviews are rampant on the Internet,but there is no fully open Chinese data set for Chinese fake reviews detection in the field of fake reviews research,a Chinese fake reviews data generation model based on generative adversarial network is proposed.Firstly,Monte Carlo search is used to obtain a batch of samples from the text sequence generated by the generator.Then,the feedback of discriminator,classifier and reconstructor is converted into reward scores by reinforcement learning.Finally,reward scores back to the generator,and the parameters of the generator are optimized to generate fake review data with corresponding class tag attributes and features close to the real world.The BLEU value is used as the evaluation index.Experimental results show that on the dataset of this paper,the proposed generative model achieves better BLEU values and achieves a high level of performance.

作者吴正清曹晖 WU Zheng-qing;CAO Hui(Key Laboratory of China's Ethnic Languages and Information Technology of Ministry of Education,Northwest Minzu University,Lanzhou 730030,Gansu,China)

机构地区西北民族大学中国民族语言文字信息技术教育部重点实验室

出处《云南大学学报（自然科学版）》 CAS CSCD 北大核心 2023年第5期1033-1042,共10页 Journal of Yunnan University(Natural Sciences Edition)

基金国家自然科学基金(61633013) 中央高校基本科研业务费专项(31920230054).

关键词虚假评论生成对抗网络文本生成强化学习 fake reviews adversarial generative network text generation reinforcement learning

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张建华,陈家骏.自然语言生成综述[J].计算机应用研究,2006,23(8):1-3. 被引量：27
2蔡丽坤,吴运兵,陈甘霖,刘翀凌,廖祥文.基于生成对抗网络的类别文本生成[J].广西师范大学学报（自然科学版）,2022,40(4):79-90. 被引量：1

二级参考文献19

1陈华,韩近强,邓海清,李晓明.面向特定领域人机对话模型研究与实现[J].计算机工程与应用,2004,40(26):82-85. 被引量：3
2黄友能.可移植的自然语言生成系统中知识库的设计[J].北京交通大学学报,2004,28(5):20-23. 被引量：1
3张建华,陈家骏.自然语言生成综述[J].计算机应用研究,2006,23(8):1-3. 被引量：27
4Ehud Reiter, Roberty Dale. Building Natural Language Generation Systems[ M ]. Cambridge University Press, 2000.
5Daniel Jurafsky, James H Martin. Speech and Language Processing[ M ]. Prentice Hall, 2005.
6张冬茉,李锦乾,姚天昉.汉语自然语言生成的句子结构优化[J].计算机工程,1998,24(7):14-16. 被引量：2
7许华东,刘贵全,陈小平,汤小文.一个机器人足球现场解说系统[J].计算机工程,2002,28(3):179-181. 被引量：2
8许龙飞,杨晓昀,唐世渭.基于受限汉语的数据库自然语言接口技术研究[J].软件学报,2002,13(4):537-544. 被引量：36
9李良友,贡正仙,周国栋.机器翻译自动评价综述[J].中文信息学报,2014,28(3):81-91. 被引量：21
10蒋晶晶,牟向伟,胡家兴,朱友芹.文本生成模型研究[J].价值工程,2015,34(13):185-188. 被引量：1

共引文献26

1闫秋艳,夏士雄.一种基于自然语言生成的XML关键字查询技术[J].计算机工程与应用,2008,44(26):150-153. 被引量：2
2田倩,肖红琳.基于语义网的e-knowledge组织框架与内容研究[J].图书情报工作,2010,54(2):11-15. 被引量：7
3尧欣.基于动态模板的电子文书生成技术研究[J].信息记录材料,2010,11(3):32-35.
4司畅,张铁峰.关于自然语言生成技术的研究[J].信息技术,2010,34(9):108-110. 被引量：3
5詹卫东.自然语言的自动分析与生成简介[J].术语标准化与信息技术,2010(4):33-42. 被引量：5
6王伟嘉,汪海航.基于专家系统解释机制的报告生成方法[J].计算机应用,2012,32(A01):151-153. 被引量：2
7江澜.自然语言处理技术在中医辨证实训中的应用[J].时珍国医国药,2013,24(10):2503-2505. 被引量：2
8吴焕萍,吕终亮,张华平,罗兵,高健,李笑侃,何国豪,王永超.气象落区文本自动生成研究[J].计算机工程与应用,2014,50(13):247-251. 被引量：7
9李学宁,范新莹.系统功能语言学的知识表示方法研究[J].北京科技大学学报（社会科学版）,2015,31(3):26-30. 被引量：1
10张炜,施展,明小梅.复杂路网环境下的信息自动发布模型研究[J].公路,2015,60(12):182-186. 被引量：3

同被引文献8

1陈冰儿,劳南新.基于LSTM的许嵩风格歌词生成[J].网络安全技术与应用,2020(8):49-52. 被引量：3
2彭鹏菲,周琳茹.加入奖励的GRU对抗网络文本生成模型[J].计算机与现代化,2022(7):121-126. 被引量：3
3赵伟,王文娟,任彦凝,刘群,胥钟予,彭露.基于改进Transformer的生成式文本摘要模型[J].重庆邮电大学学报（自然科学版）,2023,35(1):185-192. 被引量：6
4王彦莹,王昊,朱惠,李晓敏.基于文本生成技术的历史古籍事件识别模型构建研究[J].图书情报工作,2023,67(3):119-130. 被引量：5
5熊露,裴志利,姜明洋,包启明.基于改进生成对抗网络的文本生成模型[J].内蒙古民族大学学报（自然科学版）,2023,38(2):118-123. 被引量：1
6肖瑞超.社交媒体文本情感分析方法及应用[J].信息技术与信息化,2023(7):40-43. 被引量：1
7李旭.人工智能时代背景下自然语言处理技术的发展[J].今日自动化,2023(4):100-102. 被引量：1
8黄瑶,潘丽丽,熊思宇,蒋湘辉,马俊勇.基于生成对抗网络与多头注意力的文本隐写术[J].计算机工程与科学,2023,45(10):1789-1796. 被引量：2

引证文献1

1贺妮,牟莉,万晓慧.引入位置编码机制对抗网络的文本生成模型[J].计算机技术与发展,2024,34(9):154-158.

1周学花.基于智能优化算法的软件测试数据生成模型及其应用研究[J].北华航天工业学院学报,2023,33(3):10-12. 被引量：1
2吴正清,曹晖,刘宝锴.基于注意力卷积神经网络的中文虚假评论检测[J].广西师范大学学报（自然科学版）,2023,41(5):26-36. 被引量：1
3蔡桢杰,李建敦,李原驰,朱婧姝,奚梦玲,孟浩杰.LSTM多模态虚假评论检测[J].福建电脑,2023,39(8):32-36.
4马恺珧,王国庆,于雷.不确定性环境下微电网优化调度综述[J].工程研究（跨学科视野中的工程）,2023,15(2):93-103. 被引量：1
5林泽阳,赖俊,陈希亮,王军.基于课程强化学习的无人机反坦克策略训练模型[J].计算机科学,2023,50(10):214-222.
6孟子晗,高翔,刘元归,马陈昊.基于分层强化学习的机械臂复杂操作技能学习方法[J].现代电子技术,2023,46(19):116-124. 被引量：1

云南大学学报（自然科学版）

2023年第5期

浏览历史

内容加载中请稍等...

基于GAN的中文虚假评论数据集生成方法被引量：1

参考文献2

二级参考文献19

共引文献26

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于GAN的中文虚假评论数据集生成方法 被引量：1

参考文献2

二级参考文献19

共引文献26

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于GAN的中文虚假评论数据集生成方法被引量：1