期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种用于垃圾评论分类的融合主题信息的生成对抗网络模型 被引量:2
1
作者 徐闽樟 陈羽中 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2292-2299,共8页
随着信息时代的飞速发展,由此也衍生出刷垃圾评论等黑色产业.随着机器学习技术的兴起,人们研究出许多有效的方法来识别垃圾评论.传统统计机器学习方法通过人工特征工程提取能够区分垃圾评论和正常评论的评论类别特征,往往需要花费大量... 随着信息时代的飞速发展,由此也衍生出刷垃圾评论等黑色产业.随着机器学习技术的兴起,人们研究出许多有效的方法来识别垃圾评论.传统统计机器学习方法通过人工特征工程提取能够区分垃圾评论和正常评论的评论类别特征,往往需要花费大量的精力进行特征选择;而深度学习方法利用神经网络自动学习评论特征.但是受限于标记数据的获取困难,现有的深度学习模型仍然存在较为严重的过拟合问题,另外不考虑主题信息,直接对评论文本进行训练也使得模型学习困难,泛化能力较弱.针对上述问题,本文提出一种用于垃圾评论分类的融合主题信息的生成对抗网络模型Topic-SpamGAN(Topic-SpamGenerative Adversarial Network).为解决标记样本获取困难的问题,Topic-SpamGAN采用GAN拟合真实标记样本,提升分类器的训练效果;其次,Topic-SpamGAN使用强化学习帮助生成器训练,改善生成样本的质量;此外,Topic-SpamGAN在模型学习中引入主题信息增强生成文本的相关性,并通过主题信息引导模型进行分类学习,使模型学习更为稳定.旅馆数据集上的实验结果证明,Topic-SpamGAN能获得优于现有垃圾评论分类模型的性能. 展开更多
关键词 垃圾评论分类 生成对抗神经网络 主题分类 半监督学习 强化学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部