基于半监督学习算法的虚假评论识别研究被引量：15

Deceptive Reviews Detection Based on Semi-supervised Learning Algorithm

下载PDF

导出

摘要已有的虚假评论识别方法主要采用启发式策略或简单特征建模。针对这些方法的不足,提出使用机器学习方法识别虚假评论。首先整合计算语言学与心理语言学的知识对评论文本进行建模,使用全监督学习算法来评价不同特征建模的性能,选出最好的特征组合。为了提高识别性能,设计2种半监督学习算法充分利用大量的未标注文本。实验结果证实所提算法超过当前的基准。 Machine learning methods were presented to identify deceptive reviews. With the integration of knowledge from computational linguistics and psycholinguistics,supervised method was developed to evaluate the performance of different feature modelings,and select the best mixed features. Then,two semi-supervised learning methods were designed to exploit the large amount of unlabeled data. The results showed the proposed methods outperform the current baselines.

作者任亚峰姬东鸿尹兰

机构地区武汉大学计算机学院

出处《四川大学学报（工程科学版）》 EI CAS CSCD 北大核心 2014年第3期62-69,共8页 Journal of Sichuan University (Engineering Science Edition)

基金国家自然科学基金重点项目(61133012) 国家自然科学基金资助项目(61173062) 中央高校基本科研业务费专项资金资助项目(2012211020210)

关键词机器学习半监督学习计算语言学虚假评论 machine learning semi-supervised learning computational linguistics deceptive reviews

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1Fang Wu,Bernardo A. Huberman.Opinion formation under costly expression[J].ACM Transactions on Intelligent Systems and Technology (TIST).2010(1)
2Jeffrey T. Hancock,Lauren E. Curry,Saurabh Goorha,Michael Woodworth.On Lying and Being Lied To: A Linguistic Analysis of Deception in Computer-Mediated Communication[J].Discourse Processes.2008(1)
3Aldert Vrij,Samantha Mann,Susanne Kristen,Ronald P. Fisher.Cues to Deception and Ability to Detect Lies as a Function of Police Interview Styles[J].Law and Human Behavior.2007(5)

同被引文献138

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2涂鼎,陈岭,陈根才,吴勇,王敬昌.基于多路层次聚类的商品评论数据概念分类构建[J].计算机研究与发展,2013,50(S2):208-215. 被引量：3
3Muller K R, Mika S, Ratsch G,et al. An introduction to kernel based learning algorithms [ J ]. IEEE Transactions on Neural Networks ,2001,12(2) : 181 - 201.
4Bach F R, Lanckriet G R G, Jordan M I. Multiple kernel learning, conic duality, and the SMO algorithm [ C ]//Pro- ceedings of the 21st International Conference on Machine Learning. New York : ACM ,2004:41 - 48.
5Klofl M, Brefeld U, Laskov P, et al. Non-sparse multiple kernel learning [ C ]//Proceedings of the NIPS Workshop on Kernel Learning: Automatic Selection of Kernels. Van- couver : MIT Press ,2008 : 1 - 4.
6Rakotomamonjy A,Bach F,Canu S,et al. SimpleMKL[ J]. Journal of Machine Learning Research,2008,9(ll):2491 - 2521.
7Kloft M,Blanchard G. On the convergence rate of/p-norm multiple kernel learning[J]. Journal of Machine Learning Research,2012,13 ( 8 ) :2465 - 2501.
8Vapnik V N. The natural of statistical learning theory [ M ]. New York : Springer, 1995.
9Vapnik V N. Statistical learning theory [ M ]. New York: Wiley, 1998.
10Demir B, Bruzzone L. A multiple criteria active learning method for support vector regression[J]. Pattern Recogni- tion,2014,47 (7) :2558 - 2567.

引证文献15

1胡庆辉,丁立新,刘晓刚,李照奎.非稀疏多核组合的支持向量回归方法[J].四川大学学报（工程科学版）,2015,47(4):91-97. 被引量：2
2张李义,张皎.一种基于主成分分析和随机森林的刷客识别方法[J].现代图书情报技术,2015(10):65-71. 被引量：4
3杨金鸿,邓廷权.基于距离度量学习的半监督多视角谱聚类算法[J].四川大学学报（工程科学版）,2016,48(1):146-151. 被引量：2
4栾杰,付晓东,冯旭鹏,刘利军,黄青松,刘晓梅.基于多元特征的电商低质量商品评论识别[J].计算机应用与软件,2017,34(2):100-105. 被引量：1
5朱娟.在线商品虚假评论关键问题研究综述[J].现代情报,2017,37(5):166-171. 被引量：6
6谭文斌.基于产品属性的评论语句聚类分析算法[J].贵州科学,2017,35(6):79-82.
7谢军,胡发刚.基于网购评论分析的电商平台刷单行为推测方法[J].吉林工商学院学报,2017,33(6):52-56. 被引量：1
8张圣,伍星,邹东升.垃圾商品评论检测研究综述[J].计算机工程与科学,2018,40(11):2060-2066. 被引量：2
9颜梦香,姬东鸿,任亚峰.基于层次注意力机制神经网络模型的虚假评论识别[J].计算机应用,2019,39(7):1925-1930. 被引量：11
10杨超,李天卓,谈森鹏,杨新凯.基于双卷积神经网络的虚假评论识别[J].计算机与数字工程,2020,48(8):1954-1957. 被引量：2

二级引证文献50

1任丹丽,郭润泽.美国《2016年消费者评价公平法案》评介[J].知识产权与市场竞争研究,2019,0(1):276-287. 被引量：2
2徐璐琳,李忠武,朱冬元.基于文本挖掘、GIS及Stacking框架的武汉市二手房评估模型[J].中国资产评估,2020,0(2):41-51.
3吕达,刘文婧,陈肖洁.规则的多核学习支持向量回归算法[J].机械设计与制造,2016(12):53-56. 被引量：3
4吕达,刘文婧,陈肖洁.加法规则的多核学习在甲醇合成中的应用[J].机械设计与制造,2017(5):267-269.
5朱娟.在线商品虚假评论关键问题研究综述[J].现代情报,2017,37(5):166-171. 被引量：6
6谢军,胡发刚.基于网购评论分析的电商平台刷单行为推测方法[J].吉林工商学院学报,2017,33(6):52-56. 被引量：1
7黄裕.基于多视角缺失补全算法的数据挖掘研究[J].计算技术与自动化,2018,37(2):67-72. 被引量：1
8李杰,张睿,徐勇.电商平台监管与商家售假演化博弈[J].系统工程学报,2018,33(5):649-661. 被引量：37
9史会斌,杨东,赵洁.客户与供应商创新搜索嵌入对企业研发投入效益的影响[J].科技进步与对策,2018,35(17):100-105. 被引量：3
10程士卿,郝问裕,李晨,张茁涵,曹容玮.低秩张量分解的多视角谱聚类算法[J].西安交通大学学报,2020,54(3):119-125. 被引量：6

1ISV：配角其实更难演[J].软件世界,2004(9):46-49.
2陈嶷瑛,孟庆新,刘智国.基于测试分类精度的多分类器融合方法[J].佳木斯大学学报（自然科学版）,2006,24(1):75-77.
3王敬,李淑英.基于半监督学习算法在文本分类中的应用研究[J].信息与电脑,2015,27(9):106-107.
4祝宇,聂峰光,郭力.利用未标记数据提高SVM分类器性能的研究[J].计算机工程与应用,2006,42(27):166-167. 被引量：2
5李鹤飞,黄新力,郑正奇.基于软件定义网络的DDoS攻击检测方法及其应用[J].计算机工程,2016,42(2):118-123. 被引量：17
6徐火辉.词输入与心理语言学[J].中文信息,1995,12(4):9-14. 被引量：1
7从1∶1到1+1 IBM推“整合计算”[J].金融电子化,2004(9):22-22.
8邵宗有.整合计算细分应用[J].大众电脑,2004(4):19-20.
9百川.华硕助中小型IDC实现全面虚拟化布局[J].中国制造业信息化（应用版）,2011(1):8-8.
10邵宗有.整合计算细分应用——机群结构高性能计算机发展的必由之路[J].中国计算机用户,2003(43):19-19.

四川大学学报（工程科学版）

2014年第3期

浏览历史

内容加载中请稍等...

基于半监督学习算法的虚假评论识别研究被引量：15

参考文献3

同被引文献138

引证文献15

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于半监督学习算法的虚假评论识别研究 被引量：15

参考文献3

同被引文献138

引证文献15

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于半监督学习算法的虚假评论识别研究被引量：15