期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
微博垃圾用户行为研究
1
作者 高郭威 赵卫东 孙中全 《无线互联科技》 2024年第22期92-97,共6页
垃圾用户作为垃圾信息的传播者,一直是微博反垃圾研究的重点,现有的垃圾用户检测研究还局限于传统的二值分类问题上,只是将用户简单地判断为垃圾用户和正常用户。然而,微博平台中的垃圾用户类型多种多样,将各类垃圾用户按照单一类别垃... 垃圾用户作为垃圾信息的传播者,一直是微博反垃圾研究的重点,现有的垃圾用户检测研究还局限于传统的二值分类问题上,只是将用户简单地判断为垃圾用户和正常用户。然而,微博平台中的垃圾用户类型多种多样,将各类垃圾用户按照单一类别垃圾用户进行处理,会存在各类垃圾用户之间特征相互影响的问题,从而降低整体检测效果。为了解决上述问题,文章对各类垃圾用户行为进行了分析。首先,根据垃圾用户的行为目的和行为模式,将垃圾用户分为4类;其次,通过爬虫程序获取数据集,构造特征分析样本集并进行标注,计算用户的各项统计特征;最后,对4类垃圾用户的特征进行定量分析,归纳总结出每类用户的特点。实验结果表明,各类垃圾用户与正常用户之间存在区分度较高的相关特征,利用这些特征能够有效区分各种垃圾用户与正常用户,提升检测精度。 展开更多
关键词 微博 垃圾用户 用户行为 用户分类
下载PDF
微博中基于统计特征与双向投票的垃圾用户发现 被引量:11
2
作者 丁兆云 周斌 +1 位作者 贾焰 汪祥 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2336-2348,共13页
传统微博中垃圾用户发现主要依靠用户的显示统计特征.针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的... 传统微博中垃圾用户发现主要依靠用户的显示统计特征.针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的缺点,提出了基于统计特征与双向投票算法AttriBiVote,利用用户信任的双向传播与其邻居节点的统计特征共同决定用户类别.真实的Twitter数据集上验证了DirTriangleC和AttriBiVote算法的有效性,结果表明DirTriangleC算法能够发现约83.7%的"完全非活跃"状态的隐式垃圾用户,相对依靠显示统计特征方法增加了约2倍数量的疑似垃圾用户;同时AttriBiVote算法发现垃圾用户的数量和准确性均高于依靠统计特征的垃圾用户发现方法;最后实验分析了AttriBiVote算法的时间开销. 展开更多
关键词 垃圾用户 信任传播 三角形统计 微博 社会网络
下载PDF
基于微博重复发送的垃圾用户甄别 被引量:1
3
作者 吴斌 李冠辰 +2 位作者 刘宇 张雷 王柏 《数据采集与处理》 CSCD 北大核心 2015年第1期117-125,共9页
针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用... 针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用户进行了分析和建模。在真实数据集上的实验证明了方法的有效性,并且对模型中若干参数进行了优化,同时也分析了垃圾用户行为信息、社交网络信息和文本信息对模型的影响程度。 展开更多
关键词 垃圾用户检测 微博重复发送 主题模型
下载PDF
点评网站中垃圾用户识别研究 被引量:1
4
作者 王亚 《电脑知识与技术》 2020年第13期214-216,共3页
点评网站作为一种新兴的网络交流平台,目前存在着大量垃圾用户,他们发布的虚假垃圾评论信息误导了消费者的选择,引起不正当的市场竞争。本文基于机器学习的分类方法,对点评网站的垃圾用户进行研究,提出了基于用户评论频度的垃圾用户检... 点评网站作为一种新兴的网络交流平台,目前存在着大量垃圾用户,他们发布的虚假垃圾评论信息误导了消费者的选择,引起不正当的市场竞争。本文基于机器学习的分类方法,对点评网站的垃圾用户进行研究,提出了基于用户评论频度的垃圾用户检测模型和基于用户评论情感度的垃圾用户检测模型,并将模型融合进行模型训练,以最大限度提高识别垃圾用户的有效性。实验表明,本文提出的方法对垃圾用户识别的准确率最高可达70%。 展开更多
关键词 垃圾用户 用户评论频度 用户评论情感度 情感词库 逻辑回归
下载PDF
中文微博客的垃圾用户检测 被引量:9
5
作者 李赫元 俞晓明 +2 位作者 刘悦 程学旗 程工 《中文信息学报》 CSCD 北大核心 2014年第3期62-67,74,共7页
微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测... 微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征具有较好的区分度。 展开更多
关键词 微博客 垃圾用户 检测
下载PDF
基于新浪微博的社交网络垃圾用户分析与检测 被引量:3
6
作者 孟祥飞 徐路 王思雨 《科技与创新》 2014年第15期125-127,共3页
随着信息技术和互联网的飞速发展,社交网络在人们生活中扮演着不可替代的角色。但同时,社交网络中也充斥着各种各样的广告信息,严重影响了用户的体验。一些营销团队恶意注册的大量垃圾账号也让正常用户不胜其烦。针对这些问题,首先阐述... 随着信息技术和互联网的飞速发展,社交网络在人们生活中扮演着不可替代的角色。但同时,社交网络中也充斥着各种各样的广告信息,严重影响了用户的体验。一些营销团队恶意注册的大量垃圾账号也让正常用户不胜其烦。针对这些问题,首先阐述了社交网络垃圾用户产生的原因,进而分析了垃圾用户的特征,最后基于新浪微博的数据,使用C4.5决策树分类算法对用户进行分类。实验结果显示,该方法检测用户的准确率为92%. 展开更多
关键词 社交网络 新浪微博 垃圾用户 分类
下载PDF
一种多分类的微博垃圾用户检测方法 被引量:1
7
作者 杨云 徐光侠 雷娟 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第8期44-55,共12页
针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训... 针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训练多分类器,经过反复调整参数,得到5个用户分类器;最后,针对多分类器的不可分样本,采用模糊聚类来进行模糊处理,即在垂直于SVM的最优分类面上定义一个改进的隶属度函数,选择最大隶属度对样本进行再分类。实验结果表明,该方法在保证垃圾用户检测效果的前提下,可以解决多分类中存在的混分和漏分问题。 展开更多
关键词 微博垃圾用户检测 多分类 模糊处理 隶属度函数
下载PDF
基于岭回归极限学习机的微博垃圾用户分类 被引量:1
8
作者 张瑶瑶 朱小栋 《计算机与数字工程》 2021年第11期2326-2330,共5页
通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类。对于原本就信息过载,信息质量层次不齐的社交网络,... 通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类。对于原本就信息过载,信息质量层次不齐的社交网络,具有一定的借鉴意义。 展开更多
关键词 微博垃圾用户 ELM 岭回归 深度学习 分类
下载PDF
基于多视图融合的微博垃圾用户检测方法 被引量:1
9
作者 杨晓晖 梁笑 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第12期125-134,共10页
为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环... 为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。然后,构建基于线性加权函数的多视图融合决策模型,将来自各视图的分类结果进行线性加权融合,并通过最小化近似误差求得最优融合系数,进而得到最终的分类结果。在微博真实数据集上的测试结果表明,该方法能够有效检测垃圾用户,精确率和F1值较现有方法有明显提高,且在应对不平衡数据时表现出了更强的稳定性。文中还分析了不同视图对最终检测效果的影响,结果表明用户社交关系视图的作用最显著。 展开更多
关键词 微博 垃圾用户检测 线性加权函数 多视图融合
下载PDF
基于统计特征的微博垃圾用户检测系统研究 被引量:1
10
作者 范雨萌 易秀双 +1 位作者 倪石建 王兴伟 《网络空间安全》 2019年第9期20-25,共6页
微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机... 微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机器学习的检测方法并没有考虑时间的变化性,随着时间推移其检测性能下降。文章采用机器学习分类方法挖掘用户信息与微博信息的统计特征,基于Spark大数据平台,设计并实现了一套微博垃圾用户检测系统。该系统结合传统的离线检测与在线检测,通过在线检测解决时间的变化性问题,优化了传统离线检测的性能。文章的实验结果表明该系统离线检测部分的准确率最高可达到93.4%,在线检测部分的准确率最高可达到94.8%,均高于微博反垃圾系统的67.4%。 展开更多
关键词 垃圾用户检测 离线检测 在线检测 半监督学习检测 主动学习检测
下载PDF
基于层次注意力机制的垃圾用户检测模型
11
作者 杨晓晖 王卫宾 《河北大学学报(自然科学版)》 CAS 北大核心 2023年第1期95-102,共8页
目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰... 目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰富的语义与结构信息,接着利用节点级注意力层聚合元路径邻居增强节点表示,同时利用自适应层级聚合模块选择不同层级特征提升表征能力,然后通过语义级注意力层融合不同元路径下的节点表示,最后带入分类检测模块实现垃圾用户检测.在公开数据集上的实验结果表明该模型能够有效检测垃圾用户,并在不平衡数据分布时保持较强的稳定性. 展开更多
关键词 社交媒体 垃圾用户检测 异质信息网络 注意力机制
下载PDF
新浪微博反垃圾中特征选择的重要性分析 被引量:8
12
作者 张宇翔 孙菀 +3 位作者 杨家海 周达磊 孟祥飞 肖春景 《通信学报》 EI CSCD 北大核心 2016年第8期24-33,共10页
微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检... 微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检测方法,是否特征越多检测效果越好,新的方法是否可以显著提高检测效果。以新浪微博为例,试图通过不同的特征选择方法与不同的分类器组合实验回答以上问题,实验结果表明特征组的选择较分类器的改进更为重要,需从内容信息、用户行为和社会关系多侧面生成特征,且特征并非越多检测效果越好,这些结论将有助于未来微博反垃圾工作的突破。 展开更多
关键词 新浪微博 特征生成 特征选择 垃圾用户检测
下载PDF
基于微博的事件传播分析 被引量:7
13
作者 朱湘 贾焰 +1 位作者 聂原平 曲铭 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期437-444,共8页
事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人... 事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人们财产造成损失.传统的影响传播分析仅能对单条博文进行影响传播分析,这使社交网络中的事件传播分析受到限制.在已有的独立级联模型的基础上,提出了一种结合用户去重、垃圾用户滤除和概率阅读的传播模型,其基本思想是对多条热点博文构成的事件进行用户去重,构建事件传播网络拓扑图,然后对其中的垃圾用户节点进行滤除,最后利用概率阅读模型进行影响传播分析.这为事件传播分析提供了思路.通过一系列实验来验证方法及模型,通过与传统的博文分析进行对比,验证了方法的正确性与有效性. 展开更多
关键词 社交网络 传播模型 影响力分析 垃圾用户检测 概率阅读模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部