期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于层次注意力机制的垃圾用户检测模型
1
作者 杨晓晖 王卫宾 《河北大学学报(自然科学版)》 CAS 北大核心 2023年第1期95-102,共8页
目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰... 目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰富的语义与结构信息,接着利用节点级注意力层聚合元路径邻居增强节点表示,同时利用自适应层级聚合模块选择不同层级特征提升表征能力,然后通过语义级注意力层融合不同元路径下的节点表示,最后带入分类检测模块实现垃圾用户检测.在公开数据集上的实验结果表明该模型能够有效检测垃圾用户,并在不平衡数据分布时保持较强的稳定性. 展开更多
关键词 社交媒体 垃圾用户检测 异质信息网络 注意力机制
下载PDF
一种多分类的微博垃圾用户检测方法 被引量:1
2
作者 杨云 徐光侠 雷娟 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第8期44-55,共12页
针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训... 针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训练多分类器,经过反复调整参数,得到5个用户分类器;最后,针对多分类器的不可分样本,采用模糊聚类来进行模糊处理,即在垂直于SVM的最优分类面上定义一个改进的隶属度函数,选择最大隶属度对样本进行再分类。实验结果表明,该方法在保证垃圾用户检测效果的前提下,可以解决多分类中存在的混分和漏分问题。 展开更多
关键词 微博垃圾用户检测 多分类 模糊处理 隶属度函数
下载PDF
基于多视图融合的微博垃圾用户检测方法 被引量:1
3
作者 杨晓晖 梁笑 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第12期125-134,共10页
为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环... 为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。然后,构建基于线性加权函数的多视图融合决策模型,将来自各视图的分类结果进行线性加权融合,并通过最小化近似误差求得最优融合系数,进而得到最终的分类结果。在微博真实数据集上的测试结果表明,该方法能够有效检测垃圾用户,精确率和F1值较现有方法有明显提高,且在应对不平衡数据时表现出了更强的稳定性。文中还分析了不同视图对最终检测效果的影响,结果表明用户社交关系视图的作用最显著。 展开更多
关键词 微博 垃圾用户检测 线性加权函数 多视图融合
下载PDF
基于统计特征的微博垃圾用户检测系统研究
4
作者 范雨萌 易秀双 +1 位作者 倪石建 王兴伟 《网络空间安全》 2019年第9期20-25,共6页
微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机... 微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机器学习的检测方法并没有考虑时间的变化性,随着时间推移其检测性能下降。文章采用机器学习分类方法挖掘用户信息与微博信息的统计特征,基于Spark大数据平台,设计并实现了一套微博垃圾用户检测系统。该系统结合传统的离线检测与在线检测,通过在线检测解决时间的变化性问题,优化了传统离线检测的性能。文章的实验结果表明该系统离线检测部分的准确率最高可达到93.4%,在线检测部分的准确率最高可达到94.8%,均高于微博反垃圾系统的67.4%。 展开更多
关键词 垃圾用户检测 离线检测 在线检测 半监督学习检测 主动学习检测
下载PDF
基于微博重复发送的垃圾用户甄别 被引量:1
5
作者 吴斌 李冠辰 +2 位作者 刘宇 张雷 王柏 《数据采集与处理》 CSCD 北大核心 2015年第1期117-125,共9页
针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用... 针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用户进行了分析和建模。在真实数据集上的实验证明了方法的有效性,并且对模型中若干参数进行了优化,同时也分析了垃圾用户行为信息、社交网络信息和文本信息对模型的影响程度。 展开更多
关键词 垃圾用户检测 微博重复发送 主题模型
下载PDF
新浪微博反垃圾中特征选择的重要性分析 被引量:8
6
作者 张宇翔 孙菀 +3 位作者 杨家海 周达磊 孟祥飞 肖春景 《通信学报》 EI CSCD 北大核心 2016年第8期24-33,共10页
微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检... 微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检测方法,是否特征越多检测效果越好,新的方法是否可以显著提高检测效果。以新浪微博为例,试图通过不同的特征选择方法与不同的分类器组合实验回答以上问题,实验结果表明特征组的选择较分类器的改进更为重要,需从内容信息、用户行为和社会关系多侧面生成特征,且特征并非越多检测效果越好,这些结论将有助于未来微博反垃圾工作的突破。 展开更多
关键词 新浪微博 特征生成 特征选择 垃圾用户检测
下载PDF
基于微博的事件传播分析 被引量:7
7
作者 朱湘 贾焰 +1 位作者 聂原平 曲铭 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期437-444,共8页
事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人... 事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人们财产造成损失.传统的影响传播分析仅能对单条博文进行影响传播分析,这使社交网络中的事件传播分析受到限制.在已有的独立级联模型的基础上,提出了一种结合用户去重、垃圾用户滤除和概率阅读的传播模型,其基本思想是对多条热点博文构成的事件进行用户去重,构建事件传播网络拓扑图,然后对其中的垃圾用户节点进行滤除,最后利用概率阅读模型进行影响传播分析.这为事件传播分析提供了思路.通过一系列实验来验证方法及模型,通过与传统的博文分析进行对比,验证了方法的正确性与有效性. 展开更多
关键词 社交网络 传播模型 影响力分析 垃圾用户检测 概率阅读模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部