期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
13
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
微博垃圾用户行为研究
1
作者
高郭威
赵卫东
孙中全
《无线互联科技》
2024年第22期92-97,共6页
垃圾用户作为垃圾信息的传播者,一直是微博反垃圾研究的重点,现有的垃圾用户检测研究还局限于传统的二值分类问题上,只是将用户简单地判断为垃圾用户和正常用户。然而,微博平台中的垃圾用户类型多种多样,将各类垃圾用户按照单一类别垃...
垃圾用户作为垃圾信息的传播者,一直是微博反垃圾研究的重点,现有的垃圾用户检测研究还局限于传统的二值分类问题上,只是将用户简单地判断为垃圾用户和正常用户。然而,微博平台中的垃圾用户类型多种多样,将各类垃圾用户按照单一类别垃圾用户进行处理,会存在各类垃圾用户之间特征相互影响的问题,从而降低整体检测效果。为了解决上述问题,文章对各类垃圾用户行为进行了分析。首先,根据垃圾用户的行为目的和行为模式,将垃圾用户分为4类;其次,通过爬虫程序获取数据集,构造特征分析样本集并进行标注,计算用户的各项统计特征;最后,对4类垃圾用户的特征进行定量分析,归纳总结出每类用户的特点。实验结果表明,各类垃圾用户与正常用户之间存在区分度较高的相关特征,利用这些特征能够有效区分各种垃圾用户与正常用户,提升检测精度。
展开更多
关键词
微博
垃圾用户
用户
行为
用户
分类
下载PDF
职称材料
微博中基于统计特征与双向投票的垃圾用户发现
被引量:
11
2
作者
丁兆云
周斌
+1 位作者
贾焰
汪祥
《计算机研究与发展》
EI
CSCD
北大核心
2013年第11期2336-2348,共13页
传统微博中垃圾用户发现主要依靠用户的显示统计特征.针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的...
传统微博中垃圾用户发现主要依靠用户的显示统计特征.针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的缺点,提出了基于统计特征与双向投票算法AttriBiVote,利用用户信任的双向传播与其邻居节点的统计特征共同决定用户类别.真实的Twitter数据集上验证了DirTriangleC和AttriBiVote算法的有效性,结果表明DirTriangleC算法能够发现约83.7%的"完全非活跃"状态的隐式垃圾用户,相对依靠显示统计特征方法增加了约2倍数量的疑似垃圾用户;同时AttriBiVote算法发现垃圾用户的数量和准确性均高于依靠统计特征的垃圾用户发现方法;最后实验分析了AttriBiVote算法的时间开销.
展开更多
关键词
垃圾用户
信任传播
三角形统计
微博
社会网络
下载PDF
职称材料
基于微博重复发送的垃圾用户甄别
被引量:
1
3
作者
吴斌
李冠辰
+2 位作者
刘宇
张雷
王柏
《数据采集与处理》
CSCD
北大核心
2015年第1期117-125,共9页
针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用...
针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用户进行了分析和建模。在真实数据集上的实验证明了方法的有效性,并且对模型中若干参数进行了优化,同时也分析了垃圾用户行为信息、社交网络信息和文本信息对模型的影响程度。
展开更多
关键词
垃圾用户
检测
微博重复发送
主题模型
下载PDF
职称材料
点评网站中垃圾用户识别研究
被引量:
1
4
作者
王亚
《电脑知识与技术》
2020年第13期214-216,共3页
点评网站作为一种新兴的网络交流平台,目前存在着大量垃圾用户,他们发布的虚假垃圾评论信息误导了消费者的选择,引起不正当的市场竞争。本文基于机器学习的分类方法,对点评网站的垃圾用户进行研究,提出了基于用户评论频度的垃圾用户检...
点评网站作为一种新兴的网络交流平台,目前存在着大量垃圾用户,他们发布的虚假垃圾评论信息误导了消费者的选择,引起不正当的市场竞争。本文基于机器学习的分类方法,对点评网站的垃圾用户进行研究,提出了基于用户评论频度的垃圾用户检测模型和基于用户评论情感度的垃圾用户检测模型,并将模型融合进行模型训练,以最大限度提高识别垃圾用户的有效性。实验表明,本文提出的方法对垃圾用户识别的准确率最高可达70%。
展开更多
关键词
垃圾用户
用户
评论频度
用户
评论情感度
情感词库
逻辑回归
下载PDF
职称材料
中文微博客的垃圾用户检测
被引量:
9
5
作者
李赫元
俞晓明
+2 位作者
刘悦
程学旗
程工
《中文信息学报》
CSCD
北大核心
2014年第3期62-67,74,共7页
微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测...
微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征具有较好的区分度。
展开更多
关键词
微博客
垃圾用户
检测
下载PDF
职称材料
基于新浪微博的社交网络垃圾用户分析与检测
被引量:
3
6
作者
孟祥飞
徐路
王思雨
《科技与创新》
2014年第15期125-127,共3页
随着信息技术和互联网的飞速发展,社交网络在人们生活中扮演着不可替代的角色。但同时,社交网络中也充斥着各种各样的广告信息,严重影响了用户的体验。一些营销团队恶意注册的大量垃圾账号也让正常用户不胜其烦。针对这些问题,首先阐述...
随着信息技术和互联网的飞速发展,社交网络在人们生活中扮演着不可替代的角色。但同时,社交网络中也充斥着各种各样的广告信息,严重影响了用户的体验。一些营销团队恶意注册的大量垃圾账号也让正常用户不胜其烦。针对这些问题,首先阐述了社交网络垃圾用户产生的原因,进而分析了垃圾用户的特征,最后基于新浪微博的数据,使用C4.5决策树分类算法对用户进行分类。实验结果显示,该方法检测用户的准确率为92%.
展开更多
关键词
社交网络
新浪微博
垃圾用户
分类
下载PDF
职称材料
一种多分类的微博垃圾用户检测方法
被引量:
1
7
作者
杨云
徐光侠
雷娟
《重庆大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第8期44-55,共12页
针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训...
针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训练多分类器,经过反复调整参数,得到5个用户分类器;最后,针对多分类器的不可分样本,采用模糊聚类来进行模糊处理,即在垂直于SVM的最优分类面上定义一个改进的隶属度函数,选择最大隶属度对样本进行再分类。实验结果表明,该方法在保证垃圾用户检测效果的前提下,可以解决多分类中存在的混分和漏分问题。
展开更多
关键词
微博
垃圾用户
检测
多分类
模糊处理
隶属度函数
下载PDF
职称材料
基于岭回归极限学习机的微博垃圾用户分类
被引量:
1
8
作者
张瑶瑶
朱小栋
《计算机与数字工程》
2021年第11期2326-2330,共5页
通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类。对于原本就信息过载,信息质量层次不齐的社交网络,...
通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类。对于原本就信息过载,信息质量层次不齐的社交网络,具有一定的借鉴意义。
展开更多
关键词
微博
垃圾用户
ELM
岭回归
深度学习
分类
下载PDF
职称材料
基于多视图融合的微博垃圾用户检测方法
被引量:
1
9
作者
杨晓晖
梁笑
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2020年第12期125-134,共10页
为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环...
为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。然后,构建基于线性加权函数的多视图融合决策模型,将来自各视图的分类结果进行线性加权融合,并通过最小化近似误差求得最优融合系数,进而得到最终的分类结果。在微博真实数据集上的测试结果表明,该方法能够有效检测垃圾用户,精确率和F1值较现有方法有明显提高,且在应对不平衡数据时表现出了更强的稳定性。文中还分析了不同视图对最终检测效果的影响,结果表明用户社交关系视图的作用最显著。
展开更多
关键词
微博
垃圾用户
检测
线性加权函数
多视图融合
下载PDF
职称材料
基于统计特征的微博垃圾用户检测系统研究
被引量:
1
10
作者
范雨萌
易秀双
+1 位作者
倪石建
王兴伟
《网络空间安全》
2019年第9期20-25,共6页
微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机...
微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机器学习的检测方法并没有考虑时间的变化性,随着时间推移其检测性能下降。文章采用机器学习分类方法挖掘用户信息与微博信息的统计特征,基于Spark大数据平台,设计并实现了一套微博垃圾用户检测系统。该系统结合传统的离线检测与在线检测,通过在线检测解决时间的变化性问题,优化了传统离线检测的性能。文章的实验结果表明该系统离线检测部分的准确率最高可达到93.4%,在线检测部分的准确率最高可达到94.8%,均高于微博反垃圾系统的67.4%。
展开更多
关键词
垃圾用户
检测
离线检测
在线检测
半监督学习检测
主动学习检测
下载PDF
职称材料
基于层次注意力机制的垃圾用户检测模型
11
作者
杨晓晖
王卫宾
《河北大学学报(自然科学版)》
CAS
北大核心
2023年第1期95-102,共8页
目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰...
目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰富的语义与结构信息,接着利用节点级注意力层聚合元路径邻居增强节点表示,同时利用自适应层级聚合模块选择不同层级特征提升表征能力,然后通过语义级注意力层融合不同元路径下的节点表示,最后带入分类检测模块实现垃圾用户检测.在公开数据集上的实验结果表明该模型能够有效检测垃圾用户,并在不平衡数据分布时保持较强的稳定性.
展开更多
关键词
社交媒体
垃圾用户
检测
异质信息网络
注意力机制
下载PDF
职称材料
新浪微博反垃圾中特征选择的重要性分析
被引量:
8
12
作者
张宇翔
孙菀
+3 位作者
杨家海
周达磊
孟祥飞
肖春景
《通信学报》
EI
CSCD
北大核心
2016年第8期24-33,共10页
微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检...
微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检测方法,是否特征越多检测效果越好,新的方法是否可以显著提高检测效果。以新浪微博为例,试图通过不同的特征选择方法与不同的分类器组合实验回答以上问题,实验结果表明特征组的选择较分类器的改进更为重要,需从内容信息、用户行为和社会关系多侧面生成特征,且特征并非越多检测效果越好,这些结论将有助于未来微博反垃圾工作的突破。
展开更多
关键词
新浪微博
特征生成
特征选择
垃圾用户
检测
下载PDF
职称材料
基于微博的事件传播分析
被引量:
7
13
作者
朱湘
贾焰
+1 位作者
聂原平
曲铭
《计算机研究与发展》
EI
CSCD
北大核心
2015年第2期437-444,共8页
事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人...
事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人们财产造成损失.传统的影响传播分析仅能对单条博文进行影响传播分析,这使社交网络中的事件传播分析受到限制.在已有的独立级联模型的基础上,提出了一种结合用户去重、垃圾用户滤除和概率阅读的传播模型,其基本思想是对多条热点博文构成的事件进行用户去重,构建事件传播网络拓扑图,然后对其中的垃圾用户节点进行滤除,最后利用概率阅读模型进行影响传播分析.这为事件传播分析提供了思路.通过一系列实验来验证方法及模型,通过与传统的博文分析进行对比,验证了方法的正确性与有效性.
展开更多
关键词
社交网络
传播模型
影响力分析
垃圾用户
检测
概率阅读模型
下载PDF
职称材料
题名
微博垃圾用户行为研究
1
作者
高郭威
赵卫东
孙中全
机构
滁州职业技术学院
出处
《无线互联科技》
2024年第22期92-97,共6页
基金
2022年安徽省高校自然科学研究重大项目:项目编号:2022AH040332
安徽省职成教项目:项目名称:后疫情时代基于OBE理念的高职公共基础课程混合式教学模式的构建与实施:项目编号:Azcj2022178
安徽省职业与成人教育学会教育科研规划课题:项目编号:Azcj2022180。
文摘
垃圾用户作为垃圾信息的传播者,一直是微博反垃圾研究的重点,现有的垃圾用户检测研究还局限于传统的二值分类问题上,只是将用户简单地判断为垃圾用户和正常用户。然而,微博平台中的垃圾用户类型多种多样,将各类垃圾用户按照单一类别垃圾用户进行处理,会存在各类垃圾用户之间特征相互影响的问题,从而降低整体检测效果。为了解决上述问题,文章对各类垃圾用户行为进行了分析。首先,根据垃圾用户的行为目的和行为模式,将垃圾用户分为4类;其次,通过爬虫程序获取数据集,构造特征分析样本集并进行标注,计算用户的各项统计特征;最后,对4类垃圾用户的特征进行定量分析,归纳总结出每类用户的特点。实验结果表明,各类垃圾用户与正常用户之间存在区分度较高的相关特征,利用这些特征能够有效区分各种垃圾用户与正常用户,提升检测精度。
关键词
微博
垃圾用户
用户
行为
用户
分类
Keywords
Weibo
spammer
user behavior
user classification
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
微博中基于统计特征与双向投票的垃圾用户发现
被引量:
11
2
作者
丁兆云
周斌
贾焰
汪祥
机构
国防科学技术大学信息系统与管理学院
国防科学技术大学信息系统工程重点实验室
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第11期2336-2348,共13页
基金
国家自然科学基金项目(60933005
91124002
+9 种基金
61302144)
国家"八六三"高技术研究发展计划基金项目(2010AA012505
2011AA010702
2012AA01A401
2012AA01A402)
国家科技支撑计划基金项目(2012BAH38B04
2012BAH38B06)
国家"二四二"信息安全计划基金项目(2011A010)
国家"九七三"重点基础研究发展计划基金项目(2013CB329601
2013CB329601)
文摘
传统微博中垃圾用户发现主要依靠用户的显示统计特征.针对微博中关注网络的有向特性,给出了有向网络中局部三角形数量统计算法DirTriangleC,结合用户博文数量和局部三角形比例发现隐式垃圾用户;针对统计特征方法对垃圾用户误报和漏报的缺点,提出了基于统计特征与双向投票算法AttriBiVote,利用用户信任的双向传播与其邻居节点的统计特征共同决定用户类别.真实的Twitter数据集上验证了DirTriangleC和AttriBiVote算法的有效性,结果表明DirTriangleC算法能够发现约83.7%的"完全非活跃"状态的隐式垃圾用户,相对依靠显示统计特征方法增加了约2倍数量的疑似垃圾用户;同时AttriBiVote算法发现垃圾用户的数量和准确性均高于依靠统计特征的垃圾用户发现方法;最后实验分析了AttriBiVote算法的时间开销.
关键词
垃圾用户
信任传播
三角形统计
微博
社会网络
Keywords
spammer trust propagation triangle counting microblog social networks
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于微博重复发送的垃圾用户甄别
被引量:
1
3
作者
吴斌
李冠辰
刘宇
张雷
王柏
机构
北京邮电大学计算机科学学院
出处
《数据采集与处理》
CSCD
北大核心
2015年第1期117-125,共9页
基金
国家自然科学基金重点(71231002)资助项目
北京市教育委员会共建项目专项基金资助项目
文摘
针对微博平台上的垃圾用户甄别问题,本文提出了基于微博重复发送行为的垃圾用户行为建模和甄别算法。在真实微博垃圾用户数据分析的基础上,本建模方法综合考虑了微博垃圾用户的行为信息、社交网络信息和文本信息,从不同的角度对垃圾用户进行了分析和建模。在真实数据集上的实验证明了方法的有效性,并且对模型中若干参数进行了优化,同时也分析了垃圾用户行为信息、社交网络信息和文本信息对模型的影响程度。
关键词
垃圾用户
检测
微博重复发送
主题模型
Keywords
spammer detection
duplicate microblog post
topic model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
点评网站中垃圾用户识别研究
被引量:
1
4
作者
王亚
机构
许昌学院信息工程学院
出处
《电脑知识与技术》
2020年第13期214-216,共3页
基金
河南省高等院校重点科研项目(19A520036)
许昌学院校级科研项目(2020YB017)。
文摘
点评网站作为一种新兴的网络交流平台,目前存在着大量垃圾用户,他们发布的虚假垃圾评论信息误导了消费者的选择,引起不正当的市场竞争。本文基于机器学习的分类方法,对点评网站的垃圾用户进行研究,提出了基于用户评论频度的垃圾用户检测模型和基于用户评论情感度的垃圾用户检测模型,并将模型融合进行模型训练,以最大限度提高识别垃圾用户的有效性。实验表明,本文提出的方法对垃圾用户识别的准确率最高可达70%。
关键词
垃圾用户
用户
评论频度
用户
评论情感度
情感词库
逻辑回归
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
TP391.1 [自动化与计算机技术—计算机应用技术]
F274 [经济管理—企业管理]
下载PDF
职称材料
题名
中文微博客的垃圾用户检测
被引量:
9
5
作者
李赫元
俞晓明
刘悦
程学旗
程工
机构
中国科学院计算技术研究所
中国科学院大学
国家计算机网络应急技术处理协调中心
出处
《中文信息学报》
CSCD
北大核心
2014年第3期62-67,74,共7页
基金
国家自然科学基金(61100083)
国家863计划基金(2012AA011003)
+1 种基金
国家242专项(2011F45
2011F65)
文摘
微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征具有较好的区分度。
关键词
微博客
垃圾用户
检测
Keywords
Micro-blogs
spare
detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于新浪微博的社交网络垃圾用户分析与检测
被引量:
3
6
作者
孟祥飞
徐路
王思雨
机构
中国民航大学计算机学院
出处
《科技与创新》
2014年第15期125-127,共3页
文摘
随着信息技术和互联网的飞速发展,社交网络在人们生活中扮演着不可替代的角色。但同时,社交网络中也充斥着各种各样的广告信息,严重影响了用户的体验。一些营销团队恶意注册的大量垃圾账号也让正常用户不胜其烦。针对这些问题,首先阐述了社交网络垃圾用户产生的原因,进而分析了垃圾用户的特征,最后基于新浪微博的数据,使用C4.5决策树分类算法对用户进行分类。实验结果显示,该方法检测用户的准确率为92%.
关键词
社交网络
新浪微博
垃圾用户
分类
Keywords
OSN
Sina Weibo
spam account
classify
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种多分类的微博垃圾用户检测方法
被引量:
1
7
作者
杨云
徐光侠
雷娟
机构
国网重庆市电力公司信息通信分公司
重庆大学博士后流动站
国网重庆市电力公司电力科学研究院
出处
《重庆大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第8期44-55,共12页
基金
国家自然科学基金项目(61772099)
中国博士后基金(2014M562282)
+2 种基金
重庆市博士后项目(XM2014039)
重庆市人工智能技术创新重大主题专项(cstc2017rgzn-zdyf0140)
重庆市高校优秀成果转化资助项目(KJZH17116)~~
文摘
针对微博多类垃圾用户的检测问题,设计了一种基于模糊多类支持向量机的垃圾用户检测方法。首先,采用一对多SVM(support vector machines)的构造思想来构造多分类器,并针对每类用户的分类器重新选择训练集;然后,利用构造好的训练集来训练多分类器,经过反复调整参数,得到5个用户分类器;最后,针对多分类器的不可分样本,采用模糊聚类来进行模糊处理,即在垂直于SVM的最优分类面上定义一个改进的隶属度函数,选择最大隶属度对样本进行再分类。实验结果表明,该方法在保证垃圾用户检测效果的前提下,可以解决多分类中存在的混分和漏分问题。
关键词
微博
垃圾用户
检测
多分类
模糊处理
隶属度函数
Keywords
microblog spammer detection
multi-classification
fuzzy processing
degree of membership function
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于岭回归极限学习机的微博垃圾用户分类
被引量:
1
8
作者
张瑶瑶
朱小栋
机构
上海理工大学管理学院
出处
《计算机与数字工程》
2021年第11期2326-2330,共5页
文摘
通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类。对于原本就信息过载,信息质量层次不齐的社交网络,具有一定的借鉴意义。
关键词
微博
垃圾用户
ELM
岭回归
深度学习
分类
Keywords
spammers
ELM
ridge regression
deep learning
classification
分类号
G254.12 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于多视图融合的微博垃圾用户检测方法
被引量:
1
9
作者
杨晓晖
梁笑
机构
河北大学网络空间安全与计算机学院
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2020年第12期125-134,共10页
基金
国家重点研发计划项目(2017YFB0802300)。
文摘
为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。然后,构建基于线性加权函数的多视图融合决策模型,将来自各视图的分类结果进行线性加权融合,并通过最小化近似误差求得最优融合系数,进而得到最终的分类结果。在微博真实数据集上的测试结果表明,该方法能够有效检测垃圾用户,精确率和F1值较现有方法有明显提高,且在应对不平衡数据时表现出了更强的稳定性。文中还分析了不同视图对最终检测效果的影响,结果表明用户社交关系视图的作用最显著。
关键词
微博
垃圾用户
检测
线性加权函数
多视图融合
Keywords
Weibo
spammer detection
linear weighting function
multi-view fusion
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于统计特征的微博垃圾用户检测系统研究
被引量:
1
10
作者
范雨萌
易秀双
倪石建
王兴伟
机构
东北大学计算机科学与工程学院
出处
《网络空间安全》
2019年第9期20-25,共6页
基金
国家重点研发计划项目(项目编号:2017YFB0801701)
国家自然科学基金资助项目(项目编号:61572123)
+1 种基金
辽宁省高校创新团队支持计划资助项目(项目编号:LT2016007)
赛尔网络创新项目(项目编号:NGII20160616)。
文摘
微博作为国内用户规模较大的在线社交网络平台之一,面临着来自垃圾用户的困扰。垃圾用户通过微博平台发起网络攻击,污染网络环境、威胁用户隐私安全,甚至造成了经济损失,因此如何有效地检测垃圾用户是一个亟待解决的问题。目前,基于机器学习的检测方法并没有考虑时间的变化性,随着时间推移其检测性能下降。文章采用机器学习分类方法挖掘用户信息与微博信息的统计特征,基于Spark大数据平台,设计并实现了一套微博垃圾用户检测系统。该系统结合传统的离线检测与在线检测,通过在线检测解决时间的变化性问题,优化了传统离线检测的性能。文章的实验结果表明该系统离线检测部分的准确率最高可达到93.4%,在线检测部分的准确率最高可达到94.8%,均高于微博反垃圾系统的67.4%。
关键词
垃圾用户
检测
离线检测
在线检测
半监督学习检测
主动学习检测
Keywords
spammer detection
offline detection
online detection
semi-supervised learning detection
active learning detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于层次注意力机制的垃圾用户检测模型
11
作者
杨晓晖
王卫宾
机构
河北大学网络空间安全与计算机学院
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2023年第1期95-102,共8页
基金
国家重点研发计划项目(2017YFB0802300)。
文摘
目前基于网络的垃圾用户检测方法只考虑了简单社会关系,缺乏对更多复杂社会语义关系的利用,难以达到最优性能.针对这一挑战,提出一种基于层次注意力机制的垃圾用户检测模型(HAM-SD).模型首先使用异质信息网络对社交媒体进行建模,挖掘丰富的语义与结构信息,接着利用节点级注意力层聚合元路径邻居增强节点表示,同时利用自适应层级聚合模块选择不同层级特征提升表征能力,然后通过语义级注意力层融合不同元路径下的节点表示,最后带入分类检测模块实现垃圾用户检测.在公开数据集上的实验结果表明该模型能够有效检测垃圾用户,并在不平衡数据分布时保持较强的稳定性.
关键词
社交媒体
垃圾用户
检测
异质信息网络
注意力机制
Keywords
social media
spammer detection
heterogeneous information network
attention mechanism
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
新浪微博反垃圾中特征选择的重要性分析
被引量:
8
12
作者
张宇翔
孙菀
杨家海
周达磊
孟祥飞
肖春景
机构
中国民航大学计算机科学与技术学院
清华大学网络科学与网络空间研究院
清华信息科学与技术国家实验室
北京邮电大学网络技术研究院
北京航空航天大学虚拟现实技术与系统国家重点实验室
出处
《通信学报》
EI
CSCD
北大核心
2016年第8期24-33,共10页
基金
国家重点基础研究发展计划("973"计划)基金资助项目(No.2009CB320505)
国家科技支撑计划基金资助项目(No.2008BAH37B05)
+3 种基金
国家自然科学基金资助项目(No.61170211
No.U1533104
No.61301245)
教育部博士点基金资助项目(No.20110002110056)~~
文摘
微博中的垃圾用户非常普遍,其异常行为及生产的垃圾信息显著降低了用户体验。为了提高识别准确率,已有研究或是尽可能多地定义特征,或是不断尝试提出新的分类检测方法;那么,微博反垃圾问题的突破点优先置于寻找分类特征还是改进分类检测方法,是否特征越多检测效果越好,新的方法是否可以显著提高检测效果。以新浪微博为例,试图通过不同的特征选择方法与不同的分类器组合实验回答以上问题,实验结果表明特征组的选择较分类器的改进更为重要,需从内容信息、用户行为和社会关系多侧面生成特征,且特征并非越多检测效果越好,这些结论将有助于未来微博反垃圾工作的突破。
关键词
新浪微博
特征生成
特征选择
垃圾用户
检测
Keywords
Sina Weibo, feature definition, feature selection, spammer detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于微博的事件传播分析
被引量:
7
13
作者
朱湘
贾焰
聂原平
曲铭
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第2期437-444,共8页
基金
国家科技支撑计划基金项目(2012BAH38B04)
国家"九七三"重点基础研究发展计划基金项目(2013CB329601)
+1 种基金
中国博士后科学基金项目(2013M542560)
国家自然科学基金项目(61202362)
文摘
事件的传播分析是社交网络分析中一个重要的研究点.网络热点事件的爆发通过社交网络迅速传播,从而在短时间内造成很大的影响.而在社交网络中制造舆论热点进行传播的代价相对于传统媒介较低,因此很容易被不法分子利用,对社会安全以及人们财产造成损失.传统的影响传播分析仅能对单条博文进行影响传播分析,这使社交网络中的事件传播分析受到限制.在已有的独立级联模型的基础上,提出了一种结合用户去重、垃圾用户滤除和概率阅读的传播模型,其基本思想是对多条热点博文构成的事件进行用户去重,构建事件传播网络拓扑图,然后对其中的垃圾用户节点进行滤除,最后利用概率阅读模型进行影响传播分析.这为事件传播分析提供了思路.通过一系列实验来验证方法及模型,通过与传统的博文分析进行对比,验证了方法的正确性与有效性.
关键词
社交网络
传播模型
影响力分析
垃圾用户
检测
概率阅读模型
Keywords
social network
propagation model
influence analysis
spammer detection
probabilistic reading model
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
微博垃圾用户行为研究
高郭威
赵卫东
孙中全
《无线互联科技》
2024
0
下载PDF
职称材料
2
微博中基于统计特征与双向投票的垃圾用户发现
丁兆云
周斌
贾焰
汪祥
《计算机研究与发展》
EI
CSCD
北大核心
2013
11
下载PDF
职称材料
3
基于微博重复发送的垃圾用户甄别
吴斌
李冠辰
刘宇
张雷
王柏
《数据采集与处理》
CSCD
北大核心
2015
1
下载PDF
职称材料
4
点评网站中垃圾用户识别研究
王亚
《电脑知识与技术》
2020
1
下载PDF
职称材料
5
中文微博客的垃圾用户检测
李赫元
俞晓明
刘悦
程学旗
程工
《中文信息学报》
CSCD
北大核心
2014
9
下载PDF
职称材料
6
基于新浪微博的社交网络垃圾用户分析与检测
孟祥飞
徐路
王思雨
《科技与创新》
2014
3
下载PDF
职称材料
7
一种多分类的微博垃圾用户检测方法
杨云
徐光侠
雷娟
《重庆大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
1
下载PDF
职称材料
8
基于岭回归极限学习机的微博垃圾用户分类
张瑶瑶
朱小栋
《计算机与数字工程》
2021
1
下载PDF
职称材料
9
基于多视图融合的微博垃圾用户检测方法
杨晓晖
梁笑
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2020
1
下载PDF
职称材料
10
基于统计特征的微博垃圾用户检测系统研究
范雨萌
易秀双
倪石建
王兴伟
《网络空间安全》
2019
1
下载PDF
职称材料
11
基于层次注意力机制的垃圾用户检测模型
杨晓晖
王卫宾
《河北大学学报(自然科学版)》
CAS
北大核心
2023
0
下载PDF
职称材料
12
新浪微博反垃圾中特征选择的重要性分析
张宇翔
孙菀
杨家海
周达磊
孟祥飞
肖春景
《通信学报》
EI
CSCD
北大核心
2016
8
下载PDF
职称材料
13
基于微博的事件传播分析
朱湘
贾焰
聂原平
曲铭
《计算机研究与发展》
EI
CSCD
北大核心
2015
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部