基于多信息融合表示学习的关联用户挖掘算法被引量：4

Associated Users Mining Algorithm Based on Multi-information Fusion Representation Learning

下载PDF

导出

摘要随着互联网技术的迅速发展和普及,越来越多的用户开始通过社会网络进行各种信息的分享与交流。网络中同一用户可能申请多个不同账号进行信息发布,这些账号构成了网络中的关联用户。准确、有效地挖掘社会网络中的关联用户能够抑制网络中的虚假信息和不法行为,从而保证网络环境的安全性和公平性。现有的关联用户挖掘方法仅考虑了用户属性或用户关系信息,未对网络中含有的多类信息进行有效融合以及综合考虑。此外,大多数方法借鉴其他领域的方法进行研究,如去匿名化问题,这些方法不能准确解决关联用户挖掘问题。为此,文中针对网络关联用户挖掘问题,提出了基于多信息融合表示学习的关联用户挖掘算法(Associated Users Mining Algorithm based on Multi-information fusion Representation Learning,AUMA-MRL)。该算法使用网络表示学习的思想对网络中多种不同维度的信息(如用户属性、网络拓扑结构等)进行学习,并将学习得到的表示进行有效融合,从而得到多信息融合的节点嵌入。这些嵌入可以准确表征网络中的多类信息,基于习得的节点嵌入构造相似性向量,从而对网络中的关联用户进行挖掘。文中基于3个真实网络数据对所提算法进行验证,实验网络数据包括蛋白质网络PPI以及社交网络Flickr和Facebook,使用关联用户挖掘结果的精度和召回率作为性能评价指标对所提算法进行有效性验证。结果表明,与现有经典算法相比,所提算法的召回率平均提高了17.5%,能够对网络中的关联用户进行有效挖掘。 With rapid development and popularization of Internet technologies,more and more users have begun to share and exchange various information through social networks.The same user in the network may apply for multiple diffe- rent accounts to distribute information,and these accounts constitute the associated users in the network.Effectively mining associated users in social networks can suppress false information and illegal behaviors in the network,and thus ensure the security and fairness of the network environment.Existing associated user mining methods only consider user attributes or user relationship information without merging multiple types of information contained in the network comprehensively.In addition,most methods draw lessons from the methods in other fields,such as de-anonymization,and they can’t accurately solve the problem of associated user mining.In light of this,this paper proposed an associated user mining algorithm based on multi-information fusion representation learning(AUMA-MRL).In this algorithm,the idea of network representation learning is utilized to learn various dimensional information in the networks,such as user attributes,network topology,etc.Then the learned multi-information is effectively fused to obtain multi-information node embedding,which can accurately characterize multiple types of information in networks,and mine associated users in networks through similarity vectors between node embedding.The proposed algorithm was validated on three real networks namely protein network PPI and social network Flickr,Facebook.In the experiment,the accuracy and recall rate is selected as the performance evaluation indexes.The results show that the recall rate of proposed algorithm is increased by 17.5% on average compared with the existing classical algorithms,and it can effectively mine associated users in networks.

作者韩忠明郑晨烨段大高董健 HAN Zhong-ming;ZHENG Chen-ye;DUAN Da-gao;DONG Jian(School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China;Beijing Key Laboratory of Food Safety Big Data Technology,Beijing 100048,China;The Third Research Institute of The Ministry of Public Security,The Ministry of Public Security KeyLaboratory of Information Network Security,Shanghai 200031,China)

机构地区北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室信息网络安全公安部重点实验室公安部第三研究所

出处《计算机科学》 CSCD 北大核心 2019年第4期77-82,共6页 Computer Science

基金国家自然科学基金(61170112)资助

关键词关联用户社会网络安全表示学习用户嵌入 Associatedusers Socialnetworkssecurity Representationlearning Nodeembedding

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1周小平,梁循,赵吉超,李志宇,马跃峰.面向社会网络融合的关联用户挖掘方法综述[J].软件学报,2017,28(6):1565-1583. 被引量：13

二级参考文献3

1徐钦.基于遗传算法的复杂网络节点匹配问题[J].黑龙江科技学院学报,2011,21(3):244-248. 被引量：3
2叶娜,赵银亮,边根庆,李健,何箐.模式无关的社交网络用户识别算法[J].西安交通大学学报,2013,47(12):19-25. 被引量：5
3周小平,梁循,张海燕.基于R-C模型的微博用户社区发现[J].软件学报,2014,25(12):2808-2823. 被引量：25

共引文献12

1孙波,张伟,司成祥.社交网络用户身份关联及其分析[J].北京邮电大学学报,2020,43(1):122-128. 被引量：2
2孙彬,王东.“一带一路”下的多元文化大数据体系建设研究[J].电子政务,2017(11):55-64. 被引量：1
3孙彬,王东.文明旅游的大数据体系建设研究[J].中南林业科技大学学报（社会科学版）,2017,11(5):51-57. 被引量：6
4李超男.网络模式下用户的数据挖掘算法研究[J].电脑知识与技术（过刊）,2017,23(10X):3-5.
5孙彬,王东.“一带一路”物流中心大数据体系的建设[J].中国流通经济,2017,31(8):32-40. 被引量：17
6柯阳,隋杰.基于用户特征属性的微博话题关键用户挖掘[J].计算机应用研究,2019,36(6):1614-1617. 被引量：4
7曹云.加快物流大数据建设的困难与路径分析[J].大陆桥视野,2019,0(10):38-42. 被引量：1
8周国民,宣鑫乐,沈佳琪,陈光宣.基于实体关联的消歧算法研究[J].中国电子科学研究院学报,2020,15(3):271-277. 被引量：2
9王艺霖,仲兆满,樊继冬,管燕.多异构社交网络的全局建模及应用例证[J].数据采集与处理,2020,35(6):1134-1146.
10沈佳琪,周国民.跨社交网络的同一用户识别算法[J].电子技术应用,2022,48(1):109-114. 被引量：2

同被引文献30

1宁亚辉,樊兴华,吴渝.基于领域词语本体的短文本分类[J].计算机科学,2009,36(3):142-145. 被引量：41
2漆玉虎,郭进利.超网络研究[J].上海理工大学学报,2013,35(3):227-239. 被引量：11
3张鑫,李荣,黄玉晓,唐军卫,刘松.OSAHS对冠心病合并高血压患者动态血压及心率变异性的影响[J].中西医结合心脑血管病杂志,2014,12(1):35-37. 被引量：18
4黄微,高俊峰,李瑞,周姗姗.Folksonomy中Tag语义距离测度与可视化研究[J].现代图书情报技术,2014(7):64-70. 被引量：8
5石伟杰,徐雅斌.微博用户兴趣发现研究[J].现代图书情报技术,2015(1):52-58. 被引量：8
6王传清,毕强.超网络视域下的数字资源深度聚合研究[J].情报学报,2015,34(1):4-13. 被引量：11
7张菀桐,胡元会,朱宝琛,褚瑜光,宋庆桥,杜柏,李偲偲.冠心病合并高血压患者血压水平与血栓形成动力学相关性研究[J].现代中西医结合杂志,2016,25(2):129-131. 被引量：23
8陈平华,陈传瑜,洪英汉.一种结合关联规则的协同过滤推荐算法[J].小型微型计算机系统,2016,37(2):287-292. 被引量：15
9朱国进,李承前.网络知识资源表示学习模型[J].智能计算机与应用,2016,6(3):5-10. 被引量：1
10田博,凡玲玲.基于交互行为的在线社会网络社区发现方法研究[J].情报杂志,2016,35(11):183-188. 被引量：7

引证文献4

1肖璐,赵之辉,陈果.全局视角下的网络社区多元知识关联挖掘[J].图书情报工作,2020,64(6):100-107. 被引量：3
2宋毅.基于深度学习挖掘用户搜索主题研究[J].计算机技术与发展,2021,31(1):43-47.
3胡昕彤,沙朝锋,刘艳君.基于随机投影和主成分分析的网络嵌入后处理算法[J].计算机科学,2021,48(5):124-129. 被引量：2
4邵忻.基于用户兴趣挖掘技术的微博信息推送应用研究[J].电脑编程技巧与维护,2021(6):152-153. 被引量：1

二级引证文献6

1卢艳秋,宋昶,王向阳.双元创新平衡战略下的企业知识耦合[J].图书情报工作,2021,65(15):61-70. 被引量：5
2郑苏苏,关东海,袁伟伟.融合不完整多视图的异质信息网络嵌入方法[J].计算机科学,2021,48(9):68-76. 被引量：1
3陈骁.一种基于数据挖掘技术的科技政策信息推送算法[J].数字技术与应用,2022,40(1):41-43. 被引量：1
4易明,刘明,冯翠翠.融合异质信息网络表示学习的跨领域推荐研究[J].情报学报,2022,41(4):337-349. 被引量：5
5卢恒,张向先,闫伟,王婉,程子轩.基于UGC知识类聚的虚拟学术社区分面式导航服务研究[J].情报理论与实践,2022,45(8):169-177. 被引量：3
6王建琴.基于改进决策树的数据挖掘与分析算法设计[J].电子设计工程,2024,32(4):84-88.

1本刊编辑部.中华眼视光学与视觉科学杂志利益冲突申明著录要求[J].中华眼视光学与视觉科学杂志,2019,21(2):146-146.
2励展再度折桂——德国AUMA公布2017年全球展览公司收入榜单[J].中国会展,2017,0(21):81-81.
3德国AUMA发布2017年德国商业展览评估报告[J].中国会展,2018,0(17):22-22.
4王金峰,李世良,王明,罗星宇,张雪玉.基于Python的关于Flickr图片网站的爬虫[J].中小企业管理与科技,2019,3(2):182-183. 被引量：4
5张振国,王超,温延龙,袁晓洁.基于相似性连接的时间序列Shapelets提取[J].计算机研究与发展,2019,56(3):594-610. 被引量：3
6李盛兰,吴庆祥.图像处理经典算法在农作物病害识别中的应用[J].电脑知识与技术,2018,14(11Z):195-196.
7周昀锴.机器学习及其相关算法简介[J].科技传播,2019,11(6):153-154. 被引量：9
8殷强,袁雪.总统影像的视觉修辞:对白宫Flickr网站图片的分析[J].国际新闻界,2018,40(12):137-143. 被引量：1
9付晓.德国数字化虚拟信息无法取代交易会[J].中国会展,2019,0(3):20-20.
10李毅,张卫东,杨栋.TD-LTE移动终端工程参数获取实验与分析[J].现代电子技术,2019,42(5):1-5. 被引量：1

计算机科学

2019年第4期

浏览历史

内容加载中请稍等...

基于多信息融合表示学习的关联用户挖掘算法被引量：4

参考文献1

二级参考文献3

共引文献12

同被引文献30

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于多信息融合表示学习的关联用户挖掘算法 被引量：4

参考文献1

二级参考文献3

共引文献12

同被引文献30

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于多信息融合表示学习的关联用户挖掘算法被引量：4