基于结构深度网络嵌入模型的节点标签分类算法被引量：2

Node Label Classification Algorithm Based on Structural Depth Network Embedding Model

下载PDF

导出

摘要在海量数据呈现爆炸增长态势的互联网时代,传统算法已无法满足处理大规模、多类型数据的需求。近年来最新的图嵌入算法通过学习图网络特征,在链路预测、网络重构和节点分类实践中普遍取得了极佳的效果。文中基于传统自动编码器模型,创新地提出了一种融合Sdne算法与链路预测相似度矩阵的新算法,通过在反向传播过程中引入高阶损失函数,依据自编码器的新特征调整性能,改进传统算法中以单一方式判定节点相似度这一方法存在的弊端,并建立简易模型分析证明优化的合理性。对比最新研究中效果最好的Sdne算法,该算法在Micro-F1和Macro-F1两种评价指标上的提升效果均接近1%,可视化分类效果表现良好。与此同时,研究发现高阶损失函数超参的最优值大致处于1~10范围内,数值的变化依旧能够基本稳定维持整体网络的鲁棒性。 In the era of Internet,where massive data is growing explosively,traditional algorithms have been unable to meet the needs of processing large-scale and multi type data.In recent years,the latest graph embedding algorithm has achieved excellent results in link prediction,network reconstruction and node classification by learning graph network characteristics.Based on the traditional automatic encoder model,a new algorithm combining Sdne algorithm and link prediction similarity matrix is proposed.By introducing a high-order loss function in the process of back-propagation,the performance is adjusted according to the new characteristics of the auto-encoder.The disadvantages of traditional algorithm in determining node similarity in a single way are improved.A simple model is established to analyze and prove the rationality of the optimization.Compared with the most effective Sdne algorithm in the latest research,the improvement effect of this algorithm on Micro-F1and Macro-F1two evaluation indicators is close to 1%,and the visual classification effect is good.At the same time,it is found that the optimal value of the hyperparameter of the higher-order loss function is approximately in the range of 1~10,and the change of the numerical value can basically maintain the robustness of the whole network.

作者陈世聪袁得嵛黄淑华杨明 CHEN Shi-cong;YUAN De-yu;HUANG Shu-hua;and YANG Ming(School of Information and Cyber Security,People’s Public Security University of China,Beijing 100038,China;Key Laboratory of Safety Precautions and Risk Assessment,Ministry of Public Security,Beijing 100038,China)

机构地区中国人民公安大学信息网络安全学院安全防范与风险评估公安部重点实验室

出处《计算机科学》 CSCD 北大核心 2022年第3期105-112,共8页 Computer Science

基金国家社会科学基金重点项目(20AZD114) 中国人民公安大学基本科研业务费项目(2021JKF215) 中国人民公安大学公共安全行为科学实验室开放课题(2020SYS03) 警务物联网应用技术公安部重点实验室开放课题。

关键词网络嵌入深度学习节点分类自动编码器复杂网络 Network embedding Deep learning Node classification Auto-encoder Complex network

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1唐明,朱磊,邹显春.基于Word2Vec的一种文档向量表示[J].计算机科学,2016,43(6):214-217. 被引量：137

二级参考文献28

1Baeza-Yates R,Ribeiro-Neto B.Modern Information Retrieval[M].New York:ACM press,1999.
2Manning C D,Schütze H.Foundations of Statistical NaturalLanguage Processing [M].Cambridge:MIT press,1999.
3Hwang M,Choi C,Youn B,et al.Word Sense Disambiguation Based on Relation Structure[C]∥International Conference on Advanced Language Processing and Web Information Technology.2008:15-20.
4Wang X,Mccallum A,Wei X.Topical N-Grams:Phrase andTopic Discovery,with an Application to Information Retrieval [C]∥IEEE International Conference on Data Mining.IEEE Computer Society,2007:697-702.
5Haruechaiyasak C,Jitkrittum W,Sangkeettrakarn C,et al.Im-plementing News Article Category Browsing Based on Text Categorization Technique [C]∥2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology.IEEE Computer Society,2008:143-146.
6Mikolov T,Sutskever I,Chen K,et al.Distributed Representations of Words and Phrases and their Compositionality [J].Advances in Neural Information Processing Systems,2013,26:3111-3119.
7Mikolov T,Chen K,Corrado G,et al.Efficient Estimation of Word Representations in Vector Space [C]∥ICLR 2013.2013.
8Joachims T.A Probabilistic Analysis of the Rocchio Algorithm with TFIDF for Text Categorization [M].Springer US,1997:143-151.
9Hinton G E.Learning distributed representations of concepts[C]∥Proceedings of CogSci.1986:1-12.
10Socher R,Bauer J,Manning C D,et al.Parsing with Compositional Vector Grammars [C]∥Meeting of the Association for Computational Linguistics.2013:455-465.

共引文献136

1韩佳良.浅谈综合调度与成本控制[J].城镇供水,2000(2):21-23.
2李文慧,张英俊,潘理虎.多因素影响特征选择的短文本分类方法[J].计算机系统应用,2018,27(12):216-221. 被引量：3
3殷功俊.基于词向量的向量空间模型的改进[J].现代计算机,2018,24(24):32-35. 被引量：1
4秦宇君,史存会,刘悦,俞晓明,程学旗.多源文本下结合实体的事件发现方法ESP[J].山西大学学报（自然科学版）,2019,42(1):41-50. 被引量：2
5苏良良,雷蕾,李景文,黄敏杰.基于Word2Vec技术隐性特征挖掘及潜在升级投诉用户识别研究[J].电信技术,2018(12):36-39. 被引量：1
6冯国明,张晓冬,刘素辉.基于CapsNet的中文文本分类研究[J].数据分析与知识发现,2018,2(12):68-76. 被引量：13
7郑恒毅,廖城霖,李天柱.一种面向网络长文本的话题检测方法[J].工程科学学报,2019,41(9):1208-1214. 被引量：7
8林建洪,翟建桐,徐菁.融合LDA与Word2vector的垃圾邮件过滤方法研究[J].网络安全技术与应用,2017(3):73-75. 被引量：1
9张敬谊,张亚红,李静.基于词向量特征的文本分类模型研究[J].信息技术与标准化,2017(5):71-75. 被引量：7
10陈磊,李俊.基于LF-LDA和Word2vec的文本表示模型研究[J].电子技术（上海）,2017,46(7):1-5. 被引量：4

同被引文献12

1马扬,程光权,梁星星,李妍,杨雨灵,刘忠.有向加权网络中的改进SDNE算法[J].计算机科学,2020,47(4):233-237. 被引量：4
2邱少明,於涛,杜秀丽,陈波.基于节点多属性相似性聚类的社团划分算法[J].计算机工程,2020,46(7):84-90. 被引量：6
3黄伟建,李永涛,黄远.基于混合神经网络和注意力机制的混沌时间序列预测[J].物理学报,2021,70(1):229-237. 被引量：22
4段震,余豪,赵姝,陈洁,张燕平.基于异质信息网络表示学习的引文推荐方法[J].小型微型计算机系统,2021,42(8):1591-1597. 被引量：5
5张陶,于炯,廖彬,余光雷,毕雪华.基于图嵌入与支持向量机的社交网络节点分类方法[J].计算机应用研究,2021,38(9):2646-2650. 被引量：8
6吴越,王英,王鑫,徐正祥,李丽娜.基于超图卷积的异质网络半监督节点分类[J].计算机学报,2021,44(11):2248-2260. 被引量：12
7马帅,刘建伟,左信.图神经网络综述[J].计算机研究与发展,2022,59(1):47-80. 被引量：46
8王婷,朱小飞,唐顾.基于知识增强的图卷积神经网络的文本分类[J].浙江大学学报（工学版）,2022,56(2):322-328. 被引量：8
9刘琳岚,谭镇阳,舒坚.基于图神经网络的机会网络节点重要度评估方法[J].计算机研究与发展,2022,59(4):834-851. 被引量：3
10李晓杰,崔超然,宋广乐,苏雅茜,吴天泽,张春云.基于时序超图卷积神经网络的股票趋势预测方法[J].计算机应用,2022,42(3):797-803. 被引量：5

引证文献2

1袁立宁,胡皓,刘钊.基于多通道图卷积自编码器的图表示学习[J].计算机工程,2023,49(2):150-160. 被引量：2
2陈东洋,郭进利.基于图注意力的高阶网络节点分类方法[J].计算机应用研究,2023,40(4):1095-1100.

二级引证文献2

1黄文琦,方必武,戴珍,侯佳萱,曹尚,梁凌宇,林全郴,余涛.基于多源数据图表示学习的风电出力预测方法[J].电力建设,2023,44(11):43-53.
2王柏涵,姜晓燕,范柳伊.基于深度监督隐空间构建的语义分割改进方法[J].计算机工程,2024,50(3):191-199.

1范士俊,李晶晶.浅析城市生活垃圾分类实践——以合肥市为例[J].中华环境,2021(10):64-67.
2焦连志,杨升沛.上海市生活垃圾分类实践调研分析[J].中国资源综合利用,2022,40(1):110-113. 被引量：2
3李扬,吴安彪,袁野,赵琳琳,王国仁.基于节点相似度的无监督属性图嵌入模型[J].计算机应用,2022,42(1):1-8. 被引量：2
4焦连志,杨升沛.基于上海市垃圾分类实践的“四方合力”垃圾分类推进路径研究[J].阿坝师范学院学报,2021,38(4):74-80.
5战世港.20世纪50年代北京市垃圾分类实践及经验总结[J].鄱阳湖学刊,2021(5):78-87. 被引量：1
6徐康惠,王雨淇,许慧,田珈璇,费丹艳,袁欢.智慧化垃圾分类模式现实困境与优化路径[J].创意城市学刊,2021(2):91-102.
7聚焦垃圾分类[J].中国物业管理,2021(10):5-11.
8易宪容.2022年房地产增长态势和风险分析:会出现重大逆转?[J].中国房地产金融,2022(1):16-18.
9张欣.拥抱变化一起向未来[J].现代制造,2022(4):3-3.
10曹甲昌.推进纺织品对外贸易高质量发展[J].国际贸易论坛,2021(4):31-34.

计算机科学

2022年第3期

浏览历史

内容加载中请稍等...

基于结构深度网络嵌入模型的节点标签分类算法被引量：2

参考文献1

二级参考文献28

共引文献136

同被引文献12

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于结构深度网络嵌入模型的节点标签分类算法 被引量：2

参考文献1

二级参考文献28

共引文献136

同被引文献12

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于结构深度网络嵌入模型的节点标签分类算法被引量：2