题名 基于节点多关系的社团挖掘算法及其应用
被引量:1
1
作者
周琳
肖玉芝
刘鹏
秦有鹏
机构
青海师范大学 计算机学院
青海 省藏文 信息 处理 与机器翻译重点 实验室 (青海师范大学 )
藏文 信息 处理 教育部 重点 实验室 (青海师范大学 )
出处
《计算机应用》
CSCD
北大核心
2023年第5期1489-1496,共8页
基金
国家自然科学基金资助项目(61763041)
青海省重点研发计划项目(2020⁃GX⁃112)。
文摘
为度量多关系节点相似性、挖掘具有多关系节点的社团结构,提出基于节点多关系的社团挖掘算法LSL-GN。首先基于节点相似性和节点可达性刻画具有多关系的节点相似性度量指标LHN-ISL;然后利用该指标重构目标网络的低密度模型,并结合GN(Girvan-Newman)算法完成社团划分。将LSL-GN算法与多个经典社团挖掘算法在模块度(Q)、标准化互信息(NMI)和调整兰德指数(ARI)上进行对比,结果显示LSL-GN算法在3个指标上均优于经典算法,说明它的社团划分质量相对较好。将LSL-GN应用于“用户-应用”的移动漫游网络模型中,划分出了以携程旅行、高德地图、滴滴出行等为基础应用的社团结构,而这些社团划分结果可为设计个性化套餐业务提供策略参考信息。
关键词
社团挖掘
社团划分
社团检测
复杂网络
移动漫游网络
节点相似性
节点可达性
Keywords
community mining
community division
community detection
complex network
mobile roaming network
node similarity
node reachability
分类号
TP311.3
[自动化与计算机技术—计算机软件与理论]
题名 基于邻节点和关系模型优化的网络表示学习
被引量:14
2
作者
冶忠林
赵海兴
张科
朱宇
肖玉芝
机构
青海师范大学 计算机学院
陕西师范大学 计算机科学学院
藏文 信息 处理 教育部 重点 实验室 (青海师范大学 )
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第12期2562-2577,共16页
基金
国家自然科学基金项目(11661069,61763041,11801296)
长江学者和创新研究团队项目(IRT_15R40)
+1 种基金
青海省自然科学基金项目(2017-ZJ-949Q)
中央高校基本科研业务费专项资金项目(2017TS045)~~
文摘
网络表示学习旨在于将网络的拓扑结构、节点内容和其他信息嵌入到低维度的向量空间中,从而为网络数据挖掘、链路预测和推荐系统提供一种有效的工具.然而,现有的基于神经网络的表示学习算法即忽略了上下文节点的位置信息,又忽略了节点与文本之间的语义关联.因此,基于以上2点,提出了一种新颖的基于邻节点和关系模型优化的网络表示学习算法(network representation learning algorithm using the optimizations of neighboring vertices and relation model,NRNR).首先,该算法首次采用当前节点的邻居节点优化网络表示学习模型,使得上下文窗口中节点的位置信息被嵌入到网络表示中;其次,该算法首次引入知识表示学习中的关系模型建模节点之间的结构特征,使得节点之间的文本内容以关系约束的形式嵌入到网络表示中;再次,NRNR提出了一种可行且有效的网络表示联合学习框架,将上述2种目标融入到一个统一的优化目标函数中.实验结果表明:NRNR算法在网络节点分类任务中优于各类对比算法,在网络可视化中,NRNR算法学习得到的网络表示展现出了明显的聚类边界.
关键词
网络表示学习
网络嵌入
网络表示
节点向量
网络特征学习
Keywords
network representation learning
network embedding
network representation
vertex vector
network feature learning
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
题名 唐诗宋词中的超网络特性分析
被引量:3
3
作者
王高杰
冶忠林
赵海兴
朱宇
孟磊
机构
青海师范大学 数学与统计学院
青海 省藏文 信息 处理 与机器翻译重点 实验室 (青海师范大学 )
藏文 信息 处理 教育部 重点 实验室 (青海师范大学 )
青海师范大学 计算机学院
出处
《计算机应用》
CSCD
北大核心
2021年第8期2432-2439,共8页
基金
国家自然科学基金资助项目(11661069,61663041)
青海省自然科学基金青年项目(2021-ZJ-946Q)
青海师范大学自然科学中青年科研基金资助项目(2020QZR007)。
文摘
目前,唐诗宋词在文学角度的研究成果较多,然而采用基于超图的超网络方法对唐诗宋词进行研究的成果较少,且仅有的这种研究局限于对字频和词频的研究。采用超网络数据分析方法对唐诗宋词进行分析研究有助于探索传统文学角度无法涉及的广度,也有助于发现唐诗宋词所折射出来的文学组词规律和时代背景。因此,首先基于全唐诗和全宋词这两个古文本语料库,分别建立了唐诗超网络和宋词超网络。在构建该超网络时,将一首诗或一首词作为超边,将唐诗中的字或宋词中的字作为超边内的节点。然后,对唐诗超网络和宋词超网络的拓扑指标和网络特性,如节点超度、节点超度分布、超边节点度、超边节点度分布,进行了实验分析,旨在发现唐代诗人和宋代词人的用字、用词和审美倾向。最后,基于李白诗词集、杜甫诗词集、苏轼诗词集、辛弃疾诗词集的诗词作品构建了作品集超网络,并计算了相关网络参数。分析结果表明,唐诗宋词超网络中的最大超度与最小超度相差较大,且其超度分布近似为幂律分布,该结果表明唐诗宋词超网络的无标度特性。另外,唐诗宋词超网络的超边节点度也存在明显的分布特性,具体来说,唐诗超网络的超边节点度较多分布在20~100,宋词超网络的超边节点度较多分布30~130。并且,通过分析发现作品集超网络具有较小的平均路径长度和较大的集聚系数,该结果反映作品集超网络具有小世界特性。
关键词
唐诗宋词
超网络
超度
超度分布
超边节点度
超边节点度分布
无标度
小世界
Keywords
Tang poems and Song lyrics
hypernetwork
hyperdegree
hyperdegree distribution
hyperedge node degree
hyperedge node degree distribution
scale-free
small world
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于高阶近似的链路预测算法
被引量:3
4
作者
杨燕琳
冶忠林
赵海兴
孟磊
机构
青海师范大学 计算机学院
青海 省藏文 信息 处理 与机器翻译重点 实验室 (青海师范大学 )
藏文 信息 处理 教育部 重点 实验室 (青海师范大学 )
陕西师范大学 计算机科学学院
出处
《计算机应用》
CSCD
北大核心
2019年第8期2366-2373,共8页
基金
国家自然科学基金资助项目(11661069,61663041,61763041)
藏文信息处理与机器翻译重点实验室项目(2013-Z-Y17)~~
文摘
目前大部分链路预测算法只研究了节点与邻居节点之间的一阶相似性,没有考虑节点与邻居的邻居节点之间的高阶相似性关系。针对此问题,提出一种基于高阶近似的链路预测算法(LP-HOPA)。首先,求出网络的归一化邻接矩阵和相似度矩阵;其次,利用矩阵分解的方法将相似度矩阵进行分解,得到网络节点的表示向量以及其上下文的表示向量;然后,通过高阶网络表示学习的网络嵌入更新(NEU)算法对原始相似度矩阵进行高阶优化,并利用归一化的邻接矩阵计算出更高阶的相似度矩阵表示;最后,在四个真实的数据集上进行大量的实验。实验结果表明,与原始链路预测算法相比,大部分利用LP-HOPA优化后的链路预测算法准确率提升了4%到50%。此外,LP-HOPA算法能够将基于低阶网络局部结构信息的链路预测算法转换为基于节点高阶特征的链路预测算法,在一定程度上肯定了基于高阶近似链路预测算法的有效性和可行性。
关键词
链路预测
高阶近似
相似度矩阵
矩阵分解
网络嵌入更新算法
Keywords
link prediction
high-order proximity approximation
similarity matrix
matrix decomposition
Network Embedding Update (NEU) algorithm
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于混合特征建模的图卷积网络方法
被引量:3
5
作者
李卓然
冶忠林
赵海兴
林晶晶
机构
青海师范大学 计算机学院
省部共建藏语智能信息 处理 及应用国家重点 实验室 (青海师范大学 )
藏文 信息 处理 教育部 重点 实验室 (青海师范大学 )
青海 省藏文 信息 处理 与机器翻译重点 实验室 (青海师范大学 )
出处
《计算机应用》
CSCD
北大核心
2022年第11期3354-3363,共10页
基金
国家重点研发计划项目(2020YFC1523300)
青海省自然科学基金资助项目(2021‑ZJ‑946Q)
青海师范大学自然科学中青年科研基金资助项目(2020QZR007)。
文摘
对于网络中拥有的复杂信息,需要更多的方式抽取其中的有用信息,但现有的单特征图神经网络(GNN)无法完整地刻画网络中的相关特性。针对该问题,提出基于混合特征的图卷积网络(HDGCN)方法。首先,通过图卷积网络(GCN)得到节点的结构特征向量和语义特征向量;然后,通过改进基于注意力机制或门控机制的聚合函数选择性地聚合语义网络节点的特征,增强节点的特征表达能力;最后,通过一种基于双通道图卷积网络的融合机制得到节点的混合特征向量,将节点的结构特征和语义特征联合建模,使特征之间互相补充,提升该方法在后续各种机器学习任务上的表现。在CiteSeer、DBLP和SDBLP三个数据集上进行实验的结果表明,与基于结构特征训练的GCN相比,HDGCN在训练集比例为20%、40%、60%、80%时的Micro‑F1值平均分别提升了2.43、2.14、1.86和2.13个百分点,Macro‑F1值平均分别提升了1.38、0.33、1.06和0.86个百分点。用拼接或平均值作为融合策略时,准确率相差不超过0.5个百分点,可见拼接和平均值均可作为融合策略。HDGCN在节点分类和聚类任务上的准确率高于单纯使用结构或语义网络训练的模型,并且在输出维度为64、学习率为0.001、2层图卷积层和128维注意力向量时的效果最好。
关键词
注意力机制
门控机制
双通道图卷积网络
结构特征
语义特征
Keywords
attention mechanism
gating mechanism
dual channel graph convolutional network
structure feature
semantic feature
分类号
TP391
[自动化与计算机技术—计算机应用技术]