-
题名融合边特征与注意力的表格结构识别模型
被引量:1
- 1
-
-
作者
吕学强
张煜楠
韩晶
崔运鹏
李欢
-
机构
网络文化与数字传播北京市重点实验室(北京信息科技大学)
农业农村部农业大数据重点实验室(中国农业科学院农业信息研究所)
-
出处
《计算机应用》
CSCD
北大核心
2023年第3期752-758,共7页
-
基金
国家自然科学基金资助项目(62171043)。
-
文摘
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点。在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务。
-
关键词
图神经网络
图注意力网络
特征融合
表格结构识别
表格解析
-
Keywords
graph neural network
graph attention network
feature fusion
table structure recognition
table parsing
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于半监督学习的无线网络攻击行为检测优化方法
被引量:41
- 2
-
-
作者
王婷
王娜
崔运鹏
李欢
-
机构
中国农业科学院农业信息研究所
农业农村部农业大数据重点实验室(中国农业科学院农业信息研究所)
[
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第4期791-802,共12页
-
基金
国家自然科学基金项目(61672101)
中国农业科学院基本科研业务费院级项目(Y2020XC15)。
-
文摘
针对如何优化深度学习技术在海量高维复杂的无线网络流量数据中有效发现异常攻击行为的问题,提出一种基于半监督学习的无线网络攻击行为检测优化方法(WiFi network attacks detection optimization method,WiFi-ADOM).首先基于无监督学习模型栈式稀疏自编码器提出2种网络流量特征表示向量:新特征值向量和原始特征权重值向量.然后利用原始特征权重值向量初始化监督学习模型深度神经网络的权重值得到网络攻击类型的预判结果,并通过无监督学习聚类方法Bi-kmeans对网络流量的新特征值向量进行聚类以生成未知攻击类型判别纠正项.最后结合预判结果和未知攻击类型判别纠正项,得到网络攻击类型的最终判定结果.通过和已有研究方法对比,在公开无线网络攻击行为数据集AWID上验证了WiFi-ADOM方法对网络攻击行为检测的优化性能,同时探索了与网络攻击检测相关的重要特征属性的问题.实验结果表明:WiFi-ADOM方法在保证准确率等检测性能的同时能够有效检测未知攻击类型,具备优化网络攻击行为检测的能力.
-
关键词
网络攻击行为检测
网络入侵检测
半监督学习
深度学习
Bi-kmeans聚类
-
Keywords
network attacks detection
network intrusion detection
semi-supervised learning
deep learning
Bi-kmeans clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-