-
题名网络空间安全领域实体识别的数据增强方法
- 1
-
-
作者
廉龙颖
高传凯
刘兴丽
-
机构
黑龙江大学信息管理学院
黑龙江科技大学计算机与信息工程学院
-
出处
《黑龙江科技大学学报》
CAS
2024年第4期655-660,共6页
-
基金
黑龙江省省属高等学校基本科研业务费项目(2022-KYYWF-0569)
黑龙江省教育科学“十四五”规划2023年度重点课题(GJB1423098)。
-
文摘
针对网络空间安全领域标注数据成本高且难度大的问题,提出了数据增强改进方法。通过改进EDA算法,研究基于领域词典的同类型实体替换、实体保护的同词性替换、词性保护的随机插入以及语义保护的随机删除策略,采用单一策略和组合策略对小样本数据集进行数据扩充,利用BiLSTM-CRF模型进行实体识别验证。结果表明,单一策略及其组合策略能够增加数据集的规模,单一策略DER的F 1值提升比例达38.18%,组合策略EPR+PRI的F 1值提升比例达31.16%。该方法可以有效提升网络空间安全领域实体识别模型性能。
-
关键词
实体识别
数据增强
网络空间安全
-
Keywords
entity recognition
data augmentation
cyber security
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名观书三感
- 2
-
-
作者
高传凯
-
机构
山西省太原师范二附小五(
-
出处
《新作文(小学中高年级版)》
2005年第10期24-24,共1页
-
文摘
夜深人静,万籁俱寂,惟独我含泪独坐灯前,时而奋笔疾书,时而怒视窗外,时而凝神苦读。原来,考试才六十出头,深感羞愧,于是下定决心,回家苦读至深夜。
-
关键词
考试
凝神
窗外
羞愧
天空
读书
人类文化
五关
作者
山西省
-
分类号
G624.24
[文化科学—教育学]
-