基于预训练模型和中英文威胁情报的TTP识别方法研究

Research on TTP Extraction Method Based on Pre-Trained Language Model and Chinese-English Threat Intelligence

下载PDF

导出

摘要 TTP情报主要存在于非结构化的威胁报告中,是一种具有重要价值的网络威胁情报。然而,目前开源的TTP分类标签数据集主要集中在英文领域,涵盖的语料来源与TTP种类较为有限,特别是缺乏中文领域的相关数据。针对该情况,文章构建了一个中英文TTP情报数据集BTICD,该数据集包含17700条样本数据与236种对应的TTP。BTICD首次利用了公开的中文威胁报告语料进行TTP标注,且标注了一部分无法映射到任何一种TTP的白样本数据。文章基于预训练模型构建,并在该双语数据集上微调得到双语TTP识别模型SecBiBERT。实验结果表明,SecBiBERT在50种常见TTP分类任务上的Micro F1分数达到86.49%,在全量236类TTP分类任务上Micro F1分数达到73.09%,识别性能表现良好。 The tactics,techniques,and procedures (TTP) intelligence primarily resides in unstructured threat reports and serves as a valuable source of cyber threat intelligence.However,the existing open-source TTP classification label datasets are predominantly focused on the English domain,with limited coverage of source materials and TTP types,particularly lacking relevant data in the Chinese domain.To address this issue,this paper constructed a bilingual TTP intelligence dataset,bilingual threat intelligence classifying dataset (BTICD),which included 17700 samples and 236 corresponding TTPs.BTICD was the first to utilize publicly available Chinese threat report as corpora for TTP annotation and also annotated a portion of white-box samples that cannot be mapped to any TTP.This paper introduced and fine-tuned pre-trained models on the bilingual dataset to obtain a bilingual TTP identification model SecBiBERT.Experimental results show that SecBiBERT achieves a Micro F1 score of 86.49% on the 50 common TTP classification tasks and a Micro F1 score of 73.09% on the full set of 236 TTP classification tasks,which outperforms existing similar models.

作者任昌禹张玲姬航远杨立群 REN Changyu;ZHANG Ling;JI Hangyuan;YANG Liqun(State Key Laboratory of Complex&Critical Software Environment,Beihang University,Beijing 100083,China;School of Electrical Engineering,Zhengzhou University,Zhengzhou 450001,China;School of Cyber Science and Technology,Beihang University,Beijing 100083,China)

机构地区北京航空航天大学复杂关键软件环境全国重点实验室郑州大学电气与信息工程学院北京航空航天大学网络空间安全学院

出处《信息网络安全》 CSCD 北大核心 2024年第7期1076-1087,共12页 Netinfo Security

基金国家自然科学基金[U2333205,62302025,62276017] 国家电网有限公司技术研发项目[5108-202303439A-3-2-ZN] 2022年度CCF-绿盟科技鲲鹏科研基金,上海可信工控平台开放项目[CCF-NSFOCUS202210]。

关键词 TTP 威胁情报预训练模型 TTP threat intelligence pre-trained language model

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1孙红哲,王坚,王鹏,安雨龙.基于Attention-BiTCN的网络入侵检测方法[J].信息网络安全,2024(2):309-318. 被引量：4
2吴尚远,申国伟,郭春,陈意.威胁情报驱动的动态威胁狩猎方法[J].信息网络安全,2023(6):91-103. 被引量：2
3Yizhe You,Jun Jiang,Zhengwei Jiang,Peian Yang,Baoxu Liu,Huamin Feng,Xuren Wang,Ning Li.TIM: threat context-enhanced TTP intelligence mining on unstructured threat data[J].Cybersecurity,2022,5(2):10-26. 被引量：5

二级参考文献10

1夏景明,李冲,谈玲,周刚.改进的随机森林分类器网络入侵检测方法[J].计算机工程与设计,2019,40(8):2146-2150. 被引量：42
2朱铭康,卢先领.基于Bi-LSTM-Attention模型的人体行为识别算法[J].激光与光电子学进展,2019,56(15):145-153. 被引量：14
3蹇诗婕,卢志刚,杜丹,姜波,刘宝旭.网络入侵检测技术综述[J].信息安全学报,2020,5(4):96-122. 被引量：74
4李俊,夏松竹,兰海燕,李守政,孙建国.基于GRU-RNN的网络入侵检测方法[J].哈尔滨工程大学学报,2021,42(6):879-884. 被引量：32
5张昊,张小雨,张振友,李伟.基于深度学习的入侵检测模型综述[J].计算机工程与应用,2022,58(6):17-28. 被引量：17
6张安琳,张启坤,黄道颖,刘江豪,李建春,陈孝文.基于CNN与BiGRU融合神经网络的入侵检测模型[J].郑州大学学报（工学版）,2022,43(3):37-43. 被引量：17
7陶志勇,闫明豪,刘影.基于时序卷积网络的信道编码闭集识别[J].华中科技大学学报（自然科学版）,2022,50(3):12-17. 被引量：5
8生龙,袁丽娜,武南南,姬少培.基于GSA与DE优化混合核ELM的网络异常检测模型[J].计算机工程,2022,48(6):146-153. 被引量：9
9冷涛,蔡利君,于爱民,朱子元,马建刚,李超飞,牛瑞丞,孟丹.基于系统溯源图的威胁发现与取证分析综述[J].通信学报,2022,43(7):172-188. 被引量：9
10沈记全,魏坤.融合残差网络的CR-BiGRU入侵检测模型[J].吉林大学学报（理学版）,2023,61(2):353-361. 被引量：7

共引文献8

1吴沛颖,王俊峰,崔泽源,范晓宇,葛文翰,林同灿,余坚,唐宾徽.网络威胁情报处理方法综述[J].四川大学学报（自然科学版）,2023,60(5):1-18. 被引量：2
2李沁东,陈兴蜀,唐文佚.开源威胁情报生产与应用综述[J].网络空间安全科学学报,2023,1(1):59-80.
3任华新.云边环境下微服务通信网络入侵行为识别方法[J].通信电源技术,2024,41(9):139-141.
4曾庆瑞.一种基于CNN-GRU模型的局域网入侵检测方法[J].电子元器件与信息技术,2024,8(4):111-115.
5于丰瑞.网络威胁技战术情报自动化识别提取研究综述[J].计算机工程与应用,2024,60(13):1-22.
6马冰琦,周盈海,王梓宇,田志宏.一种基于大语言模型的威胁情报信息抽取方法[J].网络空间安全科学学报,2024,2(2):36-46.
7李金戈,丁宇征,杨如峰,马依梵,姜丽敏,贺文轩.工业隔离网的安全防御研究[J].网络安全技术与应用,2024(8):9-12.
8杜慧珺,王安洋,刘越,董洋,袁传新.基于深度学习算法的无线通信网络入侵路径辨识[J].无线互联科技,2024,21(15):39-41.

1钟海英.一种基于微服务的企业数据中台系统的研究[J].今日自动化,2024(5):157-159.
2武艳秋.互联网+背景下燃气管网巡维管理及智能化改造研究[J].智能城市,2024,10(7):92-94.
3赵荣超.相控阵天线自动测试系统设计分析[J].中文科技期刊数据库（文摘版）工程技术,2024(8):0091-0094.
4黄娟,张浩,周彬彬.基于12345热线诉求的江苏科技人才服务数据的分析与研究[J].江苏科技信息,2024,41(14):17-21.
5张宁,贾焦心,李博强,石征.计及碳交易的电-气耦合型虚拟电厂运行策略优化研究[J].电测与仪表,2024,61(8):20-28.
6李俊华.泛智慧环境下小学数学高效教学策略[J].课堂内外（初中版）,2024(32):94-96.
7段伟,谢笛,许凯,彭勇,胡越,谢旭.国家重大工程项目牵引的产学研协同育人路径与方法[J].大学教育,2024(13):114-118.
8王强.新媒体背景下思政元素融入专业课程教学路径研究[J].新闻研究导刊,2024,15(13):190-192.
9简冠群,冯浩文.数字化高端赋能制造业绿色发展的逻辑和实践——黄河流域多元异质性下的探索性案例研究[J].管理学刊,2024,37(3):43-59.
10熊回香,詹晓敏,郑晓威.基于KANO-QFD集成方法的健康网站信息服务质量优化研究[J].情报理论与实践,2024,47(8):160-170.

信息网络安全

2024年第7期

浏览历史

内容加载中请稍等...

基于预训练模型和中英文威胁情报的TTP识别方法研究

参考文献3

二级参考文献10

共引文献8

相关作者

相关机构

相关主题

浏览历史