基于Transformer的电网企业文件密点标注系统被引量：1

Annotation System of File Secret Information for Power Grid Enterprise Based on Transformer

下载PDF

导出

摘要面对海量的企业文件,单纯地凭借人工进行密点标注,不仅费时费力,其划分标准更受到人为主观意识的影响。因此,对企业文件进行自动定密是企业保密管理工作中需要迫切解决的重要问题。为此,提出一种基于Transformer的电网企业文件密点标注系统,包括文件预处理、中文分词、词向量构建和密点标注等步骤。在国网吉林省电力有限公司内部核心商密文件和普通商密文件构建的数据集上对所提出的模型进行了训练测试,结果表明,该系统准确率为97.79%,召回率为99.08%。模型达到了较高的识别效果,且其对密点信息识别准确,只有极少数密点信息未被标注,有效防止了密点信息的泄露。 In the face of a large number of enterprise files, it is time-consuming and laborious to label the encryption points simply by manual, and its division standard is affected by human subjective consciousness. It is an important issue for the automatic classification of enterprise documents, which needs to be solved urgently in enterprise confidentiality management is proposed. Therefore, a file dense point labeling system for power grid enterprises based on transformer. It includes file preprocessing, Chinese word segmentation, word vector construction and secret information annotation. The proposed model is trained and tested on the data set constructed by the internal core commercial secret files and ordinary commercial secret files of State Grid Jilin Electric Power Corporation. The accuracy is 97.79% and the recall is 99.08%, indicating that the model has achieved high recognition effect. The recognition of secret information is accurate. There are only a few secret information that have not been marked, which prevents the leakage of secret information effectively.

作者董添李广杨振宇张博于波王巍 DONG Tian;LI Guang;YANG Zhenyu;ZHANG Bo;YU Bo;WANG Wei(General Committee Office,State Grid Jilin Electric Power Supply Company,Changchun 130021,China)

机构地区国网吉林省电力有限公司党委办公室

出处《吉林大学学报（信息科学版）》 CAS 2021年第6期720-725,共6页 Journal of Jilin University（Information Science Edition）

基金国网吉林公司科技基金资助项目(522342210001)。

关键词密点标注深度学习中文分词词嵌入企业秘密 secret information annotation deep learning Chinese word segmentation word embedding enterprise secrets

分类号 TP305 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1章茜,刘厚丽.信息时代电网企业保密问题初探[J].办公室业务,2021(2):109-110. 被引量：2

二级参考文献3

1王勇超,陈瑶,郭晔.蠕虫病毒的特性及其宏观检测防治策略[J].计算机时代,2007(11):24-25. 被引量：1
2王晓磊,汪强.网络蠕虫病毒防御方法研究[J].数字技术与应用,2010,28(10):93-93. 被引量：2
3刘中涛.电力公司网络安全保密管理分析[J].办公室业务,2019,0(14):96-96. 被引量：3

共引文献1

1董添,李广,杨振宇,张博,于波,王巍.基于Transformer的电网企业文件密级分类系统[J].吉林大学学报（信息科学版）,2022,40(6):1039-1044. 被引量：2

同被引文献16

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：54
2蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：216
3云晓春,余翔湛.基于确认度失效检测算法的研究与设计[J].北京邮电大学学报,2005,28(3):10-13. 被引量：7
4牛卢璐,贾宏杰.一种适用于非侵入式负荷监测的暂态事件检测算法[J].电力系统自动化,2011,35(9):30-35. 被引量：103
5王慧芳,曹靖,罗麟.电力文本数据挖掘现状及挑战[J].浙江电力,2019,38(3):1-7. 被引量：33
6闻佳,王宏君,邓佳,刘鹏飞.基于深度学习的异常事件检测[J].电子学报,2020,48(2):308-313. 被引量：14
7邵冠宇,王慧芳,吴向宏,陆金龙,李建红,何奔腾.基于依存句法分析的电力设备缺陷文本信息精确辨识方法[J].电力系统自动化,2020,44(12):178-185. 被引量：27
8田园,原野,刘海斌,满志博,毛存礼.基于BERT预训练语言模型的电网设备缺陷文本分类[J].南京理工大学学报,2020,44(4):446-453. 被引量：14
9朱婷婷,杜一帆,李睿凡,熊永平.基于无监督方法的电力文本专业词汇识别研究[J].电力工程技术,2020,39(6):159-165. 被引量：1
10胡珊珊,肖勇,王保帅,尹家悦.基于深度学习的PCB缺陷检测研究[J].电测与仪表,2021,58(3):139-145. 被引量：23

引证文献1

1王宏刚,纪鑫,武同心,杨智伟,何禹德.基于预训练语言模型的电力领域设备缺陷检测[J].电测与仪表,2022,59(5):180-186. 被引量：5

二级引证文献5

1徐翀,王其清.面向知识获取的电力科技领域语言模型研究[J].电力信息与通信技术,2023,21(4):31-36.
2万金金,文屹,吕黔苏,张迅,范强,肖书舟,万云林.基于大数据深度挖掘电网设备缺陷体外循环的模型研制与应用[J].电力大数据,2023,26(3):61-68. 被引量：1
3彭劲樟,张再华,吴风亮,刘波,沈越,黎鹏,吴田.500 kV避雷器受潮条件下内部热点温度反演方法[J].电力科学与技术学报,2023,38(4):198-204.
4肖正光,温嘉烨,王骏东,徐国栋,周涛.融合知识图谱与熵权评价的电力设备缺陷文本检索方法[J].电力大数据,2023,26(12):62-72. 被引量：1
5张电,张凌跃,王宇,李伟,白困利.基于改进Apriori算法的电力物联设备故障安全筛选方法[J].自动化与仪器仪表,2024(9):190-194.

1保密申明[J].微电子学与计算机,2021,38(10).
2保密申明[J].微电子学与计算机,2021,38(12).
3保密申明[J].微电子学与计算机,2021,38(9).
4保密申明[J].微电子学与计算机,2021,38(8).
5保密申明[J].微电子学与计算机,2021,38(7).
6赵晓棠.信息化背景下单位保密管理工作创新思考[J].科学与信息化,2021(31):190-193.
7俞雯静,臧家宁,俞红.供电企业公文处理工作中如何做好保密工作[J].商业2.0（经济管理）,2021(13):0234-0234.
8杨静,姜赢,朱哲宇.海量标注语料库智能构建系统的设计与实现[J].现代计算机,2021,27(33):87-92.
9刘炳超,张家宁.“234”党建工作机制助推企业发展[J].中国电力企业管理,2021(30):63-63.
10智小兵.精准服务才能温暖人心深得民心[J].中国电业,2021(11):96-96.

吉林大学学报（信息科学版）

2021年第6期

浏览历史

内容加载中请稍等...

基于Transformer的电网企业文件密点标注系统被引量：1

参考文献1

二级参考文献3

共引文献1

同被引文献16

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于Transformer的电网企业文件密点标注系统 被引量：1

参考文献1

二级参考文献3

共引文献1

同被引文献16

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于Transformer的电网企业文件密点标注系统被引量：1