-
题名基于深度语义分析的警务卷宗知识抽取
- 1
-
-
作者
马健伟
王铁鑫
江宏
陈涛
张超
李博涵
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第5期1325-1335,共11页
-
基金
国家自然科学基金面上项目(61872182)。
-
文摘
卷宗作为公安机关办案、结案的主要记录,包含大量关键的警务信息.面向警务卷宗的信息抽取是分析案情、挖掘犯罪趋势、提高治安管理水平的重要手段.卷宗类文本多由基层警务人员采用自然语言书写,关键信息抽取难度大.传统的警务卷宗信息抽取,多依赖人工及预定义模板,效率低且通用性差.针对以上问题,参考卷宗的警务特征,提出了一种基于深度语义分析的卷宗知识抽取方法.该方法包含命名实体识别与关系抽取2个核心内容.提出的命名实体识别方法,融合了汉字结构特征和字形特征;提出的关系抽取方法建立在实体识别的基础上,实现基于触发规则和触发词的2种抽取模式.在公开的微博数据集、项目合作方**市**分局的真实卷宗集上,提出的命名实体识别方法对比基线方法,在实体识别精确率及召回率上综合表现优异;自动抽取的关系也得到**分局的认可.相关信息系统已在**分局部署使用.
-
关键词
智慧警务
警务卷宗
知识抽取
命名实体识别
关系抽取
-
Keywords
smart policing
police dossier
knowledge extraction
named entity recognition(NER)
relation extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-