-
题名基于大规模政府公文智能处理的知识发现及应用研究
被引量:29
- 1
-
-
作者
赵洪
王芳
王晓宇
张维冲
杨京
-
机构
南开大学商学院信息资源管理系
中电科大数据研究院有限公司
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2018年第8期805-812,共8页
-
基金
国家社会科学基金重大项目"我国网络社会治理研究"(14ZDA063)
提升政府治理能力大数据应用技术国家工程实验室2017-2018年度开放基金重点支持项目"基于NLP和深度学习的大规模政府公文智能处理技术研究"
-
文摘
政府公文是一种重要的知识资源。对公文资源的智能处理,实现公文中的知识发现,有利于促进公文的智能知识管理,提高政府公文在拟制、审批、传阅和归档等流转处理中的智能化水平和行政效能,对推进数字政府建设和提升政府治理能力都具有重要意义。但当前,鲜有面向我国政府公文智能处理和知识发现的相关研究。鉴于此,本文对该内容进行探索与研究。为实现大规模政府公文的智能处理,本文提出了政府公文的内容结构解析、主题自动标引、产生式自动摘要、重点内容提取与排序计算、面向政策/政令/行政执法文书的知识抽取与链接、基于公文的政令任务分解与责任对象自动匹配等处理流程及研究相关技术方法,并在此基础上构建知识发现系统和分析该系统的应用,也对其应用于特定类型公文中的知识发现进行了实例分析。
-
关键词
电子政务
政府公文处理
深度学习
知识发现
语义角色分析
-
Keywords
e-government
governmental documents processing
deep learning
knowledge discovery
semantic role analysis
-
分类号
D630
[政治法律—中外政治制度]
G250.7
[文化科学—图书馆学]
-
-
题名基于文本语料的涉恐事件实体属性抽取
被引量:6
- 2
-
-
作者
曹文斌
武卓峰
杨涛
凡友荣
-
机构
公安部第三研究所
上海市公安局
-
出处
《工程科学学报》
EI
CSCD
北大核心
2020年第4期500-508,共9页
-
基金
国家重点研发计划资助项目(2018YFC0830401,2018YFC0806903)
公安部第三研究所2019年基本科研业务费专项资金资助项目(C19354)
-
文摘
基于语义角色分析,提出了一种三元组涉恐事件实体属性抽取方法,为网络空间涉恐活动的监测及预警提供技术支持.首先,基于西北政法大学"反恐怖主义信息网"文本语料数据进行数据采集和清洗等预处理工作,采用朴素贝叶斯文本分类算法识别涉恐事件文本,并采用关键词提取算法TF-IDF(Term frequency-inverse document frequency,词频-逆文档频率)构建涉恐专有词库,结合自然语言处理技术构建带词性的涉恐专有词库.然后通过语义角色分析、句法依存分析,提取了主语谓语宾语关系、定语后置动宾关系、人名//地名//机构和介宾关系主谓动补4类涉恐三元组结构.最后,利用正则表达式及带词性的涉恐专有名词分析,在4类三元组短文本中提取出恐怖事件发生时间、发生地点、伤亡情况、攻击方式、武器类型和恐怖组织6类实体属性.对采集的4221篇文章数据进行实验分析,6类实体属性抽取的测评结果 F1值均超过80%,对网络空间的涉恐事件监测及预警,维护社会公共安全具有重要现实意义.
-
关键词
实体抽取
语义角色分析
三元组
朴素贝叶斯
文本分类
-
Keywords
entity extraction
semantic role analysis
triples
naive Bayes
text categorization
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-