-
题名产业政策知识图谱的自动化构建
被引量:1
- 1
-
-
作者
揣子昂
耿骞
潘慧瑶
靳健
-
机构
北京师范大学政府管理学院信息管理系
富媒体数字出版内容组织与知识服务重点实验室
北京师范大学珠海校区政府治理研究中心
-
出处
《情报工程》
2022年第3期28-51,共24页
-
基金
富媒体数字出版内容组织与知识服务重点实验室开放基金“产业政策图谱构建研究”(ZD2021-11/04)
国家社会科学基金重点项目“面向集成管理的政府数据组织与传递机制研究”(19ATQ005)。
-
文摘
[目的/意义]为方便民众和政府工作人员快速了解产业政策中的重要内容,本研究提出了一套自动化的产业政策知识图谱构建框架,用于梳理有关政策文本。[方法/过程]具体地,考虑到中文语料的缺乏,本研究利用基于句法分析的三元组抽取模型DSNF从产业政策中抽取政策实体和关系,并结合政策分析场景的特点对结果进行调整。由于原始三元组的表达较为分散,本研究利用三元组表示模型TransP和层次聚类模型BIRCH对原始三元组进行表示和归并。[局限]当前模型的性能尚需要在更大规模的数据集上进行检验,并与已有的方法进行比较。[结果/结论]本研究调用并调整了一系列模型用于解决产业政策知识图谱构建过程中的问题,并探索了基于知识图谱的政策分析模式,具有重要的理论和实践意义。
-
关键词
产业政策
知识图谱
开放域三元组抽取
三元组表示
图数据库
-
Keywords
Industrial policy
knowledge graph
open triple extraction
triple representation
graph
-
分类号
G35
[文化科学—情报学]
TP391
[自动化与计算机技术—计算机应用技术]
-