-
题名面向学术全文本的南海维权证据知识元自动识别研究
被引量:4
- 1
-
-
作者
程为
郑轩昂
郑德俊
杨海平
王燕红
-
机构
南京农业大学信息管理学院
华东师范大学数据科学与工程学院
南京大学信息管理学院
-
出处
《情报杂志》
北大核心
2023年第9期141-148,共8页
-
基金
国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链构建研究”(编号:19ZDA347)。
-
文摘
[研究目的]自动识别出潜藏在非结构化南海维权学术全文本中的证据知识元,是完整、全面、多角度地重组织证据知识元并构建证据链、厘清我国南海维权历史过程的基础。[研究方法]根据证据的内涵及知识元语义描述模型理论,提出证据知识元的概念;分析证据知识元的描述需求,以结构化的形式定义了面向南海维权学术全文本的证据知识元表示模型,并在此基础上提出证据知识元自动识别方法;以南海维权证据知识元自动识别的实证研究验证了该方法的可行性。[研究结论]证据知识元表示模型在面向南海维权学术全文本时具有适用性,结合证据知识元识别规则与深度学习方法达到较好的自动识别效果,其中BERT模型和ERNIE模型表现最佳,在南海维权证据知识元自动识别的对比实验中,微观F1值分别达到了96.75%和96.64%,明显领先其他模型,可以满足南海维权证据知识元自动识别的要求。
-
关键词
学术全文本
知识元
南海维权
证据知识元
深度学习
文本分类
-
Keywords
full academic texts
knowledge element
South China Sea rights protection
evidence knowledge element
deep learning
text classification
-
分类号
G353.1
[文化科学—情报学]
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名知识元逻辑关系抽取方法研究
- 2
-
-
作者
程为
郑德俊
朱梦蝶
丛天时
王燕红
-
机构
南京农业大学信息管理学院
南京大学信息管理学院
-
出处
《情报学报》
CSCD
北大核心
2024年第7期862-874,共13页
-
基金
国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(19ZDA347)。
-
文摘
知识元逻辑关系抽取关注上下文的句法结构与语法特征,通过上下文功能语义依赖定义触发词规则实现上下文范围内的关系抽取。为摆脱上下文的结构限制,本文提出一种知识元逻辑关系抽取的新方法。首先,面向领域文献资料,通过知识元抽取构建知识元集合;其次,基于领域知识特征构建知识元属性描述框架,对知识元进行全方位、细粒度的统一描述,基于知识元属性抽取构建知识元属性集合;最后,结合实际需求定义逻辑关系类型,采用逻辑关联实例分析与属性对比关联分析,以属性值的共现、包含、相关等基本关系为线索,通过特征分析与归纳总结构建逻辑关系规则库,通过规则匹配实现知识元逻辑关系抽取。以南海维权证据知识元为例,选取部分不同文本来源的证据,定义了证据间逻辑关系类型及其抽取规则,在证据知识元及其属性抽取的基础上,基于规则匹配实现南海维权证据间并列、承接、反驳与补强4种逻辑关系的抽取,构建了南海维权证据逻辑关联图谱。实证研究验证了本文方法的可行性,能够为知识元逻辑关系抽取的相关研究提供可参考的新思路。
-
关键词
知识元
逻辑关系
关系抽取
南海维权
证据知识元
-
Keywords
knowledge element
logical relation
relation extraction
the South China Sea rights protection
evidence knowledge element
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-