-
题名科技论文引用对象和引文功能的联合自动识别方法研究
被引量:2
- 1
-
-
作者
唐晓波
彭映寒
-
机构
武汉大学信息系统研究中心
武汉大学信息管理学院
-
出处
《现代情报》
CSSCI
2022年第6期38-48,共11页
-
基金
国家社会科学基金重大项目“基于大数据的科教评价信息云平台构建和智能服务研究”(项目编号:19ZDA349)。
-
文摘
[目的/意义]国家强调重视科技成果的质量,科技成果的质量体现了科技成果的学术价值和贡献。科技论文是科技成果的重要载体之一。基于文本语义分析识别科技论文的引用对象和引文功能,对于科技论文的学术贡献和价值的评价具有重要的作用。[方法/过程]本文利用文本数据挖掘技术提出基于BERT-BiGRU-CRF的科技论文引用对象和引文功能的联合自动识别方法模型。首先从知网数据库获取科技论文全文本,利用正则匹配引用标记的方式获取科技论文引文内容;其次借鉴已有研究确定科技论文引用对象和引文功能标注方法,实现科技论文引文内容的人工标注;然后在预训练语言模型BERT的基础上结合BiGRU与CRF构建科技论文引文内容的序列标注模型,实现科技论文引用对象和引文功能的联合自动识别,将识别结果利用三元组进行表达;最后采用图情领域5本高质量期刊2021年上半年的科技论文文本数据进行实验。[结果/结论]实验结果表明,本文提出的方法模型在引用对象、引文功能和两者联合自动识别上的F_(1)值分别为71.78%、68.33%、64.23%,均优于对比模型,初步验证了本文模型对于科技论文引用对象和引文功能自动识别的有效性。
-
关键词
科技论文
价值评价
引用对象
引文功能
联合自动识别
BERT-BiGRU-CRF
-
Keywords
scientific papers
value evaluation
citation object and its relationship
joint automatic identification
BERT-BiGRU-CRF
-
分类号
G250.2
[文化科学—图书馆学]
-