-
题名基于BERT和引文上下文的文献表征与检索方法研究
被引量:10
- 1
-
-
作者
牛海波
赵丹群
郭倩影
-
机构
北京大学信息管理系
-
出处
《情报理论与实践》
CSSCI
北大核心
2020年第9期125-131,共7页
-
文摘
[目的/意义]文章提出了一种新的基于BERT和引文上下文的文献向量表征方法,旨在有效实现对文献的语义表征及检索。[方法/过程]基于arXiv数据库中"计算语言学"领域的相关文献数据,利用引文上下文将被引文献映射到全局唯一ID,构造包含施引文献引文上下文和被引文献ID的训练语料,通过BERT预训练模型开展训练,将施引文献引文上下文与被引文献ID表征在同一向量空间,进而实现语义计算和检索。[结果/结论]与基于文献全文开展的文献检索方式相比,基于BERT和引文上下文的文献检索方法能够隐含编码被引文献引用强度、被引文献核心概念等关键信息,从而能够更好地表征被引文献。随后,文章开展了语义检索和相似文献发掘实验,结果证明该检索方法切实有效。
-
关键词
引文上下文
BERT
文献表征
语义检索
文献关系挖掘
-
Keywords
citation context
bidirectional encoder representation from transformers
semantic document representation
semantic retrieval
document relationship mining
-
分类号
G252.7
[文化科学—图书馆学]
-
-
题名《国防科技》2020年发表文献和建设情况浅析
- 2
-
-
作者
刘静
王姝
常春喜
-
机构
国防科技大学前沿交叉学科学院
-
出处
《国防科技》
2021年第2期100-105,共6页
-
文摘
国防科技是具有基础性、引领性的战略工程,期刊聚焦于这一领域特色鲜明、使命艰巨。本文主要基于CNKI数据库和万方数据库,检索《国防科技》2020年发表的全部论文,对每篇论文的标题、作者、工作机构、基金项目和下载量等文献计量指标进行统计分析;同时,对本年度开展的质量建设相关工作进行回顾性定性阐述,旨在为2021年办刊工作提供参考,凝练发展思路。研究结果表明,“科技前沿”“装备动态”和“作战训练”等栏目深受作者喜爱,贴近国家和军队重大需求,针对学科发展前沿和关键性技术策划的选题以及组织的专题、专栏文章能够明显提升期刊影响力。持续提升学术质量和影响力始终是期刊建设的核心工作,特别是在培育形成相对稳定的高影响力作者、团队和机构,研究、跟踪并对标国际一流军事类学术期刊,开拓学术传播渠道和多元化形式等方面,《国防科技》还需要继续攻坚。
-
关键词
《国防科技》
2020年
发文情况
文献计量表征
-
Keywords
National Defense Technology
the year 2020
polished papers
bibliometric characterizations
-
分类号
Z62
[文化科学]
-