[目的/意义]梳理同行评议发展脉络,分析当前同行评议面临的问题,进而提出科学合理的应对之策。[方法/过程]首先从同行评议起源、传统同行评议模式、开放同行评议、同行评议文本挖掘四方面梳理同行评议发展脉络,并以Web of Science核心...[目的/意义]梳理同行评议发展脉络,分析当前同行评议面临的问题,进而提出科学合理的应对之策。[方法/过程]首先从同行评议起源、传统同行评议模式、开放同行评议、同行评议文本挖掘四方面梳理同行评议发展脉络,并以Web of Science核心库中收录的同行评议模式文献数据为例,分析学者对同行评议模式的研究变化趋势;随后,对Elsevier旗下2426种期刊使用的同行评议模式进行统计,分析同行评议模式的实际应用情况。其次,根据国家统计局发布的中国创新指数、中国知网2000—2019年间收录的图书馆、情报与文献学领域的题录数据,从科研文献数量增长、研究主题演化以及潜在评审专家数量变化角度分析当前同行评议工作面临的问题。最后,根据分析结果,提出从构建学术质量评估系统、精准构建学者画像、量化学者在同行评议中的贡献三个方面应对在大数据环境下同行评议面临的困境。[结果/结论]在科研文献数量不断增长、研究主题不断拓展、评审专家数量增长放缓的情形下,同行评议面临的挑战与日俱增。通过发展脉络梳理、研究趋势与应用现状总结、挑战与策略分析,能够加深对同行评议的认识;提出的方案能够在一定程度上缓解日趋严峻的同行评议工作,具有一定的应用价值。[局限]由于数据获取难度大,文章使用的数据不够全面,所提出的对策尚未开发出验证系统。展开更多
【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统...【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.8661;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.4554。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。展开更多
文摘[目的/意义]梳理同行评议发展脉络,分析当前同行评议面临的问题,进而提出科学合理的应对之策。[方法/过程]首先从同行评议起源、传统同行评议模式、开放同行评议、同行评议文本挖掘四方面梳理同行评议发展脉络,并以Web of Science核心库中收录的同行评议模式文献数据为例,分析学者对同行评议模式的研究变化趋势;随后,对Elsevier旗下2426种期刊使用的同行评议模式进行统计,分析同行评议模式的实际应用情况。其次,根据国家统计局发布的中国创新指数、中国知网2000—2019年间收录的图书馆、情报与文献学领域的题录数据,从科研文献数量增长、研究主题演化以及潜在评审专家数量变化角度分析当前同行评议工作面临的问题。最后,根据分析结果,提出从构建学术质量评估系统、精准构建学者画像、量化学者在同行评议中的贡献三个方面应对在大数据环境下同行评议面临的困境。[结果/结论]在科研文献数量不断增长、研究主题不断拓展、评审专家数量增长放缓的情形下,同行评议面临的挑战与日俱增。通过发展脉络梳理、研究趋势与应用现状总结、挑战与策略分析,能够加深对同行评议的认识;提出的方案能够在一定程度上缓解日趋严峻的同行评议工作,具有一定的应用价值。[局限]由于数据获取难度大,文章使用的数据不够全面,所提出的对策尚未开发出验证系统。
文摘【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.8661;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.4554。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。