-
题名基于深度学习技术的科技文献引文分类研究综述
- 1
-
-
作者
李俊飞
徐黎明
汪洋
魏鑫
-
机构
中国科学院计算机网络信息中心
中国科学院大学
-
出处
《数据与计算发展前沿》
CSCD
2023年第4期86-100,共15页
-
基金
中国科学院态势感知运行维护与应用支持项目(WX1450201-0105-02)。
-
文摘
【目的】科技文献引文分类是学术影响力评估、文献检索推荐等的基础工作。随着深度神经网络和预训练语言模型的发展,科技文献引文分类研究取得巨大成果。学界提出了许多基于深度学习技术的科技文献引文分类方法、模型和数据集。然而,目前仍然缺乏对现有方法和最新趋势的全面调研,因此本文在这方面进行了探索。【方法】本文梳理了基于深度学习技术的科技文献引文分类模型、数据集,并对不同模型的分类性能进行了对比和分析;归纳了不同模型的优缺点,对科技文献引文分类技术进行总结;讨论了未来的发展方向,并提出了建议。【结果】预训练语言模型能够有效地学习全局语义表示,改善了RNNs(Recurrent Neural Networks)训练效率低、CNNs(Convolutional Neural Networks)提取文本序列依赖特征长度有限等问题,显著提高了分类准确率。【局限】本文以介绍科技文献引文分类技术的进展为主,没有对未来技术的发展方向进行全面预测。
-
关键词
科技文献引文分类
预训练语言模型
深度学习
自然语言处理
-
Keywords
citation classification of scientific and technological documents
pre-trained language model
deep learning
natural language processing
-
分类号
G35
[文化科学—情报学]
-
-
题名一种协调的科技文献分类方法
被引量:3
- 2
-
-
作者
陈鑫卿
张永奎
李荣陆
-
机构
山西大学计算机科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第26期91-93,共3页
-
基金
山西省自然科学基金资助项目
-
文摘
科技文献之间的相互引证关系反映了一种科学交流活动,显示了科学文献之间(甚至是学科之间)的内在联系,而通过追溯文献之间的这种关系,可以改善和提高传统的基于内容的科技文献的分类的方法。论文利用有相互引证关系,有同引关系,以及有耦合关系的两篇文献一般是属于同一类的这一特点,提出了文献之间的引用相似度,同引相似度,耦合相似度这三个概念,再利用这三个概念生成了文献之间的“结构相似度”,并将它用于K-NN分类法中得出一种基于结构的分类法。最后,论文将这种基于结构的分类法和基于内容的NaveBayes分类法结合起来提出了一种新的协调分类法。
-
关键词
分类
科技文献
引用
同引
耦合
-
Keywords
classification,scientific documents,citation,co-citation,coupling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用引用结构来提高科技文献分类的质量
- 3
-
-
作者
鲍美英
-
机构
雁北师范学院计算中心
-
出处
《雁北师范学院学报》
2005年第2期39-42,共4页
-
文摘
科技文献的分类是科技文献数据库的重要组成部分,设计好的科技文献分类器是建立科技文献数字图书馆的重要任务之一.传统的文献分类法几乎都是基于文本的,这样会使一部分处于类边缘的文献不能准确地分类,事实上科技文献是一种半结构化的文献,它们包含的很多结构信息可以用到文献的分类中.本文利用科技文献的邻居文献所属的类这一信息结合科技文献的文本提出了一种协调的科技文献分类方法,并取得了较好的结果.
-
关键词
科技文献
分类
引文
邻居文献
-
Keywords
scientific document,classification,citation,neighbor document
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-