期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于引文全文本的医学领域突破性文献识别研究 被引量:12
1
作者 王雪 杨雪梅 +2 位作者 林紫洛 关陟昊 唐小利 《情报杂志》 CSSCI 北大核心 2021年第3期132-138,共7页
[目的/意义]从学术共同体的评论性引用视角出发,以引文全文本为基础,结合词频统计、深度学习等方法,探析引文文本中表征突破性评价的文本特征并构建自动识别模型以实现从海量文献中识别潜在突破性文献。[方法/过程]以诺贝尔生理学或医... [目的/意义]从学术共同体的评论性引用视角出发,以引文全文本为基础,结合词频统计、深度学习等方法,探析引文文本中表征突破性评价的文本特征并构建自动识别模型以实现从海量文献中识别潜在突破性文献。[方法/过程]以诺贝尔生理学或医学奖获得者的关键文献以及Science十大科学突破主题的代表文献(医学领域)作为金标准突破性文献集并获取引用语句,对引用语句进行词频统计并结合人工筛选获取表征突破性评价的常用词。对引用语句进行人工标注,利用BERT、BIOBERT模型进行训练形成自动识别模型,并选择癌症领域进行实证分析。[结果/结论]结果表明,学术共同体在评价具有重大突破价值的文献时具有明显的文本特征;相较BERT模型,生物医学语言表示模型BIOBERT对突破性评价引用语句的识别能力明显增强,F1值为0.84。基于引用语句的自动识别模型能够较为精准地识别具有重要学术价值的文献并能在一定程度上实现早期识别和早期评价。 展开更多
关键词 引文全文本 深度学习 突破性文献 自动识别 文本分类 文本特征
下载PDF
融合引文内容和全文本引文分析的知识流动研究 被引量:27
2
作者 张艺蔓 马秀峰 程结晶 《情报杂志》 CSSCI 北大核心 2015年第11期50-54,49,共6页
提出将引文内容分析与全文本引文分析相结合的方法,分析知识流动情况,建立三个文献集:施引文献集、原始文献集和参考文献集。通过原始文献集的桥梁作用,利用引用与被引用的关系,将三个文献集联系起来,分别提取三个文献集的主题,探测出... 提出将引文内容分析与全文本引文分析相结合的方法,分析知识流动情况,建立三个文献集:施引文献集、原始文献集和参考文献集。通过原始文献集的桥梁作用,利用引用与被引用的关系,将三个文献集联系起来,分别提取三个文献集的主题,探测出学科内部与学科间知识流动的趋势,证实了提出方法的有效性,可以利用此方法进行知识流动方面的研究,且对于预测学科发展有重要意义。 展开更多
关键词 引文内容分析 全文本引文分析 知识流动 LDA模型
下载PDF
全文引文分析方法在Altmetrics中的衍化与应用——以博文为例 被引量:4
3
作者 刘晓娟 潘银蓉 韦娱 《信息资源管理学报》 CSSCI 2021年第3期67-76,共10页
为探索全文引文分析方法在Altmetrics中的应用价值与路径,促进对Altmetrics指标的深入理解与合理利用,参考全文引文分析方法,结合社交媒体文本特点,建立社交媒体文本提及学术成果行为的分析框架,并以2019年altmetric.com公布的AAS Top5... 为探索全文引文分析方法在Altmetrics中的应用价值与路径,促进对Altmetrics指标的深入理解与合理利用,参考全文引文分析方法,结合社交媒体文本特点,建立社交媒体文本提及学术成果行为的分析框架,并以2019年altmetric.com公布的AAS Top50论文及其提及博文为实证数据集,结合博文文本特征,从论文提及方式、位置、强度及情感与动机等方面对提及行为进行分析发现,博文提及论文与学术论文中的文献引用既有联系,也有区别。将衍化后的全文引文分析方法应用于社交媒体文本的提及行为,能够揭示行为的本质及其对于学术评价的意义,有利于Altmetrics方法体系的构建。 展开更多
关键词 全文引文分析 替代计量学 社交媒体 学术评价 引用动机
下载PDF
基于本体和关联数据的全文引文分析方法研究 被引量:4
4
作者 石泽顺 肖明 《图书馆杂志》 CSSCI 北大核心 2021年第4期100-108,共9页
针对传统引文分析法中存在的缺陷,提出了基于本体和关联数据的全文引文分析方法,以期利用本体和关联数据技术来揭示学术文献之间的全文引用关系,实现全新视角下的引文分析。首先选取《科学计量学》杂志引文分析领域的高被引文献组成实... 针对传统引文分析法中存在的缺陷,提出了基于本体和关联数据的全文引文分析方法,以期利用本体和关联数据技术来揭示学术文献之间的全文引用关系,实现全新视角下的引文分析。首先选取《科学计量学》杂志引文分析领域的高被引文献组成实验数据集,并对全文引用信息进行抽取和标注。接着构建全文引文本体FCO对引文数据进行规范化描述,并发布为引文关联数据。最后,构建不同的SPARQL检索式对全文引用信息进行多维度抽取,对数据集的引文数量、引文功能、引文情感和引文位置的分布情况进行具体分析,实验验证基于本体和关联数据的全文引文分析方法的可行性。实验表明基于本体和关联数据的全文引文分析方法具有一定的可行性和实用性,对传统引文分析法的优化和全文引文分析方法的普及有着重要意义。 展开更多
关键词 本体 关联数据 全文引文分析
下载PDF
融合引用语义和语境特征的作者引文耦合分析法 被引量:4
5
作者 张汝昊 袁军鹏 《情报学报》 CSSCI CSCD 北大核心 2022年第8期796-811,共16页
作者引文耦合分析是发现领域活跃研究社群与知识结构的重要工具。当前该方法主要利用引用次数朴素地表征作者间的联系强度,忽视了耦合双方在更深层次上的相似性。为增强现有方法的可靠性与分析深度,本研究试图利用丰富的全文本资源,挖... 作者引文耦合分析是发现领域活跃研究社群与知识结构的重要工具。当前该方法主要利用引用次数朴素地表征作者间的联系强度,忽视了耦合双方在更深层次上的相似性。为增强现有方法的可靠性与分析深度,本研究试图利用丰富的全文本资源,挖掘引用内容所蕴含的“引了什么”“在何处引”“引用的重要性如何”等关键信息,从施引动机的相似性这一本质层面优化引文耦合强度,提出一种融合引用语义和语境特征的作者引文耦合分析法。该方法通过深入学术论文全文,抽取耦合双方在施引论文中引用内容的语义和语境特征,以此计算增强型引文耦合强度,为每一次引文耦合赋予不同的相似程度值;在此基础上,通过“论文-主题-作者”聚合映射考虑作者的多元兴趣倾向,最终获得作者间的研究主题相似性度量。为证明提出方法的有效性,本研究利用中文“图书情报与数字图书馆”领域的13562篇论文的全文本数据开展了实证研究。实证结果表明,提出方法相较于现有作者引文耦合分析法具有更优的作者兴趣社群发现效果,呈现出更佳、更细致的聚类群落分布,划分出的作者兴趣社群具有更高的群内研究主题同质性和互引概率;此外,提出方法面向大体量作者时的表现更为稳定,具有拓展和应用前景。 展开更多
关键词 作者引文耦合分析 全文本引文分析 引文内容分析 引用语义 引用语境 领域知识结构
下载PDF
全文本视角下的核心引文测度:概念界定、指标体系与识别模型
6
作者 林歌歌 侯海燕 +2 位作者 潘宇馨 梁国强 胡志刚 《情报学报》 2024年第10期1199-1212,共14页
识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录... 识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录信息和引用信息2个维度、8个子维度及33个引文特征指标的核心引文识别指标体系。其次,通过多种机器学习模型(如随机森林、支持向量机、逻辑回归)对引文特征指标进行遴选与优化,分析其相关性及信息增益,保留21个重要的引文特征指标,并验证识别模型的有效性。研究结果表明,基于引用信息的引文特征指标在识别核心引文时具有更高的重要性和贡献度。机器学习模型在核心引文识别中的表现优异,特别是随机森林、支持向量机、逻辑回归等模型,其ROC (receiver operating characteristic)曲线的AUC (area under curve)值均大于0.85,证明了模型的高效性和鲁棒性。核心引文测度方法及识别模型不仅为科学评价体系提供了更精准的工具,也为深入研究引文分析奠定了坚实的基础。 展开更多
关键词 核心引文 引用信息 题录信息 机器学习 全文引文分析
下载PDF
全文本引文分析——引文分析的新发展 被引量:57
7
作者 赵蓉英 曾宪琴 陈必坤 《图书情报工作》 CSSCI 北大核心 2014年第9期129-135,共7页
对全文本引文分析法进行全面梳理,首先,将其提出的背景归纳为传统引文分析法的不足以及相关技术的发展;其次,介绍全文本引文分析的研究数据、研究方法及研究内容;最后,展望全文本引文分析法未来的研究方向,认为全文本引文分析作为一种... 对全文本引文分析法进行全面梳理,首先,将其提出的背景归纳为传统引文分析法的不足以及相关技术的发展;其次,介绍全文本引文分析的研究数据、研究方法及研究内容;最后,展望全文本引文分析法未来的研究方向,认为全文本引文分析作为一种微观的、基于全文数据的引文分析法,可以从根本上改变和发展引文分析和科学评价的理论与方法;随着结构化全文数据的普及,其将得到更大的发展。 展开更多
关键词 全文本引文分析 引用内容分析 引用分析 引文分析
原文传递
全文引文分析视角下的造假论文学术影响研究 被引量:7
8
作者 张春博 丁堃 +1 位作者 王贤文 刘则渊 《科学学研究》 CSSCI CSCD 北大核心 2021年第4期577-586,共10页
通过施引文献的全文引文分析,展示了高被引造假论文对学术界所造成的微观影响以及撤销前后的影响变化情况,揭示其在学术界造成较大影响的原因以及科学自我纠错机制的作用发挥情况。首先,构建了包括引用情感、引文功能、引用对象以及引... 通过施引文献的全文引文分析,展示了高被引造假论文对学术界所造成的微观影响以及撤销前后的影响变化情况,揭示其在学术界造成较大影响的原因以及科学自我纠错机制的作用发挥情况。首先,构建了包括引用情感、引文功能、引用对象以及引文重要性等维度在内的全文引文分析框架。然后,在自然科学与社会科学领域分别选择一篇代表性的高被引撤销论文作为案例样本。基于构建的全文引文分析框架,对这两篇论文的施引文献进行各维度的人工标注和描述分析。高影响力造假论文对学术界的影响巨大,但需全面辩证地看待。其获得很高的被引频次,与造假论文本身价值和学术界的引用时尚均有关系。科学自我纠错机制作用的发挥呈现学科领域的差异性。自然科学领域存在识别问题的能力,论文撤销的净化效果也较好。社会科学领域则基本没有基于科学知识本身的内在纠错机制,论文撤销行为对其后续影响的净化也无显著作用。重复性研究机制很大程度上影响了二者在自我纠错方面的表现差异,包括重复性研究的动力和可行性。 展开更多
关键词 造假论文 全文引文分析 撤销论文 学术影响 科学自我纠错 重复性研究
原文传递
大规模科技文献深度解析和检索平台构建 被引量:5
9
作者 吴素研 吴江瑞 李文波 《现代情报》 CSSCI 2020年第1期110-115,共6页
[目的/意义]在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代--全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析... [目的/意义]在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代--全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程]在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论]引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。 展开更多
关键词 全文引文分析 信息抽取 信息检索 SPARK
下载PDF
基于全文计量的COVID-19论文撤稿后持续被引现象研究 被引量:1
10
作者 任檐雨 杨思洛 《知识管理论坛》 2023年第5期399-413,共15页
[目的/意义]新冠(COVID-19)疫情期间,有较多相关主题的论文被撤稿,但通过各权威数据库或网站检索发现,这些论文在撤稿后仍被持续引用。本研究旨在从引文内容层面分析其撤稿后的传播和影响,并就重大公共事件中引证和撤稿机制的优化提出建... [目的/意义]新冠(COVID-19)疫情期间,有较多相关主题的论文被撤稿,但通过各权威数据库或网站检索发现,这些论文在撤稿后仍被持续引用。本研究旨在从引文内容层面分析其撤稿后的传播和影响,并就重大公共事件中引证和撤稿机制的优化提出建议,以促进学术交流的良性发展。[方法/过程]首先从WoS、Scopus和PubMed数据库中获取COVID-19撤稿论文及其施引文献全文,并对施引文献中的引文上下文进行人工抽取;然后通过撤稿标记情况、引用对象、引用位置和引用情感4个维度构成的全文引文分析框架进行人工标注和内容分析。[结果/结论]COVID-19撤稿论文被识别的概率和速度远超生物医学领域的其他论文,撤稿机制起到一定的学术净化作用;但其内容仍在扩散,其中的不可靠和错误信息大量传播。此现象须引起研究者、期刊及数据库等各方足够的重视,重大公共事件中的引证和撤稿机制亟待优化。 展开更多
关键词 COVID-19 撤稿论文 全文引文分析 学术净化 学术影响
原文传递
跨学科知识扩散视域下学科交叉科学术语识别与特征计算
11
作者 孔玲 胡昊天 +4 位作者 张卫 王东波 叶文豪 白如江 王效岳 《图书情报工作》 北大核心 2024年第12期119-137,共19页
[目的/意义]科学术语承载学科基础知识与核心概念,对跨学科知识扩散的学术全文本引文中科学术语进行知识挖掘与特征计算,对深入探究跨学科的知识体系交叉融合规律与影响力具有重要意义。[方法/过程]以情报学为例,在无标注跨学科语料下,... [目的/意义]科学术语承载学科基础知识与核心概念,对跨学科知识扩散的学术全文本引文中科学术语进行知识挖掘与特征计算,对深入探究跨学科的知识体系交叉融合规律与影响力具有重要意义。[方法/过程]以情报学为例,在无标注跨学科语料下,基于获取的权威科学术语知识体系,借助字序列标注模型与远程监督算法获取跨学科知识扩散科学术语抽取与分类的学习语料,进而探讨基于深度学习的最优模型,从知识发现角度定义新科学术语判别规则,最后进行科学术语跨学科知识扩散的学科分布、引用章节位置、概念专指度等多维特征计算。[结果/结论]Ro BERTa模型在各项指标上整体表现最优,其调和平均值达到98.08%,说明该算法能够保证跨学科知识扩散科学术语识别的可靠性和有效性。基于远程监督与深度学习的科学术语识别方法有利于挖掘跨学科知识扩散科学术语知识,可为跨学科知识扩散的智能知识挖掘提供领域化的基础计算资源支撑。多维特征计算能有效探究跨学科知识扩散科学术语交叉融合规律。 展开更多
关键词 学科交叉 跨学科知识扩散 学术全文本引文 科学术语 知识抽取
原文传递
学术传承意义上“学术链”的识别方法探讨——以2014年诺贝尔化学奖为例 被引量:8
12
作者 郭倩影 杜建 唐小利 《情报资料工作》 CSSCI 北大核心 2018年第2期29-36,共8页
"学术链"是学科发展过程中由里程碑式文献按照时间先后顺序构成的文献集合,反映了研究的重大价值和学术传承意义,是评价科技论文学术影响力的新方法,而如何区别文献间的学术传承式引用和一般提及式引用是识别和确定学术链节... "学术链"是学科发展过程中由里程碑式文献按照时间先后顺序构成的文献集合,反映了研究的重大价值和学术传承意义,是评价科技论文学术影响力的新方法,而如何区别文献间的学术传承式引用和一般提及式引用是识别和确定学术链节点的关键。文章构建了一个以由外部特征分析(长期引用、高被引/同被引分析)和内容特征分析(全文本引文分析)方法相结合的"学术链"识别框架,通过找出学术传承式引用文献来识别特定主题或学科的学术链节点,并以2014年诺贝尔化学奖为例验证其可行性。 展开更多
关键词 学术链 学术传承 长期引用 同被引 全文本引文分析
原文传递
基于语义和位置相似的作者共被引分析方法及效果实证 被引量:6
13
作者 张汝昊 《图书情报工作》 CSSCI 北大核心 2020年第8期111-124,共14页
[目的/意义]作者共被引分析是探索领域知识结构的重要方法,在复杂的学科发展态势下,其依赖于共被引频次的作者关联度度量颇具争议。对此,提出一种基于语义和位叠相似的作者共被引分析改良方法。[方法/过程]在介绍基本原理的基础上,以图... [目的/意义]作者共被引分析是探索领域知识结构的重要方法,在复杂的学科发展态势下,其依赖于共被引频次的作者关联度度量颇具争议。对此,提出一种基于语义和位叠相似的作者共被引分析改良方法。[方法/过程]在介绍基本原理的基础上,以图情领域为例开展基于语义和位置相似的作者共被引分析改良方法的效果实证,面向CNKI期刊库进行引文全文挖掘,并对引用句及引用位置进行抽取,结合预训练的领域词嵌入模型计算共被引文献间的深层相似度和作者间的关联强度,利用网络分析和因子分析法对比该方法与传统方法的效果差异。[结果/结论]结果证明,基于语义和位置相似的作者共被引分析改良方法能更准确地识别共被引作者的关联强度,可发现更为细致的学科知识结构,并具有可拓展性与可应用性。 展开更多
关键词 作者共被引分析 引文内容分析 共引位置分析 全文本引文分析 领域知识结构
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部