文章借助CiteSpace可视化分析软件,系统梳理并比较了2010—2023年间国内外物联网技术研究的进展与差异。通过对比分析中国知网与Web of Science中核心期刊文献的关键词聚类与研究热点,揭示了国内外物联网研究的侧重点与存在的差距。研...文章借助CiteSpace可视化分析软件,系统梳理并比较了2010—2023年间国内外物联网技术研究的进展与差异。通过对比分析中国知网与Web of Science中核心期刊文献的关键词聚类与研究热点,揭示了国内外物联网研究的侧重点与存在的差距。研究发现:国外研究更加注重跨学科的融合与创新,物联网技术创新优势显著,应用领域广泛且深入,涵盖了多个行业和领域;国内研究更侧重于物联网技术的实际应用和产业化推广。虽然国内物联网技术的应用领域相对集中,但在技术创新层面仍有待提升。展开更多
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难...情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法(generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。展开更多
三角引用是一种融合直接引用关系、耦合关系和共被引关系的特殊引用结构,具有较高的研究价值与拓展意义。为了解同一篇文章在三角引用中不同位置的表现,提出正向三角引用、双向三角引用和逆向三角引用。以Web of Science核心合集数据库...三角引用是一种融合直接引用关系、耦合关系和共被引关系的特殊引用结构,具有较高的研究价值与拓展意义。为了解同一篇文章在三角引用中不同位置的表现,提出正向三角引用、双向三角引用和逆向三角引用。以Web of Science核心合集数据库中LIS学科作为数据来源,从存在概率、数据特征、引用时间、跨语言引用、跨学科引用、文献类型和作者自引等方面分析了三种三角引用。研究发现,三种三角引用各有特点,在文献类型和作者自引中,三种三角引用表现一致;在存在概率、文献数量特征,以及引用时间、跨语言引用和跨学科引用上存在区别。此外,三角引用结构结合文本相似度与耦合引用强度为分析文献漏引与非相关引用提供了可能。展开更多
当前的期刊评价研究主要集中在影响力、声誉、质量等方面,针对期刊内容差异性的定量研究相对较少。本文从差异性视角来对期刊进行评价分析,提出期刊区分度指标来对期刊内容的差异程度进行度量。以LIS (library and information science)...当前的期刊评价研究主要集中在影响力、声誉、质量等方面,针对期刊内容差异性的定量研究相对较少。本文从差异性视角来对期刊进行评价分析,提出期刊区分度指标来对期刊内容的差异程度进行度量。以LIS (library and information science)等5个学科的各20种核心期刊为研究对象,首先对LIS期刊的内容差异性进行定量分析与评价,然后从时间维度对LIS学科期刊区分度的变化规律进行了探测,最后从学科维度对不同学科期刊个体和总体区分度的特征进行了分析和探讨。实验结果表明,利用该指标能够很好地度量期刊研究内容差异性,期刊区分度在时间维度上呈现出明显的变化规律,不同学科期刊个体和总体的区分度均具有显著的学科特征。展开更多
文摘文章借助CiteSpace可视化分析软件,系统梳理并比较了2010—2023年间国内外物联网技术研究的进展与差异。通过对比分析中国知网与Web of Science中核心期刊文献的关键词聚类与研究热点,揭示了国内外物联网研究的侧重点与存在的差距。研究发现:国外研究更加注重跨学科的融合与创新,物联网技术创新优势显著,应用领域广泛且深入,涵盖了多个行业和领域;国内研究更侧重于物联网技术的实际应用和产业化推广。虽然国内物联网技术的应用领域相对集中,但在技术创新层面仍有待提升。
文摘情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法(generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。
文摘三角引用是一种融合直接引用关系、耦合关系和共被引关系的特殊引用结构,具有较高的研究价值与拓展意义。为了解同一篇文章在三角引用中不同位置的表现,提出正向三角引用、双向三角引用和逆向三角引用。以Web of Science核心合集数据库中LIS学科作为数据来源,从存在概率、数据特征、引用时间、跨语言引用、跨学科引用、文献类型和作者自引等方面分析了三种三角引用。研究发现,三种三角引用各有特点,在文献类型和作者自引中,三种三角引用表现一致;在存在概率、文献数量特征,以及引用时间、跨语言引用和跨学科引用上存在区别。此外,三角引用结构结合文本相似度与耦合引用强度为分析文献漏引与非相关引用提供了可能。
文摘当前的期刊评价研究主要集中在影响力、声誉、质量等方面,针对期刊内容差异性的定量研究相对较少。本文从差异性视角来对期刊进行评价分析,提出期刊区分度指标来对期刊内容的差异程度进行度量。以LIS (library and information science)等5个学科的各20种核心期刊为研究对象,首先对LIS期刊的内容差异性进行定量分析与评价,然后从时间维度对LIS学科期刊区分度的变化规律进行了探测,最后从学科维度对不同学科期刊个体和总体区分度的特征进行了分析和探讨。实验结果表明,利用该指标能够很好地度量期刊研究内容差异性,期刊区分度在时间维度上呈现出明显的变化规律,不同学科期刊个体和总体的区分度均具有显著的学科特征。