[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和...[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。展开更多
背景:由身体接触性运动或交通事故造成的脑震荡远比人们想象的更为严重与常见,近年来引起了媒体、医学界及体育界的广泛关注与高度重视。目的:采用文献计量学方法对有限元方法在脑震荡领域的研究热点与趋势进行可视化分析,从而为中国在...背景:由身体接触性运动或交通事故造成的脑震荡远比人们想象的更为严重与常见,近年来引起了媒体、医学界及体育界的广泛关注与高度重视。目的:采用文献计量学方法对有限元方法在脑震荡领域的研究热点与趋势进行可视化分析,从而为中国在该领域的研究提供一定的参考。方法:基于Web of Science核心集数据库进行文献检索,检索主题词策略为(TS=(Concussion)) AND TS=(Finite element),利用CiteSpace 6.2.R4可视化工具对纳入文献的作者、国家、机构、关键词及被引文献等进行可视化分析。结果与结论:(1)共计纳入215篇文献,发文量与被引量总体上呈上升趋势;学科分布涉及生物医学工程、生物物理学、运动科学、临床神经学及神经科学等学科,呈现多学科交叉融合的趋势;发文量最多的作者是来自爱尔兰都柏林大学的Gilchrist M,发文量最多的机构是渥太华大学,发文量最多的国家是美国。(2)通过关键词分析发现研究的热点聚焦于脑损伤模型的建立用来模拟和预测脑震荡的损伤;脑震荡损伤机制的解析;防护设备和装置的优化设计。(3)通过文献共被引分析发现脑损伤的预测与评估是该领域的知识基础亦是研究热点。(4)有限元方法运用在脑震荡领域的研究热点主要围绕头部损伤预测为主题展开,结合探索大脑损伤机制以及防护装备的设计与改进。(5)随着人工智能与材料学的进步,未来有限元方法在脑震荡损伤领域的研究热点将集中于脑损伤模型、测试方法与防护装备的改进。展开更多
文摘[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。
文摘背景:由身体接触性运动或交通事故造成的脑震荡远比人们想象的更为严重与常见,近年来引起了媒体、医学界及体育界的广泛关注与高度重视。目的:采用文献计量学方法对有限元方法在脑震荡领域的研究热点与趋势进行可视化分析,从而为中国在该领域的研究提供一定的参考。方法:基于Web of Science核心集数据库进行文献检索,检索主题词策略为(TS=(Concussion)) AND TS=(Finite element),利用CiteSpace 6.2.R4可视化工具对纳入文献的作者、国家、机构、关键词及被引文献等进行可视化分析。结果与结论:(1)共计纳入215篇文献,发文量与被引量总体上呈上升趋势;学科分布涉及生物医学工程、生物物理学、运动科学、临床神经学及神经科学等学科,呈现多学科交叉融合的趋势;发文量最多的作者是来自爱尔兰都柏林大学的Gilchrist M,发文量最多的机构是渥太华大学,发文量最多的国家是美国。(2)通过关键词分析发现研究的热点聚焦于脑损伤模型的建立用来模拟和预测脑震荡的损伤;脑震荡损伤机制的解析;防护设备和装置的优化设计。(3)通过文献共被引分析发现脑损伤的预测与评估是该领域的知识基础亦是研究热点。(4)有限元方法运用在脑震荡领域的研究热点主要围绕头部损伤预测为主题展开,结合探索大脑损伤机制以及防护装备的设计与改进。(5)随着人工智能与材料学的进步,未来有限元方法在脑震荡损伤领域的研究热点将集中于脑损伤模型、测试方法与防护装备的改进。