期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
科学文献主题建模方法及其效果评估研究 被引量:3
1
作者 逯万辉 《现代情报》 北大核心 2024年第4期22-31,共10页
[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和... [背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。 展开更多
关键词 主题建模 LDA top2vec Bertopic 科学文献 主题识别
下载PDF
科研人员职业高峰前后的研究主题转换特征识别 被引量:5
2
作者 陈立雪 滕广青 +1 位作者 吕晶 庹锐 《图书情报工作》 CSSCI 北大核心 2021年第16期81-89,共9页
[目的/意义]探索科研人员职业发展情况及其研究主题的变化规律不仅可以揭示科学生产力发展的内在机制,也有助于对科学事业的发展提供更好的政策指导与支持。[方法/过程]基于自然科学、社会科学、艺术与人文科学的代表性学科数据,对科研... [目的/意义]探索科研人员职业发展情况及其研究主题的变化规律不仅可以揭示科学生产力发展的内在机制,也有助于对科学事业的发展提供更好的政策指导与支持。[方法/过程]基于自然科学、社会科学、艺术与人文科学的代表性学科数据,对科研人员的职业高峰进行识别。在此基础上以职业高峰作为科研人员学术生涯的划分依据,采用自然语言处理中的Top2Vec主题建模方法识别研究主题,对科研人员学术生涯不同阶段所研究主题的主题相似度和主题转换概率进行分析。[结果/结论]研究结果表明,各学科科研人员总体上在经历职业高峰之后的主题转换会更加频繁;而精英学者在经历职业高峰后其研究主题则反而更加专一。 展开更多
关键词 科研人员 职业高峰 top2vec 主题转换 主题相似度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部