期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于BERTopic模型的国外信息资源管理研究进展分析 被引量:2
1
作者 杨思洛 吴丽娟 《情报理论与实践》 北大核心 2024年第2期189-197,共9页
[目的/意义]文章从已有研究成果中提取主题,梳理主要研究方向,展示主题热度变化趋势,为了解和评估国外信息资源管理(IRM)研究发展现状与趋势提供参考。[方法/过程]采用新兴BERTopic模型对2013—2022年期间WoS数据库中IRM相关文献进行主... [目的/意义]文章从已有研究成果中提取主题,梳理主要研究方向,展示主题热度变化趋势,为了解和评估国外信息资源管理(IRM)研究发展现状与趋势提供参考。[方法/过程]采用新兴BERTopic模型对2013—2022年期间WoS数据库中IRM相关文献进行主题提取与识别,结合相关主题词及主题距离划分研究方向,并利用动态主题模型揭示国外IRM领域的演变过程。[结果/结论]国外IRM近10年的研究可分为59个主题,可归纳为信息技术及应用、企业信息管理、图书馆管理与服务、健康信息管理、信息用户与服务、IRM基本理论与方法、文献计量与评价7个方向。大多数主题的研究热度变化偏向稳定的趋势,数字化建设、开放数据等部分主题热度逐渐上涨,而外包、知识管理等少数主题热度退却。 展开更多
关键词 国外信息资源管理 主题模型 bertopic 研究主题 研究进展
下载PDF
基于BERTopic与CiteSpace的中国中医药领域研究热点与主题演化分析
2
作者 王安莉 张文婷 +3 位作者 文庭孝 欧阳威 于姗姗 杨飞龙 《医学信息学杂志》 CAS 2024年第7期55-61,共7页
目的/意义 梳理近10年中国中医药领域文献,阐述该领域热点主题与发展趋势。方法/过程 检索2013-2022年万方数据平台中医药领域研究文献,以摘要为研究对象,利用BERTopic模型抽取主题,并采用CiteSpace进行可视化分析。结果/结论 纳入中文... 目的/意义 梳理近10年中国中医药领域文献,阐述该领域热点主题与发展趋势。方法/过程 检索2013-2022年万方数据平台中医药领域研究文献,以摘要为研究对象,利用BERTopic模型抽取主题,并采用CiteSpace进行可视化分析。结果/结论 纳入中文文献12 683篇,发现5个主题:临床试验与疗效、病机与药理研究、中医药领域发展、慢病治疗、药物分析与文献研究。对其中热度持续增长的中医药领域发展主题深入分析,提出人工智能与中医药领域的深度融合是未来趋势。 展开更多
关键词 中医药 主题抽取 热点识别 共现分析 bertopic CITESPACE
下载PDF
基于Guided BERTopic模型的产业链关键核心技术识别与发展趋势研判--以未来工业互联网为例
3
作者 陈升 杨恒 张楠 《科学管理研究》 北大核心 2024年第3期35-44,共10页
产业链关键核心技术不仅是国之重器,而且对推动我国经济的高质量发展和保障国家安全起着至关重要的作用。当前,工业互联网产业链的关键技术发展成为我国的研究重点,该领域的重要性在2023年被提升至国家级重大研究计划。综合收集了1989-2... 产业链关键核心技术不仅是国之重器,而且对推动我国经济的高质量发展和保障国家安全起着至关重要的作用。当前,工业互联网产业链的关键技术发展成为我国的研究重点,该领域的重要性在2023年被提升至国家级重大研究计划。综合收集了1989-2024年中美两国在工业互联网领域的专利数据,基于《关键和新兴技术清单》和《未来工业互联网基础理论与关键技术重大研究计划》,构建了一套工业互联网产业链核心关键技术的种子词库。利用Guided BERTopic模型提取了产业链关键技术主题,并采用Logistic模型评估了这些技术的生命周期,进而对比中美两国的发展情况,提出了针对未来发展的建议。研究结果表明,相比美国,我国在大多数产业链核心技术方面仍处于成长阶段,而美国则已步入技术饱和阶段。展望未来,设备监测系统、设备管理系统、无线通信技术及能耗监测分析系统等被认为是具有巨大发展潜力的技术。研究提出了一种基于政策文件的产业链关键技术识别方法,并通过对工业互联网专利技术的实证分析,为制定相关政策提供了科学指导和建议。 展开更多
关键词 Guided bertopic模型 产业链核心关键技术 工业互联网 中美比较 专利文本 LOGISTIC模型
下载PDF
基于BERTopic模型的网络暴力事件衍生舆情探测 被引量:2
4
作者 胡凯茜 李欣 王龙腾 《情报杂志》 北大核心 2024年第7期146-153,共8页
[研究目的]在海量用户生成内容中及时探测和剖析网络暴力事件的衍生舆情能够为舆情事件链的演化分析、同类舆情的研判介入、衍生事件的监测预警提供理论支持。[研究方法]使用BERTopic模型对短文本内容主题建模并采用聚类的方式展示主题... [研究目的]在海量用户生成内容中及时探测和剖析网络暴力事件的衍生舆情能够为舆情事件链的演化分析、同类舆情的研判介入、衍生事件的监测预警提供理论支持。[研究方法]使用BERTopic模型对短文本内容主题建模并采用聚类的方式展示主题的潜在层次结构。根据词向量余弦相似度设计主题衍生度的计量算法,同时融合词共现网络在文档-词语层面信息捕捉的优势以及桑基图直观演示舆情演化过程的特点,衡量主题间的影响力与衍生关系。[研究结论]在开源数据集下多组主题模型的对照实验中,BERTopic模型在短文本建模以及下游任务的平均得分提高2.13%。在网络暴力热点事件的应用实例中,多维细粒度分析与交互式可视化方法可达到直观展示暴力事件的主题聚类、词义关联与演化态势的效果,实现网络暴力事件衍生舆情的探测与分析。 展开更多
关键词 网络舆情 网络暴力 衍生舆情 舆情监测 短文本 主题建模 bertopic模型
下载PDF
基于BERTopic算法的引文主题实证分析——以一篇高被引诺贝尔生理学或医学奖论文为例
5
作者 郭倩影 赵丹群 《情报理论与实践》 北大核心 2024年第10期183-189,182,共8页
[目的/意义]引文主题识别/分析(CTR/CTA)是引文内容分析(CCA)的一项重要研究议题,通过对引文语料中蕴涵主题信息的识别和提取,可望为论文学术贡献评价、知识扩散及演化分析等问题的解决提供新的研究思路。[过程/方法]以一篇高被引诺贝... [目的/意义]引文主题识别/分析(CTR/CTA)是引文内容分析(CCA)的一项重要研究议题,通过对引文语料中蕴涵主题信息的识别和提取,可望为论文学术贡献评价、知识扩散及演化分析等问题的解决提供新的研究思路。[过程/方法]以一篇高被引诺贝尔生理学或医学获奖关键论文为例,采用BERTopic算法对其引文句语料进行主题识别,并对识别出的引文主题展开多个维度的分析与讨论。[结果/结论]对高被引论文开展引文主题识别分析,有助于更全面细致地揭示其学术贡献内容及演化趋势;BERTopic算法能较好识别案例文献的多个引文主题,且不同引文主题的施引文献特征分布不尽相同;对引文主题重要性、演化趋势及其与原文主题差异性的分析,能多维度刻画研究同行对案例文献学术贡献的认识,表明CTR/CTA研究对学术论文评价具有深入探索价值。 展开更多
关键词 bertopic算法 引文主题识别 引文主题分析 引文内容分析 学术论文评价
下载PDF
基于BERTopic的中药治疗眼科疾病的处方用药规律分析
6
作者 卢昕怡 李弘辰 +1 位作者 吴双 罗杰 《浙江临床医学》 2024年第6期899-901,共3页
目的分析中医药治疗眼科疾病的处方用药规律,探讨治疗眼科疾病的更多潜在配伍组合。方法收集眼科专家门诊的中医处方并整理筛选,采用Python 3.9.10中BERTopic算法对复发性虹膜睫状体炎的所有处方进行分析,得到药物关键词聚类组合;采用SP... 目的分析中医药治疗眼科疾病的处方用药规律,探讨治疗眼科疾病的更多潜在配伍组合。方法收集眼科专家门诊的中医处方并整理筛选,采用Python 3.9.10中BERTopic算法对复发性虹膜睫状体炎的所有处方进行分析,得到药物关键词聚类组合;采用SPSS 25.0对中药处方数据进行层次聚类,比较两种方法的优劣和药物配伍组合的挖掘效果。结果采用BERTopic算法得到核心药物关键词组合累计2种,包括酒地龙、土茯苓、大青叶、葎草等;应用层次聚类得到的药物组合包括葎草、土茯苓、菝葜等。应用BERTopic技术的算法具有不易受噪声数据影响、提高聚类效率、增强对于处方文本语义理解等诸多优势。结论使用基于BERTopic技术的算法在寻找疾病潜在中药配伍中表现良好,潜力较大,能为眼科疾病的中药配伍组合提供更多参考方向。 展开更多
关键词 数据挖掘 用药规律 眼科疾病 bertopic模型
下载PDF
基于BERTopic模型的数字政府治理领域的主题识别与内容分析
7
作者 高凡 徐思佳 《情报理论与实践》 北大核心 2024年第8期95-106,共12页
[目的/意义]在信息技术创新、政府数字化转型的背景下,中国学术界输出的“数字政府治理”相关研究体量较大,现阶段亟待对其进行科学整理和综述概览,以回应“政府治理现代化”目标对理论研究的新要求。[方法/过程]以2011-2023年间中国知... [目的/意义]在信息技术创新、政府数字化转型的背景下,中国学术界输出的“数字政府治理”相关研究体量较大,现阶段亟待对其进行科学整理和综述概览,以回应“政府治理现代化”目标对理论研究的新要求。[方法/过程]以2011-2023年间中国知网数据库收录的有关数字政府治理研究的1829篇文献为数据来源,借助深度学习模型BERTopic和文献计量法CiteSpace相互验证分析数字政府治理领域的研究阶段、研究关键词、研究热点主题及内容等,使得结果具有高准确性和强解释性,以科学有效地探测主题取向及特征,展望数字政府治理领域的未来研究方向。[结果/结论]中国数字政府治理研究在过去的10年间发展迅猛,已成为学者探索的热点论域;现有文献研究热点整体上聚焦于价值导向、治理模式进化、技术工具嵌入;重点主题关注的是“政府数据开放共享研究”“基于数字技术的政务服务改革研究”“城乡场域下的数字化治理研究”“数字政府治理水平的评估研究”及“数字化转型下具体治理领域的实践研究”。未来,数字政府治理仍然是一个具有持续性拓展空间的研究领域,将逐步实现数字政府治理的更广场域触达、精准滴灌、多项学科融合和技术实用主义。 展开更多
关键词 数字政府 政府治理 主题识别 bertopic 主题模型
下载PDF
基于BERTopic模型的公众心理应激信息表征分析
8
作者 刘洋 彭顺 钱晓悦 《情报探索》 2024年第8期41-48,共8页
[目的/意义]在后疫情时代的背景下,探讨心理应激的信息表征对公众的心理健康建设及社会发展具有重要意义。[方法/过程]使用BERTopic模型对问答数据进行匹配和热度分析,探究不同主题下用户的关注内容和关注程度。[结果/结论]用户心理应... [目的/意义]在后疫情时代的背景下,探讨心理应激的信息表征对公众的心理健康建设及社会发展具有重要意义。[方法/过程]使用BERTopic模型对问答数据进行匹配和热度分析,探究不同主题下用户的关注内容和关注程度。[结果/结论]用户心理应激信息表征主要集中在生理反应、认知反应、情感反应、行为反应4种类型。本研究从后疫情时代的视角出发探讨心理应激的信息表征,能够以常态化心理应激干预为目标为决策者提出长期心理支持服务建议,推进线上线下并举的心理服务。 展开更多
关键词 主题模型 心理应激 bertopic 问答平台 后疫情时代
下载PDF
基于BERTopic模型的组织成员工作投入研究的主题提取
9
作者 金国峰 陈泽峰 《情报探索》 2024年第8期73-81,共9页
[目的/意义]旨在通过科学计量方法,挖掘“组织成员工作投入”文献资源中蕴藏的主题,为后续研究提供参考和启示。[方法/过程]搜集中国知网学术期刊数据库中2002-2023年相关文献的摘要和发表年份,经过文本预处理,使用BERTopic模型进行主... [目的/意义]旨在通过科学计量方法,挖掘“组织成员工作投入”文献资源中蕴藏的主题,为后续研究提供参考和启示。[方法/过程]搜集中国知网学术期刊数据库中2002-2023年相关文献的摘要和发表年份,经过文本预处理,使用BERTopic模型进行主题提取和可视化分析。[结果/结论]国内现有的关于组织成员工作投入的研究可以分为研究内容和研究方法两大主题集群,均表现出多样化态势。主题时序演化分析揭示了组织成员工作投入研究正逐步转向对个体差异和心理健康的关注。未来研究可从新技术的影响、工作投入动态变化以及跨学科合作等方面进行拓展。 展开更多
关键词 工作投入 主题提取 bertopic 可视化分析
下载PDF
基于BERTopic模型的用户层次化需求及动机分析--以抖音平台为例 被引量:8
10
作者 刘洋 柳卓心 +1 位作者 金昊 陈飞扬 《情报杂志》 北大核心 2023年第12期159-167,共9页
[研究目的]在分析短视频平台的用户生成内容构成,提炼其在时间演化与社会事件影响下表现出的构造与演化规律,挖掘短视频用户的内在行为需要,探讨其用户参与行为的潜在动机因素。[研究方法]以抖音平台237万条短视频发布数据作为研究样本... [研究目的]在分析短视频平台的用户生成内容构成,提炼其在时间演化与社会事件影响下表现出的构造与演化规律,挖掘短视频用户的内在行为需要,探讨其用户参与行为的潜在动机因素。[研究方法]以抖音平台237万条短视频发布数据作为研究样本,使用BERTopic模型实现主题聚类,总结用户一定时间内的话题的关注情况,并在互联网视角下结合马斯洛需求层次理论,揭示用户参与行为背后需求与动机。[研究结论]首先,用户的需求关注度由高至低的排列顺序为尊重需求、安全需求、社交需求、自我实现需求与生理需求,且该关注顺序能在日常的时间推移中保持稳定;其次,用户对于社会事件有着较高的讨论度,相关事件能够显著影响时段内用户的视频内容构成,但对用户的关注程度分布影响微弱;最后,用户在发布视频过程中和点赞互动的关注热点存在差异。用户在发布视频时更关注尊重层次需求,而在浏览互动时,自我实现层次需求受到的关注程度显著提升。 展开更多
关键词 短视频 用户需求 用户行为 主题聚类 主题演化 bertopic模型 马斯洛需求理论
下载PDF
ESG Discourse Analysis Through BERTopic: Comparing News Articles and Academic Papers
11
作者 Haein Lee Seon Hong Lee +1 位作者 Kyeo Re Lee Jang Hyun Kim 《Computers, Materials & Continua》 SCIE EI 2023年第6期6023-6037,共15页
Environmental,social,and governance(ESG)factors are critical in achieving sustainability in business management and are used as values aiming to enhance corporate value.Recently,non-financial indicators have been cons... Environmental,social,and governance(ESG)factors are critical in achieving sustainability in business management and are used as values aiming to enhance corporate value.Recently,non-financial indicators have been considered as important for the actual valuation of corporations,thus analyzing natural language data related to ESG is essential.Several previous studies limited their focus to specific countries or have not used big data.Past methodologies are insufficient for obtaining potential insights into the best practices to leverage ESG.To address this problem,in this study,the authors used data from two platforms:LexisNexis,a platform that provides media monitoring,and Web of Science,a platform that provides scientific papers.These big data were analyzed by topic modeling.Topic modeling can derive hidden semantic structures within the text.Through this process,it is possible to collect information on public and academic sentiment.The authors explored data from a text-mining perspective using bidirectional encoder representations from transformers topic(BERTopic)—a state-of-the-art topic-modeling technique.In addition,changes in subject patterns over time were considered using dynamic topic modeling.As a result,concepts proposed in an international organization such as the United Nations(UN)have been discussed in academia,and the media have formed a variety of agendas. 展开更多
关键词 ESG bertopic natural language processing topic modeling
下载PDF
基于BERTopic模型的老年人健康信息需求主题演化研究——以新浪微博平台为例
12
作者 高春玲 姜莉媛 董天宇 《情报科学》 北大核心 2024年第4期111-118,共8页
【目的/意义】本研究利用BERTopic模型实现对老年人健康信息需求的主题挖掘,可为医疗机构和相关政府部门开展健康信息服务提供依据。【方法/过程】本研究以新浪微博平台中有关老年人健康的微博数据为研究对象,通过BERTopic模型提取需求... 【目的/意义】本研究利用BERTopic模型实现对老年人健康信息需求的主题挖掘,可为医疗机构和相关政府部门开展健康信息服务提供依据。【方法/过程】本研究以新浪微博平台中有关老年人健康的微博数据为研究对象,通过BERTopic模型提取需求话题,结合马斯洛需求层次理论对老年人健康信息需求进行演化分析,揭示社交媒体中有关老年人健康的主题内容分布特征,并进一步探究老年人健康信息需求的时间演化路径,为满足老年人的健康信息需求给予老年人更多的关注和支持。【结果/结论】研究结果显示,老年人健康信息需求涵盖财产安全、疫情防控、饮食消化、新冠疫情、医疗诊治、气候影响、骨骼健康、社会关怀、健康知识、科技助老和视觉障碍11个主题。主题演化与突发公共卫生事件关联并存在时间特性。【创新/局限】本研究将BERTopic模型与新浪微博平台数据结合,探索老年人健康信息需求。后续期待从多数据来源进一步挖掘老年人健康信息需求的具体侧重方向。 展开更多
关键词 老年人 健康信息需求 主题演化 bertopic模型 文本数据挖掘
原文传递
机遇与挑战:基于BERTopic的AI环境下图书馆主题文本挖掘 被引量:3
13
作者 徐汉青 滕广青 《情报科学》 北大核心 2024年第4期119-128,共10页
【目的/意义】挖掘AI环境下图书馆主题文本分布特征,以期为图书馆智能化转型和服务升级提供实践参考和理论支持。【方法/过程】本研究基于Web of Science数据库核心集合,应用BERTopic模型对检索到的相关文献进行主题识别与知识结构提取... 【目的/意义】挖掘AI环境下图书馆主题文本分布特征,以期为图书馆智能化转型和服务升级提供实践参考和理论支持。【方法/过程】本研究基于Web of Science数据库核心集合,应用BERTopic模型对检索到的相关文献进行主题识别与知识结构提取,以洞察AI在图书馆领域的研究现状和未来发展动向。【结果/结论】研究结果显示,AI环境下图书馆的研究主题主要可分为五类:图书馆智能化、馆藏资源开发、学术研究支持、信息资源建设、聊天机器人与智能代理。最后,结合主题内容分析,深入讨论了AI环境下图书馆的机遇与挑战。【创新/局限】研究工作采用先进的自然语言技术——BERTopic主题模型对AI环境下图书馆领域主题文本进行知识挖掘,未来的研究工作将纳入更广泛的数据来源,进行更加全面细致地研究。 展开更多
关键词 人工智能 图书馆 bertopic 主题识别 可视化
原文传递
基于BERTopic的计算机视觉领域热点技术主题及演化分析 被引量:1
14
作者 王蓝蓝 刘艳丽 《科学观察》 2024年第2期46-60,共15页
[目的/意义]当前人工智能发展迅猛,计算机视觉作为人工智能的重要分支之一,其新的热点技术主题不断涌现。通过对计算机视觉领域的前沿热点主题演化进行分析,可以深入了解计算机视觉领域的热点技术、发展方向和演化路径,为相关研究和实... [目的/意义]当前人工智能发展迅猛,计算机视觉作为人工智能的重要分支之一,其新的热点技术主题不断涌现。通过对计算机视觉领域的前沿热点主题演化进行分析,可以深入了解计算机视觉领域的热点技术、发展方向和演化路径,为相关研究和实践提供指导和参考。[方法/过程]基于德温特专利数据库中计算机视觉相关专利数据,采用BERTopic模型提取主题,并采用基于BERT的DTM模型进一步对主题进行演化分析,总结近年计算机视觉的研究前沿及热点主题。[结果/结论]计算机视觉领域的热点研究主题主要集中在自动驾驶、多模态人工智能、人机交互和三维建模等领域,计算机视觉整体表现出巨大的发展空间与潜力。 展开更多
关键词 bertopic 计算机视觉 热点主题 演化分析
原文传递
基于BERTopic模型的健康信息学主题挖掘与发展演化研究 被引量:1
15
作者 聂亚青 吴庭璋 +1 位作者 王若佳 翟兴 《情报科学》 北大核心 2024年第4期98-110,118,共14页
【目的/意义】基于文献研究,从研究主题和发展演化两个角度对健康信息学的发展现状进行梳理,为相关学者更好地从事健康信息学研究提供参考。【方法/过程】首先从Web of science中获取健康信息学文献,运用JCR和ESI学科分类方法将文献分... 【目的/意义】基于文献研究,从研究主题和发展演化两个角度对健康信息学的发展现状进行梳理,为相关学者更好地从事健康信息学研究提供参考。【方法/过程】首先从Web of science中获取健康信息学文献,运用JCR和ESI学科分类方法将文献分为医学、计算机、图书情报三个数据集;其次利用基于Bertopic模型主题挖掘法分析健康信息学在三个数据集中的研究主题和发展演化趋势。【结果/结论】从研究主题看,健康信息学主要包含六个研究主题:人工智能在健康领域的应用、健康知识服务、用户健康信息行为、信息技术在临床中的应用、健康信息存储与管理、人机交互系统应用;从发展趋势看,在保留各个学科自身特点的同时,实现多学科的交叉融合是健康信息学发展的必然趋势。【创新/局限】本文对健康信息学在不同学科中的研究异同进行了对比分析,有助于明晰健康信息学的起源和发展演进情况,同时为健康信息学未来的研究创新与空间拓展提供依据,但本文只收集了健康信息学在三个核心领域的研究数据,后期可以进一步扩大数据收集范围,从更广泛的学科领域对其进行更深入的分析。 展开更多
关键词 健康信息 研究主题 bertopic 主题挖掘 发展趋势
原文传递
智慧社区治理领域的文献主题挖掘与内容解析——基于CiteSpace和BERTopic模型的分析
16
作者 邹浙灿 《社会福利》 2024年第5期16-32,共17页
在信息技术革新与社区数字化背景下,为满足社区治理数智化的需求,对国内学者关于智慧社区治理的研究成果进行系统梳理与综合评述十分必要。通过CNKI数据库筛选出2014年1月—2024年3月的相关文献共646篇,运用BERTopic主题建模与Cite Spac... 在信息技术革新与社区数字化背景下,为满足社区治理数智化的需求,对国内学者关于智慧社区治理的研究成果进行系统梳理与综合评述十分必要。通过CNKI数据库筛选出2014年1月—2024年3月的相关文献共646篇,运用BERTopic主题建模与Cite Space可视化技术进行深度分析。分析包括研究趋势、核心议题与热点演变,在确保结论准确性的同时展望研究领域的未来走向。近十年的文献显示,在智慧社区治理领域,指导性和支持性政策文件的发布数量与文献发表量呈正相关关系;研究焦点包括社区公共服务管理、智慧城市创新、技术赋能与实践、社会基层治理四个层面;研究逐渐趋向于以人为本的服务导向和深化技术机理与机制探究,这些研究为智慧社区治理提供了理论与方法论支持。 展开更多
关键词 智慧社区 社区治理 主题挖掘 bertopic 主题模型
原文传递
科学文献主题建模方法及其效果评估研究 被引量:6
17
作者 逯万辉 《现代情报》 北大核心 2024年第4期22-31,共10页
[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和... [背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。 展开更多
关键词 主题建模 LDA Top2vec bertopic 科学文献 主题识别
下载PDF
多平台视角下用户知识交流主题挖掘与画像分析——以ChatGPT话题为例 被引量:1
18
作者 严炜炜 曹灿瑜 《现代情报》 北大核心 2024年第7期47-59,共13页
[目的/意义]基于多平台视角挖掘用户知识交流主题特征,构建用户画像标签体系,有助于全面理解用户利用差异化平台开展知识交流行为的规律偏好,为平台提供精确优化策略,为平台间生态建设提供参考依据。[方法/过程]采集大众社交平台、兴趣... [目的/意义]基于多平台视角挖掘用户知识交流主题特征,构建用户画像标签体系,有助于全面理解用户利用差异化平台开展知识交流行为的规律偏好,为平台提供精确优化策略,为平台间生态建设提供参考依据。[方法/过程]采集大众社交平台、兴趣交流平台、垂直知识平台3类典型平台中ChatGPT话题相关的原创博文及用户数据,采用BERTopic模型凝练知识交流主题,结合多平台数据特点,从自然属性、社会属性、知识交流行为属性和知识交流主题属性4个维度抽出画像标签,通过K-means聚类实现用户画像,呈现群组特征并进行平台差异对比。[结果/结论]研究识别出了应用场景、行业进展、未来探讨、相关产业、咨询求助、热门话题、使用感受、风险监督8大知识交流方向及46个主题;根据属性特征将用户划分为专业贡献型、综合共享型、社交求知型和话题潜力型4类,平台间知识交流主题和用户画像存在显著差异,各平台应采取差异化的激励方式,增强平台用户黏性。 展开更多
关键词 知识交流 多元平台 主题模型 bertopic 用户画像
下载PDF
国际顶级会议视角下人工智能领域的新兴主题发现研究
19
作者 朱相丽 张敬 +2 位作者 李伟伟 刘小平 耿国桐 《情报理论与实践》 北大核心 2024年第9期147-155,共9页
[目的/意义]基于文献研究,揭示人工智能领域具有研究和发展潜力的新兴研究主题,为捕捉领域的发展动态和未来趋势提供参考。[方法/过程]构建人工智能领域国际顶级会议文献数据集,运用BERTopic主题模型实现主题发现,利用新颖性、增长性、... [目的/意义]基于文献研究,揭示人工智能领域具有研究和发展潜力的新兴研究主题,为捕捉领域的发展动态和未来趋势提供参考。[方法/过程]构建人工智能领域国际顶级会议文献数据集,运用BERTopic主题模型实现主题发现,利用新颖性、增长性、主题强度,计算各研究主题的综合新兴潜力,遴选和评价领域新兴主题。[结果/结论]人工智能领域整体发展活力强,综合计算认为“目标检测”“联邦持续学习”和“梯度提升”是该领域当前最具潜力的新兴主题,“AI隐私保护”“3D点云”“音频与视觉交叉”是未来比较有潜力的新兴主题。文章提出的研究框架能够发现更具时效性、准确性和可解释性的研究结果,具备实际可行性。[局限]未对不同神经网络语言模型进行对比研究和综合分析,未来可综合利用不同模型,揭示更具系统性、针对性、方向性的研究结论。 展开更多
关键词 会议论文 人工智能 新兴主题 主题发现 bertopic
下载PDF
基于高质量文献的肿瘤学领域研究前沿识别研究
20
作者 朱韶华 李艳红 +1 位作者 张迅 黄海量 《医学信息学杂志》 CAS 2024年第7期49-54,共6页
目的/意义识别领域研究前沿,辅助科学研究者有效遴选和追踪重点研究主题,助力科研管理决策者动态调整政策导向。方法/过程以Web of Science 2012—2022年37927条肿瘤学领域高影响力期刊文献题录和高被引文献题录为数据样本,运用BERTop... 目的/意义识别领域研究前沿,辅助科学研究者有效遴选和追踪重点研究主题,助力科研管理决策者动态调整政策导向。方法/过程以Web of Science 2012—2022年37927条肿瘤学领域高影响力期刊文献题录和高被引文献题录为数据样本,运用BERTop提取主题,构建多维指标研究前沿识别模型,从多维度识别领域内不同类型的研究前沿。结果/结论所构建模型识别出肿瘤学领域热点研究前沿主题9个、新兴研究前沿主题14个、潜在研究前沿主题13个和衰退研究主题1个,具有有效性。 展开更多
关键词 研究前沿 bertopic 多维指标 肿瘤学 高质量文献
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部