期刊文献+
共找到249篇文章
< 1 2 13 >
每页显示 20 50 100
一种基于LDA模型的新兴主题识别与探测方法 被引量:2
1
作者 吴东雪 沈桂兰 《河南师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期72-80,共9页
新兴主题识别是科技研究领域识别新兴技术的重要方式,高效精准地识别新兴主题是早期辨识新兴技术研究方向的前提.提出一种基于LDA模型的新兴主题识别与趋势预测方法,通过LDA模型提取科技文献中的研究主题,构建主题强度、主题新颖度和复... 新兴主题识别是科技研究领域识别新兴技术的重要方式,高效精准地识别新兴主题是早期辨识新兴技术研究方向的前提.提出一种基于LDA模型的新兴主题识别与趋势预测方法,通过LDA模型提取科技文献中的研究主题,构建主题强度、主题新颖度和复合主题关注度的指标体系识别新兴主题,采用Prophet模型预测新兴主题的主题强度,探测未来发展趋势.以智慧农业领域最近14年的科研文献为数据集,对提出的识别和探测方法进行验证,识别出了5个新兴主题,并预测了未来3年的发展趋势,同时验证所提方法的有效性. 展开更多
关键词 主题识别 最优主题 新兴主题识别指标 Prophet模型
下载PDF
基于动态主题网络的新兴技术主题识别——以氢燃料电池领域为例
2
作者 慎金花 王薇 +1 位作者 张更平 陈红艺 《情报杂志》 CSSCI 北大核心 2024年第9期92-100,共9页
[研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题... [研究目的]新兴技术代表着未来的技术发展方向,是抢占科技前沿制高点必须把握的关键技术,准确识别新兴技术对国家发展具有重要战略意义。[研究方法]综合专利文本信息和分类信息,构建SBERT-LDA-IPC模型,识别各时间段的技术主题;根据主题相似度矩阵绘制动态主题网络,识别具有创新性和连续性的主题为候选主题,评估候选主题的新颖性和影响力,确定新兴技术主题;以氢燃料电池领域为例进行实证检验。[研究结论]研究表明,SBERT-LDA-IPC模型提高了主题聚类的连贯性和准确性,结合国家在氢燃料电池产业发布的系列政策作为验证依据,识别出的三个新兴技术主题,与国家政策制定和产业发展方向一致。 展开更多
关键词 动态主题网络 主题演化 主题识别 专利信息 新兴技术 SBERT-LDA-IPC模型 氢燃料电池
下载PDF
基于ESI的化学与人工智能领域热点交叉主题识别与趋势研究
3
作者 韩军伟 汤国昌 赵世杰 《中国科学基金》 CSSCI CSCD 北大核心 2024年第5期909-919,共11页
探讨化学领域与人工智能的交叉现况,挖掘热点交叉研究主题,能够为基金项目资助决策提供有力依据,从而优化资源分配,促进化学领域前沿科学进展。本研究基于交叉领域的期刊文献和基金项目数据,从发文量、国家/机构合作、学科交叉三个维度... 探讨化学领域与人工智能的交叉现况,挖掘热点交叉研究主题,能够为基金项目资助决策提供有力依据,从而优化资源分配,促进化学领域前沿科学进展。本研究基于交叉领域的期刊文献和基金项目数据,从发文量、国家/机构合作、学科交叉三个维度揭示交叉态势,通过期刊文献关键词共现与聚类分析识别热门交叉研究主题,并进一步结合中国、美国在各主题下的基金项目资助情况研究交叉领域的发展趋势。研究发现化学领域与人工智能交叉的研究随时间发展显著增加,识别出泛函理论、虚拟筛选等七个热点交叉主题,揭示了人工智能在化学领域的应用潜力以及发展趋势,并给予基金资助应针对不同的主题定制不同资助策略的启示。 展开更多
关键词 人工智能 化学领域 知识图谱 交叉主题识别 自然科学基金
下载PDF
国内数字人文领域文献主题识别及框架研究——基于LDA和Word2Vec的分析
4
作者 冷雪卓 张涛 崔文波 《图书馆学刊》 2024年第3期104-110,共7页
数字人文能够活化中国文化,向世界更好地展示中国声音,讲好中国故事。从数字人文领域研究成果中识别文献主题,能够客观地帮助该领域学者快速了解与掌握国内数字人文研究内容和动向,并形成国内该领域基于文献研究的框架,为相关研究提供... 数字人文能够活化中国文化,向世界更好地展示中国声音,讲好中国故事。从数字人文领域研究成果中识别文献主题,能够客观地帮助该领域学者快速了解与掌握国内数字人文研究内容和动向,并形成国内该领域基于文献研究的框架,为相关研究提供理论支撑。以CNKI中数字人文领域的1886篇文献为样本,综合使用LDA、Word2Vec及共现分析等文本计算方法抽取主题,形成以信息技术为驱动,以数字艺术、文化遗产、历史档案等主要研究领域为学科建设突破口,以人才培养为最终目标的国内数字人文领域研究框架。 展开更多
关键词 数字人文 文本计算 主题识别 研究框架 LDA
下载PDF
基于LDA-ARIMA的我国智能手机关键技术主题识别与演化分析
5
作者 庞庆华 姚玉康 张丽娜 《情报工程》 2024年第3期49-62,共14页
[目的/意义]专利是技术能力的表现形式,包含关键技术主题信息。以智能手机专利数据为基础,提出关键技术主题的识别和演化分析方法,帮助企业获取行业内的技术信息,调整专利研究的成本与精力投入。[方法/过程]首先,选择专利数据库和高级... [目的/意义]专利是技术能力的表现形式,包含关键技术主题信息。以智能手机专利数据为基础,提出关键技术主题的识别和演化分析方法,帮助企业获取行业内的技术信息,调整专利研究的成本与精力投入。[方法/过程]首先,选择专利数据库和高级检索内容,下载和导出专利标题和摘要数据,并对数据进行去停用词和jieba分词等处理;其次,构建困惑度求解模型,确定最优主题数,再将已经分好词的文本导入LDA模型进行主题挖掘,得到每个技术主题下关键词语的分布;再次,将主题热度转化为时间序列,进行平稳性检测和白噪声检验,确定ARIMA模型参数后应用预测;最后,依据每个技术主题下提取的特征词确定关键技术主题并进行解读,通过时间序列预测结果对关键技术主题进行演化分析。[结果/结论]以智能手机为研究对象,成功识别出屏幕、电池与充电、生物识别系统等15个关键技术主题,挖掘出各主题不同的演化发展特征,根据演化趋势分析提出建议,验证了本文主题识别与演化分析方法的可行性与有效性。 展开更多
关键词 关键技术 主题识别 LDA模型 主题演化 ARIMA模型 智能手机
下载PDF
基于三维主题特征测度的新兴主题识别研究
6
作者 郑德俊 程为 《情报学报》 CSSCI CSCD 北大核心 2024年第2期167-180,共14页
识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表... 识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表示,构建基于时间、引用和关联的三维主题特征指标框架,用于新兴主题识别;并以文本分类领域为例,验证本文方法的可行性与有效性。研究发现,以文献为基本单位表示主题能辅助主题深入挖掘,三维主题特征指标框架具有较好的适应性与扩展性,本文提出的新兴主题识别方法存在泛化应用的参考价值。在理论层面,能为新兴主题识别的相关研究提供一种可参考的方法和思路;在实践层面,可作为一种参考工具应用于科技情报分析、领域发展态势分析等场景。 展开更多
关键词 新兴主题识别 主题建模 主题特征测度 文本分类
下载PDF
基于BERT-LDA的国外LIS领域学科交叉研究演化分析与前沿主题识别
7
作者 袁毅 孟盈 《数字图书馆论坛》 CSSCI 2024年第9期1-15,共15页
识别学科交叉研究的前沿主题,并对演化趋势进行分析,有助于揭示学科交叉融合的方向,为未来创新性、突破性研究提供参考。首先,基于引文视角构建测度论文学科交叉性的指标,识别具有学科交叉性的研究论文;其次,通过BERT-LDA模型识别研究主... 识别学科交叉研究的前沿主题,并对演化趋势进行分析,有助于揭示学科交叉融合的方向,为未来创新性、突破性研究提供参考。首先,基于引文视角构建测度论文学科交叉性的指标,识别具有学科交叉性的研究论文;其次,通过BERT-LDA模型识别研究主题,利用余弦相似度计算主题之间的相似度,构建主题演化路径;最后,基于新颖度、增长性、关注度、影响力构建前沿主题识别指标体系,识别具有前沿性的学科交叉研究主题。以图书情报学(Library and Information Science,LIS)为例展开研究,研究结果显示,2004—2023年该学科领域的交叉研究主题呈现出逐渐细化和深入的特点,主要集中在信息挖掘与知识发现、互联网信息行为、医疗信息学3个方面;现阶段学科交叉研究前沿主题为医疗数据模型、舆情治理与情感分析、机器学习与深度学习;基于信息技术的研究方法和其在不同领域的应用研究具有良好的应用前景,有可能成为未来LIS领域的核心研究主题。 展开更多
关键词 研究前沿 主题演化 学科交叉 BERT-LDA 主题识别 图书情报学 信息科学 图书馆学
下载PDF
基于隐含空间模型降维和LDA模型的学科主题识别研究
8
作者 王婧 武帅 《情报探索》 2024年第2期1-11,共11页
【目的/意义】现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。【方法/过程】首先,运用传统... 【目的/意义】现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。【方法/过程】首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。【结果/结论】提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。 展开更多
关键词 学科主题识别 LDA主题挖掘 图书情报与档案管理学科词库 隐含位置聚类模型 共词网络
下载PDF
基于时间序列分析的潜在学科交叉前沿主题识别研究 被引量:2
9
作者 张雪 张志强 朱冬亮 《情报理论与实践》 CSSCI 北大核心 2024年第4期152-162,共11页
[目的/意义]识别学科交叉前沿主题并预测其发展趋势,有助于了解学科内部结构,挖掘领域重点部署方向,为未来创新性、突破性研究提供参考。[方法/过程]以美国国家自然科学基金项目及其产出论文分别作为前端、后端数据,首先,从三个维度测... [目的/意义]识别学科交叉前沿主题并预测其发展趋势,有助于了解学科内部结构,挖掘领域重点部署方向,为未来创新性、突破性研究提供参考。[方法/过程]以美国国家自然科学基金项目及其产出论文分别作为前端、后端数据,首先,从三个维度测度项目学科交叉度,遴选领域学科交叉项目;其次,从主题关注度、新颖度等方面构建研究前沿主题识别指标体系,对学科交叉主题进行二次遴选,满足阈值的即为学科交叉前沿主题;再次,对比时间序列分析模型ARIMA和LSTM主题拟合效果并选择误差最小模型对学科交叉前沿主题进行趋势预测分析;最后,以生物科学领域为例对方法的有效性和可行性进行实例验证。[结果/结论]生物科学领域在纳米生物学技术、全球变化和海洋环境生物学、生物信息学及壶菌病与两栖动物多样性方面有较好发展前景。经专家咨询和已有研究对比分析,该方法可有效识别领域学科交叉前沿主题,并对其未来研究趋势走向有一定参考借鉴。 展开更多
关键词 学科交叉前沿主题识别 ARIMA模型 LSTM模型 趋势预测
下载PDF
基于主题模型的领域新兴交叉主题识别研究——以作物智能育种为例
10
作者 齐世杰 串丽敏 +2 位作者 赵静娟 张辉 贾倩 《数字图书馆论坛》 CSSCI 2024年第9期38-47,共10页
准确识别学科交叉前沿主题,有助于了解学科发展脉络,发掘领域重点发展方向,为未来创新性、突破性研究提供参考。提出一种识别新兴交叉主题的方法。首先,提出一种结合学科多样性和学科凝聚性的论文学科交叉性计算方法;其次,利用该方法筛... 准确识别学科交叉前沿主题,有助于了解学科发展脉络,发掘领域重点发展方向,为未来创新性、突破性研究提供参考。提出一种识别新兴交叉主题的方法。首先,提出一种结合学科多样性和学科凝聚性的论文学科交叉性计算方法;其次,利用该方法筛选出具有高学科交叉性的论文,获得潜力论文数据集;再次,采用结合领域词典改进的LDA模型进行研究主题识别;最后,通过构建融合新颖性、突破性和影响力的多维度新兴主题测量模型,识别出新兴交叉主题。选择作物智能育种领域进行实证分析,识别出4个新兴交叉主题,通过资料分析法验证方法的有效性,对基于论文数据识别新兴交叉主题的方法研究与实践具有参考价值。 展开更多
关键词 学科交叉研究 新兴主题识别 主题建模 作物智能育种
下载PDF
基于LDA的印太战略热点主题识别及演化分析
11
作者 冯飞扬 马德辉 《情报探索》 2024年第11期41-49,共9页
[目的/意义]伴随着美国国家安全战略的对华竞争转向,日益激化的地缘政治博弈推动印太战略应运而生,并逐渐成为影响地区安全及其未来走向的重要议题。深入理解印太战略,对于增强我国战略应对具有重要意义。[方法/过程]在梳理印太战略演... [目的/意义]伴随着美国国家安全战略的对华竞争转向,日益激化的地缘政治博弈推动印太战略应运而生,并逐渐成为影响地区安全及其未来走向的重要议题。深入理解印太战略,对于增强我国战略应对具有重要意义。[方法/过程]在梳理印太战略演进脉络的基础上,采用LDA模型对国内外学术文献进行分析,从主题识别和主题演化两个维度,探究研究领域的热点主题与发展趋势。[结果/结论]印太战略的热点主题呈现出高度地缘政治性、聚焦国家间战略互动以及经济与安全议题并重的特征;其演化规律集中体现为全球战略重心的印太转向、美国印太战略的纵深推进以及南海台海议题的持续升温。 展开更多
关键词 印太战略 LDA模型 主题识别 主题演化
下载PDF
专利视角下智能网联汽车技术主题识别与演化研究 被引量:1
12
作者 戚湧 孙嘉烨 《科技创业月刊》 2024年第6期1-9,共9页
全球汽车行业正在经历巨大变革,电动化、智能化和网联化将成为未来汽车技术发展的潮流。智能网联汽车是国家重点发展的战略性新兴产业,将汽车、电子和信息技术深度融合在一起,对于推进我国制造强国和网络强国建设具有重大意义。如何用... 全球汽车行业正在经历巨大变革,电动化、智能化和网联化将成为未来汽车技术发展的潮流。智能网联汽车是国家重点发展的战略性新兴产业,将汽车、电子和信息技术深度融合在一起,对于推进我国制造强国和网络强国建设具有重大意义。如何用科学方法来识别智能网联汽车领域技术主题,指导智能网联汽车产业技术选择,给出相应的政策建议,具有重要的学术价值与应用前景。首先总结归纳了国内外的相关研究,阐述了技术主题识别、技术演化的理论基础,并构建相应的研究模型与框架;然后对智能网联汽车专利数据进行检索分析,再利用LDA模型完成相关专利文献的主题识别,并在此基础上构建HMM模型分析相应技术主题的演化关系;最后得出该领域技术主题的演化路径及规律。针对智能网联汽车领域共识别出20个技术主题,并以此构建技术主题演化关系有向网络图,可为相关企业及研发机构提供决策参考。 展开更多
关键词 技术主题识别 技术演化 智能网联汽车 专利文献
下载PDF
面向国防科技前沿的开源信息主题识别
13
作者 刘任烨 于凯 《国防科技》 2024年第3期58-65,共8页
面向国防科技前沿细颗粒领域主题出现的不平衡数据分类问题,提出一种基于融合特征的国防科技前沿主题识别与分类模型。该模型在基于Sentence-BERT预训练模型提取的语义特征基础上,融合基于命名实体识别技术提取的实体特征,实现面向国防... 面向国防科技前沿细颗粒领域主题出现的不平衡数据分类问题,提出一种基于融合特征的国防科技前沿主题识别与分类模型。该模型在基于Sentence-BERT预训练模型提取的语义特征基础上,融合基于命名实体识别技术提取的实体特征,实现面向国防科技前沿领域特定专题的追踪、监测能力构建。实验结果表明,融合特征主题识别与分类模型有较好的模型指标。该模型已在具体实践中取得一定成效。 展开更多
关键词 国防科技前沿 主题识别 融合特征 语义相似度 命名实体识别
下载PDF
基于BERTopic模型的数字政府治理领域的主题识别与内容分析
14
作者 高凡 徐思佳 《情报理论与实践》 CSSCI 北大核心 2024年第8期95-106,共12页
[目的/意义]在信息技术创新、政府数字化转型的背景下,中国学术界输出的“数字政府治理”相关研究体量较大,现阶段亟待对其进行科学整理和综述概览,以回应“政府治理现代化”目标对理论研究的新要求。[方法/过程]以2011-2023年间中国知... [目的/意义]在信息技术创新、政府数字化转型的背景下,中国学术界输出的“数字政府治理”相关研究体量较大,现阶段亟待对其进行科学整理和综述概览,以回应“政府治理现代化”目标对理论研究的新要求。[方法/过程]以2011-2023年间中国知网数据库收录的有关数字政府治理研究的1829篇文献为数据来源,借助深度学习模型BERTopic和文献计量法CiteSpace相互验证分析数字政府治理领域的研究阶段、研究关键词、研究热点主题及内容等,使得结果具有高准确性和强解释性,以科学有效地探测主题取向及特征,展望数字政府治理领域的未来研究方向。[结果/结论]中国数字政府治理研究在过去的10年间发展迅猛,已成为学者探索的热点论域;现有文献研究热点整体上聚焦于价值导向、治理模式进化、技术工具嵌入;重点主题关注的是“政府数据开放共享研究”“基于数字技术的政务服务改革研究”“城乡场域下的数字化治理研究”“数字政府治理水平的评估研究”及“数字化转型下具体治理领域的实践研究”。未来,数字政府治理仍然是一个具有持续性拓展空间的研究领域,将逐步实现数字政府治理的更广场域触达、精准滴灌、多项学科融合和技术实用主义。 展开更多
关键词 数字政府 政府治理 主题识别 BERTopic 主题模型
下载PDF
FPC-Kmeans++专利聚类分析与技术主题识别研究———以无人机领域为例
15
作者 刘俊 王修来 《软件工程》 2024年第5期14-20,共7页
针对专利技术主题识别效率偏低、识别难度大等问题,文章提出了FPC-Kmeans++(Kmeans plus plus with feature phrase clusters)专利聚类分析与技术主题识别方法,该方法创新性地使用特征短语替代传统的分词结果,作为专利数据分析的基础。... 针对专利技术主题识别效率偏低、识别难度大等问题,文章提出了FPC-Kmeans++(Kmeans plus plus with feature phrase clusters)专利聚类分析与技术主题识别方法,该方法创新性地使用特征短语替代传统的分词结果,作为专利数据分析的基础。文章以无人机专利为例,对该方法进行了实证检验。实验结果表明,相较于传统的Kmeans++(Kmeans plus plus)和LDAKmeans++(Kmeans plus plus with Latent Dirichlet Allocation)方法,该方法能更精确地判断出最佳主题数和得到层次更鲜明的聚类效果,展现了其在专利主题识别上的优势。并且,相较于其他对比算法,文章提出的NER-FPP(Named Entity Recognition with Feature Phrase Probability)算法在专利特征短语提取上效果最好,F1值分数最高,达到了93.36%。 展开更多
关键词 主题识别 专利聚类 NER TF-IDF
下载PDF
金融风险管理领域新兴研究主题识别——以知网核心期刊数据为例
16
作者 张良弛 杨欣谊 王伟 《情报探索》 2024年第6期34-42,共9页
[目的/意义]识别金融风险管理领域新兴研究主题能够发现未来金融风险管理的业务重点,促进学术研究成果向业界转化,为金融风险管理研究和实践提供参考。[方法/过程]以中国知网期刊文献数据库2007—2021年的金融风险管理领域相关文献为例... [目的/意义]识别金融风险管理领域新兴研究主题能够发现未来金融风险管理的业务重点,促进学术研究成果向业界转化,为金融风险管理研究和实践提供参考。[方法/过程]以中国知网期刊文献数据库2007—2021年的金融风险管理领域相关文献为例,识别金融风险管理领域的新兴研究主题。首先利用LDA主题模型识别研究主题,继而改进支持文档衡量方法,将支持权重融合到指标计算中,建立由新颖度、成长性和影响力组成的新兴研究主题识别模型,最后结合领域专家知识验证新兴主题识别的有效性。[结果/结论]该方法发现了互联网金融风险和中小商业银行的风险两个新兴研究主题,将识别结果与权威机构报告对比分析,证明了本文识别的新兴主题的有效性和准确性。 展开更多
关键词 新兴主题 金融风险管理 LDA模型 主题识别
下载PDF
基于LDA-BERT模型的金融科技领域主题识别与分类研究
17
作者 曹雪朋 《金融科技时代》 2024年第8期27-32,共6页
本研究采用LDA-BERT模型,对金融科技领域的文本主题进行识别与分类。LDA模型用于文本预处理和特征提取,BERT模型可以增强语义理解能力,提升主题识别的准确性,自动编码器有效融合LDA与BERT生成的特征向量,形成更加全面、精确的特征表示,K... 本研究采用LDA-BERT模型,对金融科技领域的文本主题进行识别与分类。LDA模型用于文本预处理和特征提取,BERT模型可以增强语义理解能力,提升主题识别的准确性,自动编码器有效融合LDA与BERT生成的特征向量,形成更加全面、精确的特征表示,K-means算法则实现精准分类。该模型在金融科技文本主题识别与分类任务中展现出了卓越的性能,为金融科技领域的文本分析提供了高效、专业的工具与方法。 展开更多
关键词 金融科技 LDA-BERT模型 主题识别 分类研究
下载PDF
乡村振兴背景下乡村文化建设主题识别及演化分析
18
作者 赵婧文 李秀霞 《村委主任》 2024年第9期194-196,200,共4页
文化振兴是乡村振兴的灵魂,也是推动乡村文化建设的重要手段。本研究以《农民日报》为数据源,结合文档向量化技术和聚类分析法,分析乡村文化建设主题的演化趋势。研究发现,2017—2019年关注乡村公共文化空间、乡村旅游等;2020—2021年... 文化振兴是乡村振兴的灵魂,也是推动乡村文化建设的重要手段。本研究以《农民日报》为数据源,结合文档向量化技术和聚类分析法,分析乡村文化建设主题的演化趋势。研究发现,2017—2019年关注乡村公共文化空间、乡村旅游等;2020—2021年关注乡村旅游、文明乡风、民俗传承等;2022—2023年聚焦古村落保护、农产品品牌化、数字乡村建设等。通过深入分析乡村文化建设的主题内容和演变轨迹,可为我国乡村文化建设提供参考借鉴。 展开更多
关键词 乡村文化建设 乡村振兴 《农民日报》 乡村旅游 古村落保护 主题识别 主题内容 聚类分析法
下载PDF
融合Sentence-BERT和LDA的评论文本主题识别 被引量:10
19
作者 阮光册 黄韵莹 《现代情报》 CSSCI 2023年第5期46-53,共8页
[目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的... [目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的向量特征,同时,采用LDA模型获取评论文本的概率主题向量,随后使用自动编码器连接两组向量,运用K-means算法对潜在空间向量进行聚类,从类簇中获取上下文主题信息。[结果/结论]通过对评论文本数据集的实验,本文方法可以较好地获得具有语义信息的主题词。Sentence-BERT模型与LDA结合,增加了模型的复杂性。通过对比,本文方法获得的主题一致性指标(Coherence)优于目前常见的评论文本主题识别方法。 展开更多
关键词 Sentence-BERT LDA模型 评论文本 主题识别
下载PDF
我国信息资源管理学科及其邻近学科视角下的新兴主题识别 被引量:2
20
作者 钱旦敏 楼筱湾 +2 位作者 王华麟 王文敬 马野青 《图书馆论坛》 CSSCI 北大核心 2023年第9期54-64,共11页
文章通过对我国信息资源管理学科及其邻近学科新兴主题的识别研究,为我国信息资源管理学科领域学者提供研究方向,并为信息资源管理学科与邻近学科开展合作研究提供思路,助力信息资源管理学科守正创新、挖掘学科内在发展机制、支撑科技... 文章通过对我国信息资源管理学科及其邻近学科新兴主题的识别研究,为我国信息资源管理学科领域学者提供研究方向,并为信息资源管理学科与邻近学科开展合作研究提供思路,助力信息资源管理学科守正创新、挖掘学科内在发展机制、支撑科技战略决策和前瞻学科应用价值。首先以CJFD中“图书情报与数字图书馆”类文献作为信息资源管理学科研究对象,将与该学科同属于一级类目“信息科技”下的其他9个二级类目作为信息资源管理邻近学科纳入研究对象;检索CJFD中这10个学科自2012年至今的高影响力文献,并提取关键词。然后选用AP算法对关键词进行主题聚类,利用灰预测模型自建新兴主题探测指标,识别信息资源管理学科新兴主题;自建主题友好度指标,识别信息资源管理邻近学科友好型新兴主题。最终模型识别并验证得出5个信息资源管理学科新兴主题:在线健康社区、信息资源管理学科建设、公共文化服务、学术影响力、数字记忆;在此基础上得到邻近学科中与信息资源管理学科有高友好度的5个邻近学科友好型新兴主题:机器学习、数字治理、融媒体、学术期刊与新媒体、数智赋能。 展开更多
关键词 信息资源管理 新兴主题识别 AP算法 灰预测模型
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部