期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于LDA主题模型的“双一流”高校图书馆用户评论文本数据挖掘 被引量:1
1
作者 张文德 徐子杨 赵立红 《情报探索》 2024年第7期120-127,共8页
[目的/意义]图书馆用户评论中包含用户对图书馆服务和管理意见的重要信息,对用户评论文本进行深度挖掘,旨在探究用户关心主题及其情感态度、隐含诉求,为高校图书馆建设提供理论依据和数据支持。[方法/过程]以“双一流”高校图书馆为研... [目的/意义]图书馆用户评论中包含用户对图书馆服务和管理意见的重要信息,对用户评论文本进行深度挖掘,旨在探究用户关心主题及其情感态度、隐含诉求,为高校图书馆建设提供理论依据和数据支持。[方法/过程]以“双一流”高校图书馆为研究对象,收集用户在大众点评网上的评论数据,通过LDA主题建模,得到当前用户评论主要集中在信息资源建设、娱乐休闲服务、馆内设施环境三个维度,进而分别分析三个维度下的关键词共现网络和用户情感态度。[结果/结论]用户对高校图书馆的总体情感态度是积极正向的,但在纸质资源管理、社会化服务、馆内人性化服务等方面表现出负面情绪。 展开更多
关键词 高校图书馆 用户评论 LDA主题分析 共现网络 情感分析
下载PDF
基于Citespace和LDA主题模型的顾客价值共创文献研究
2
作者 梁仲华 关辉 《中国商论》 2024年第2期97-100,共4页
在激烈的市场竞争中,企业发现与顾客共同创造价值非常重要。然而,研究顾客价值共创的领域非常广泛且复杂。本文首先回顾了顾客价值共创的定义和概念,并利用LDA主题模型和Citespace软件分析2008—2023年533篇关于顾客价值共创的文献。关... 在激烈的市场竞争中,企业发现与顾客共同创造价值非常重要。然而,研究顾客价值共创的领域非常广泛且复杂。本文首先回顾了顾客价值共创的定义和概念,并利用LDA主题模型和Citespace软件分析2008—2023年533篇关于顾客价值共创的文献。关键词聚类结果表明品牌共创、服务主导逻辑、共创行为、虚拟社区、公共服务和价值共毁是当前研究的主要内容。本文使用LDA主题模型对文献摘要进行分析,研究主题包括品牌导向和美学、顾客满意度与关系、创业者与经理的视角、定量方法和数据研究、价值和忠诚度以及转型性共创六个方面。最后,本文对研究结果进行了讨论,并提出未来研究的方向和建议,以促进顾客价值共创领域的发展。 展开更多
关键词 顾客价值共创 LDA主题模型 品牌共创 虚拟社区 CITESPACE 消费经济学
下载PDF
政策关注、测量与经济效益——基于区域协同发展政策文本的LDA建模
3
作者 陈建垒 王纯 《统计研究》 CSSCI 北大核心 2024年第9期32-43,共12页
推动区域协同发展是贯彻落实国家区域协调发展战略、实现经济高质量发展的重要举措。本文以自然语言处理技术为基础,利用隐含狄利克雷分布(LDA)模型对政府颁布的区域协同发展政策文本进行建模分析,识别出京津冀、长三角和珠三角城市群... 推动区域协同发展是贯彻落实国家区域协调发展战略、实现经济高质量发展的重要举措。本文以自然语言处理技术为基础,利用隐含狄利克雷分布(LDA)模型对政府颁布的区域协同发展政策文本进行建模分析,识别出京津冀、长三角和珠三角城市群政策的关注焦点,评估了区域协同发展政策的经济效益。研究发现,京津冀城市群重点关注生态环境治理的政策协同,长三角、珠三角城市群则聚焦在经济发展和行政治理的政策协同,但二者在具体方面仍有差异;经济发展和行政治理协同对区域经济发展具有促进作用,而生态环境方面的共同治理在短期内可能会影响区域内经济表现。进一步分析表明,由于地区禀赋和经济基础差异,区域协同发展政策对长三角城市群临近地区产生正溢出效应,而对珠三角城市群临近地区的溢出效应为负。本研究对于推动区域内政府合作、构建国内统一大市场具有重要的政策含义。 展开更多
关键词 区域协同发展 自然语言处理 LDA模型 经济效益
下载PDF
基于文本挖掘的开放政府数据与数字经济政策协同研究 被引量:1
4
作者 陈美 赵子莜 《情报杂志》 CSSCI 北大核心 2024年第4期184-191,88,共9页
[研究目的]政府数据开放已经成为政府转型过程中的重要目标之一,研究数字经济政策和开放政府数据政策之间的协同性,有助于政府的数字化转型及政策更有效的实施。[研究方法]使用LDA模型对采集到的省级和市级政策文本进行预处理,将政策文... [研究目的]政府数据开放已经成为政府转型过程中的重要目标之一,研究数字经济政策和开放政府数据政策之间的协同性,有助于政府的数字化转型及政策更有效的实施。[研究方法]使用LDA模型对采集到的省级和市级政策文本进行预处理,将政策文本高频词分成政策执行主体、政策目标以及政策工具三个维度,使用共现网络分析和关联规则两种方法分别对高频词进行挖掘,探讨两种政策之间的协同性,并对两种方法得出的结论进行对比,探讨两种方法之间的差异性。[研究结论]市级开放政府数据与数字经济政策在政策执行主体、政策目标和政策工具三个维度上具备一定协同性,但两种政策也在某方面存在较大差异,省级政策文件则体现出了纵向和横向的协同性;关联规则和共现网络分析得出的结论具有较高一致性,但两种方法在信息的挖掘上各有优劣。 展开更多
关键词 开放政府数据 数字经济政策 政策协同 LDA 关联规则 共现网络分析 文本挖掘
下载PDF
基于情感-主题协同演化模型的突发信息安全事件网络舆情分析
5
作者 李善成 刘慧 《图书情报研究》 2024年第1期120-128,F0003,共10页
[目的/意义]针对突发信息安全事件,探索舆情生命周期中各阶段公众的情感倾向与关注的热点主题,快速挖掘网络舆情演化特征与发展趋势,有助于政府、企业和相关部门对舆情的监测与处理。[方法/过程]以滴滴事件为例,首先搜集事件相关微博评... [目的/意义]针对突发信息安全事件,探索舆情生命周期中各阶段公众的情感倾向与关注的热点主题,快速挖掘网络舆情演化特征与发展趋势,有助于政府、企业和相关部门对舆情的监测与处理。[方法/过程]以滴滴事件为例,首先搜集事件相关微博评论文本,对舆情演化周期进行阶段划分,使用基于改进TF-IDF方法和LDA模型对各阶段进行主题挖掘,并构建融入领域情感词与表情符号的情感词典对各阶段下不同主题进行情感分析,得到舆情周期内主题与情感特征的协同演化趋势。[结果/结论]所提研究方法得到的舆情演化趋势能够有效反映突发事件各阶段的主题情感特征,有助于引导管控网络舆情,为舆情治理措施的制定提供科学依据。 展开更多
关键词 网络舆情 主题挖掘 LDA 情感词典 协同演化
下载PDF
洪涝灾害研究主题的时空差异性:中英文文献比较研究
6
作者 贺蔚杰 田健 +2 位作者 宋苑震 张家豪 曾坚 《安全与环境学报》 CAS CSCD 北大核心 2024年第11期4391-4400,共10页
在全球气候变化背景下,洪涝灾害已成为威胁人群生命财产安全的世界性问题。目前,关于洪涝灾害的研究已较为丰富,需进行系统性梳理和总结。为探究国内外洪涝灾害的研究现状与趋势,采用文献计量的分析方法,对2003—2022年中国知网(China N... 在全球气候变化背景下,洪涝灾害已成为威胁人群生命财产安全的世界性问题。目前,关于洪涝灾害的研究已较为丰富,需进行系统性梳理和总结。为探究国内外洪涝灾害的研究现状与趋势,采用文献计量的分析方法,对2003—2022年中国知网(China National Knowledge Infrastructure,CNKI)和WoS(Web of Science)数据库中主题为洪涝灾害的中英文文献进行文本分析。从关键词共现模式、研究主题的时间聚类及空间分布三个角度,探索洪涝灾害相关研究的主题演进模式和地理分布特征,并总结未来发展方向。结果表明:(1)在研究关键词共现模式方面,中文研究更加关心洪涝灾害区域影响及管理策略等灾害的后续影响方面,英文研究则更倾向于探究洪涝灾害的成因,从气候变化与孕灾环境角度分析洪涝灾害。中英文研究均强调新兴技术在洪涝灾害研究中的应用。(2)在研究主题时间聚类方面,中文研究在21世纪初期追随英文研究的关注热点,并在2015年前后逐渐形成具有中国本土化特色的研究框架,强调使用多源数据和多种算法模型进行定量化分析,主要着眼于城市化发展对洪涝灾害的多时段、多尺度干预效应。(3)在研究主题空间分布方面,沿海经济发达地区受到研究者更多的关注,表明洪涝灾害研究的主题与数量受到研究区域的地理位置、气候条件和社会经济发展水平的影响。 展开更多
关键词 公共安全 洪涝灾害 文本分析 共现网络 潜在狄利克雷分配(LDA)模型 地理解析 对比分析
下载PDF
基于改进LDA的在线医疗评论主题挖掘 被引量:25
7
作者 高慧颖 刘嘉唯 杨淑昕 《北京理工大学学报》 EI CAS CSCD 北大核心 2019年第4期427-434,共8页
对利用主题模型挖掘医疗服务主题进行了深入研究,针对LDA主题模型用于医疗评论主题挖掘中存在的语义稀疏、共现信息不足等问题,提出一种基于词共现分析与LDA主题模型结合的CO-LDA模型.首先使用词共现分析方法对评论语料库进行分析,得到... 对利用主题模型挖掘医疗服务主题进行了深入研究,针对LDA主题模型用于医疗评论主题挖掘中存在的语义稀疏、共现信息不足等问题,提出一种基于词共现分析与LDA主题模型结合的CO-LDA模型.首先使用词共现分析方法对评论语料库进行分析,得到词共现矩阵.其次利用LDA主题模型对语料评论进行建模表示,挖掘出患者对医疗服务的关注点.基于平均最小JS距离、平均肯德尔等级相关系数τ_b及平均TF-IDF 3个指标对比CO-LDA模型与传统LDA模型在医疗评论主题挖掘中的应用效果,实验最终表明CO-LDA模型识别主题的一致性和主题质量优于LDA模型.将实验结果与中国《医院评价标准》进行对比,一致性较高,说明基于CO-LDA的在线医疗评论主题挖掘方法的有效性. 展开更多
关键词 主题抽取 医疗服务 语义稀疏 co-lda 词共现分析
下载PDF
学科交叉视角下的网络舆情研究主题比较分析——以国内图书情报学和新闻传播学为例 被引量:34
8
作者 王连喜 曹树金 《情报学报》 CSSCI CSCD 北大核心 2017年第2期159-169,共11页
从学科交叉视角探索网络舆情在图书情报学和新闻传播学中的研究共性和差异性。以CNKI数据库中两门学科核心期刊的网络舆情研究文献为样本,在关键词规范化的基础上,一方面从微观角度结合词频和TF-IDF方法提取重要关键词,并对两门学科的... 从学科交叉视角探索网络舆情在图书情报学和新闻传播学中的研究共性和差异性。以CNKI数据库中两门学科核心期刊的网络舆情研究文献为样本,在关键词规范化的基础上,一方面从微观角度结合词频和TF-IDF方法提取重要关键词,并对两门学科的关键词进行交集分析、共词聚类分析和战略坐标分析;另一方面从全局角度采用LDA模型对样本进行主题建模。然后,分别对基于共词聚类和基于LDA的热点主题划分结果进行语义关系规范和主题标识。研究发现,舆情传播与监测、高校舆情分析、危机预警与管理、政府舆情应对等是两门学科共同关注的主题,网络谣言分析、网络问政则分别是图书情报学和新闻传播学的特色研究主题。研究还发现,有部分潜在交叉主题和衍生主题在学科交叉与融合的推动下孕育而生。 展开更多
关键词 网络舆情 热点主题 学科交叉 LDA 共词聚类
下载PDF
基于专利挖掘的关键共性技术识别研究 被引量:34
9
作者 马永红 孔令凯 +1 位作者 林超然 杨晓萌 《情报学报》 CSSCI CSCD 北大核心 2020年第10期1093-1103,共11页
关键共性技术识别影响政府在不确定性市场环境中的资源投入及企业研发方向,制约制造业发展。如何准确识别关键共性技术是政府和企业急需解决的问题。本研究基于专利数据及LDA主题模型,提取隐含技术主题,选取高强度技术主题为研究对象,... 关键共性技术识别影响政府在不确定性市场环境中的资源投入及企业研发方向,制约制造业发展。如何准确识别关键共性技术是政府和企业急需解决的问题。本研究基于专利数据及LDA主题模型,提取隐含技术主题,选取高强度技术主题为研究对象,以技术共现率评估技术主题通用性,结合技术主题活跃度、效益性及关联性,识别共性技术。在此基础上,借鉴社会网络分析方法,以技术主题为节点,技术主题共现强度为边权,量化技术主题权利,筛选关键节点,识别关键共性技术。并以新材料领域为例进行研究,结果显示高性能铝合金制备、纳米粉末及其薄膜制备工艺、金属粉末的制备及应用、高强度高硬度陶瓷模具制备是新材料领域的关键共性技术。 展开更多
关键词 关键共性技术 LDA主题模型 技术共现率
下载PDF
国内微博研究热点分析及主题挖掘——以计算机和图书情报学科为研究对象 被引量:14
10
作者 王连喜 李霞 《情报杂志》 CSSCI 北大核心 2015年第4期127-132,共6页
以CNKI数据库中计算机和图书情报学科的核心期刊论文及硕博士学位论文为研究对象,以共词分析法和主题模型为工具,首先从数据集中提取并确定能够反映当前国内关于微博研究的重要关键词,然后采用SPSS的层次聚类法和LDA主题挖掘模型分别对... 以CNKI数据库中计算机和图书情报学科的核心期刊论文及硕博士学位论文为研究对象,以共词分析法和主题模型为工具,首先从数据集中提取并确定能够反映当前国内关于微博研究的重要关键词,然后采用SPSS的层次聚类法和LDA主题挖掘模型分别对共词矩阵和主题词向量进行定量分析,归纳出国内微博研究的热门知识点和重要主题,并对研究热点和研究主题进行宏观剖析,认为当前国内微博研究主要呈现出用户、内容和应用的三层结构特点。最后通过比较热点分析与主题挖掘的结果发现,国内的主要成果集中在微博内容层面的研究,涉及了情感分析、短文本处理、信息处理技术、主题发现、事件检测和信息挖掘等几个方面。 展开更多
关键词 微博 共词分析 主题挖掘 LDA
下载PDF
中美信息技术政策文本比较研究 被引量:4
11
作者 化柏林 吴诗慧 《科技情报研究》 CSSCI 2023年第1期28-42,共15页
[目的/意义]信息技术是国家综合国力的体现,其高速发展离不开政府的引导与支持。在这样的背景下,中国和美国相继出台了一系列促进新兴信息技术发展的政策。了解我国与美国的政策差异,对于完善战略规划、把握发展方向有着重要的意义。[方... [目的/意义]信息技术是国家综合国力的体现,其高速发展离不开政府的引导与支持。在这样的背景下,中国和美国相继出台了一系列促进新兴信息技术发展的政策。了解我国与美国的政策差异,对于完善战略规划、把握发展方向有着重要的意义。[方法/过程]本研究对近十年来中美关于信息技术的重要政策进行了梳理,使用共词网络和LDA主题模型对政策进行文本分析。[结果/结论]展现中国与美国在大数据、云计算、人工智能等领域政策的共同关注点和不同侧重点,为我国完善信息技术政策提供参考和启示。 展开更多
关键词 信息技术 政策 文本分析 共词网络 LDA主题模型
下载PDF
守正创新——近60年武汉大学信息管理学院学术论文研究主题的演变 被引量:6
12
作者 曹树金 岳文玉 《图书馆论坛》 CSSCI 北大核心 2020年第11期86-97,共12页
为纪念武汉大学信息管理学院百年华诞,文章探究武汉大学信息管理学院不同历史时期的学术研究内容和热度变化,呈现学术论文主题及其动态,发现不同时期的研究重点。构建基于1958~2019年学院不同历史时期学术论文研究内容的主题抽取与演化... 为纪念武汉大学信息管理学院百年华诞,文章探究武汉大学信息管理学院不同历史时期的学术研究内容和热度变化,呈现学术论文主题及其动态,发现不同时期的研究重点。构建基于1958~2019年学院不同历史时期学术论文研究内容的主题抽取与演化分析框架,结合LDA主题模型和共词分析法,分析各主题在不同时间段的热度演化。分析结果表明,武汉大学信息管理学院在学术研究领域坚持守正创新,在我国信息管理领域占有非常重要的地位。 展开更多
关键词 武汉大学信息管理学院 主题发现 主题演化 LDA模型 共词分析 可视化
下载PDF
基于多视图的文本聚类改进方法 被引量:3
13
作者 王卫红 李樊 金凌剑 《浙江工业大学学报》 CAS 北大核心 2021年第1期1-8,共8页
近年来,随着自然语言处理技术的发展,聚类技术在文本处理领域中的作用愈发凸显。目前,国内多视图文本聚类的相关研究进展仍处于起步阶段,通常运用的聚类方法是基于文本的单一领域来展现特定方面的聚类情况,但越来越多的文本聚类研究从... 近年来,随着自然语言处理技术的发展,聚类技术在文本处理领域中的作用愈发凸显。目前,国内多视图文本聚类的相关研究进展仍处于起步阶段,通常运用的聚类方法是基于文本的单一领域来展现特定方面的聚类情况,但越来越多的文本聚类研究从单视图向多视图的方向转变。提出了一种以LDA主题模型和TF-WIDF特征提取算法作为特征向量组,基于谱聚类的改进型多视图半监督文本聚类方法。该方法基于半监督的协同训练(Co-training)算法,通过对协同训练算法中的文本标记方式进行改进,实现无监督性质的多视图协同训练算法。实验结果表明:改进算法相较于传统单视图文本聚类算法,很大程度上避免了单视图算法的偶然性和局限性,提高了文章整体聚类的准确度。 展开更多
关键词 文本聚类 LDA TF-WIDF CO-TRAINING 谱聚类
下载PDF
基于改进LDA的水电工程进度管理文本智能分析 被引量:6
14
作者 李明超 吕沅庚 +1 位作者 田丹 沈扬 《水力发电学报》 CSCD 北大核心 2022年第3期133-141,共9页
进度控制是水电工程管理的重要任务,及时总结进度管理信息有助于工程进度计划的制定与调整。水电工程建设中的进度信息多以半结构化、非结构化的文本形式呈现,增加了信息提取难度,实现水电工程进度文本信息自动化与智能化挖掘是当前亟... 进度控制是水电工程管理的重要任务,及时总结进度管理信息有助于工程进度计划的制定与调整。水电工程建设中的进度信息多以半结构化、非结构化的文本形式呈现,增加了信息提取难度,实现水电工程进度文本信息自动化与智能化挖掘是当前亟待解决的问题。本文提出基于改进LDA的水电工程进度信息智能提取方法,智能提取进度管理文本中的关键信息。该方法基于传统LDA模型针对吉布斯采样机制,充分考虑词语间的关联关系,将原有随机单个采样过程改进为以共现度为基准的词对采样,强化了词语间的语义关联,提高了主题词语间的紧密性以及主题词语对主题描述的准确性。将所提出的方法应用于实际水电工程,对221份水电工程施工监理周报进行分析,共提取12个主题的工序关键词,并依照计算结果提取出主副工序;结果表明,改进LDA主题模型在水电工程进度文本工序特征词提取效果优于传统LDA主题模型,有助于提高工程施工进度关键工序词提取与信息挖掘效率,为水电工程施工智能化管理提供了新的手段。 展开更多
关键词 水电工程 施工进度 关键词提取 改进LDA主题模型 共现度 文本智能分析
下载PDF
基于ICE-LDA模型的中英文跨语言话题发现研究 被引量:7
15
作者 陈兴蜀 罗梁 +2 位作者 王海舟 王文贤 高悦 《工程科学与技术》 EI CAS CSCD 北大核心 2017年第2期100-106,共7页
近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分... 近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分,由于互联网的大规模普及而成为人们方便快捷获知信息的重要来源。首先,本文选择中文与英文的网络新闻作为数据源进行采集,提出了在LDA模型上改进的ICE-LDA模型进行跨英汉语言网络环境下的共现话题发现。采用话题向量化的方式,对建模产生的话题进行JS距离检测和话题文本分布相似度度量。其次,本文分别对爬虫采集到的中英混合新闻数据分别构建可对比平行语料集和非可对比语料集进行话题建模,在建模过程中利用TF-IDF算法对文档提取特征词去噪,提高话题特征表示去除无意义噪音词。最后,分别采用两种不同的话题向量化方式进行跨语言的共现话题发现建模。实验结果表明,在本文设计的爬虫采集构建的真实数据集上,改进后的话题模型不仅能够在不需要先验话题对的情况下对可对比语料集进行跨语言共现话题进行发现,而且能够对语料不平衡的情况进行共现话题发现。 展开更多
关键词 话题发现 跨英汉文本 ICE-LDA模型 TF-IDF特征提取 共现话题
下载PDF
基于LDA的多特征融合的短文本相似度计算 被引量:9
16
作者 张小川 余林峰 张宜浩 《计算机科学》 CSCD 北大核心 2018年第9期266-270,共5页
近年来,LDA(Latent Dirichlet Allocation)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。针对短文本特征稀疏,应用LDA主题模型易导致文本相似度计算结果缺乏准确性的问题,提出了基于LDA的多特征... 近年来,LDA(Latent Dirichlet Allocation)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。针对短文本特征稀疏,应用LDA主题模型易导致文本相似度计算结果缺乏准确性的问题,提出了基于LDA的多特征融合的短文本相似度算法。该方法融合了主题相似度因子ST(Similarity Topic)和词语共现度因子CW(Co-occurrence Words),建立了联合相似度模型以规约不同ST区间下CW对ST产生的约束或补充条件,并最终权衡了准确性更高的相似度结果。对改进后的算法进行文本聚类实验,结果表明改进后的算法在F度量值上取得了一定程度的提升。 展开更多
关键词 LDA 主题模型 短文本相似度 主题相似度 词语共现度
下载PDF
基于LDA模型的国内“一带一路”文献主题研究 被引量:9
17
作者 王扶东 王苑潼 《情报探索》 2019年第11期129-134,共6页
[目的/意义]旨在对“一带一路”研究成果进行及时的梳理和总结,为进一步的学术研究提供参考。[方法/过程]选取与“一带一路”相关的科技文献,使用LDA主题模型进行主题挖掘,通过关键词共现图谱反映热门主题的交叉演化。[结果/结论]当前... [目的/意义]旨在对“一带一路”研究成果进行及时的梳理和总结,为进一步的学术研究提供参考。[方法/过程]选取与“一带一路”相关的科技文献,使用LDA主题模型进行主题挖掘,通过关键词共现图谱反映热门主题的交叉演化。[结果/结论]当前国内文献围绕“一带一路”的研究涉及经济、政治、文化、社会等各个方面,研究热点随着国际形势、国内政策的变化发生变化。主题之间并不是独立的,热门主题朝着交融的方向进行演化,“人类命运共同体”将是新阶段下的研究重点。 展开更多
关键词 一带一路 LDA模型 主题演化 关键词共现图谱
下载PDF
杰出科学家的科研产出规律——以拉斯克医学研究奖得主为例 被引量:13
18
作者 任晓亚 张志强 陈云伟 《情报学报》 CSSCI CSCD 北大核心 2019年第9期894-906,共13页
重大科学突破的产生离不开科学知识和学术思想的积累与继承,了解有关学科领域杰出科学家群体科研产出的一般规律,有助于科研人员了解相关学科领域的研究发展趋势和发展特点,实现“继承-创新”式研究;有利于管理和决策者了解相关学科领... 重大科学突破的产生离不开科学知识和学术思想的积累与继承,了解有关学科领域杰出科学家群体科研产出的一般规律,有助于科研人员了解相关学科领域的研究发展趋势和发展特点,实现“继承-创新”式研究;有利于管理和决策者了解相关学科领域的科学发展规律,完善学科领域的管理资助政策和机制等。本文在构建理论模型的基础上,综合运用定性聚类分析与定量聚类分析方法。以生物医学领域获得拉斯克医学研究奖的319名科学家为代表样本,经过数据清洗最终得到文献31095篇,通过LDA主题模型提取研究主题并进行共现网络分析,从语义层面分析该领域杰出科学家科研产出的一般规律。本文得出了生物医学领域杰出科学家在获奖成就细分学科、研究主题演变与分布、获奖年龄趋势及发文期刊等方面的规律。 展开更多
关键词 杰出科学家 拉斯克奖 科研产出 主题识别 LDA-共现分析
下载PDF
基于专利引文的智能安防技术子域和技术原理挖掘 被引量:1
19
作者 陈悦 祝嘉欢 +1 位作者 宋凯 汪玲 《创新科技》 2020年第3期57-70,共14页
本文以Derwent专利数据库和WoS引文数据库为数据源,从技术供给侧探索智能安防技术发展的知识空间。作为技术知识的主要载体,专利的论文引文和专利引文反映了技术原理和技术单元对技术发展的支撑作用。本文采用LDA模型对主题进行分类,进... 本文以Derwent专利数据库和WoS引文数据库为数据源,从技术供给侧探索智能安防技术发展的知识空间。作为技术知识的主要载体,专利的论文引文和专利引文反映了技术原理和技术单元对技术发展的支撑作用。本文采用LDA模型对主题进行分类,进一步利用专利-论文混合共被引分析方法,识别出对智能安防技术发展具有推动作用的基础研究,为我国推进安防及相关领域技术的研发和应用提供一定的理论参考。 展开更多
关键词 智能安防技术 LDA主题模型 专利-论文混合共被引分析 技术原理
下载PDF
基于LDA主题模型的文献特征项多重共现可视化方法 被引量:4
20
作者 翟君伟 瞿英 +1 位作者 郭菲 刘滨 《河北科技大学学报》 CAS 北大核心 2022年第2期182-193,共12页
文献计量学是运用数学和统计学方法对文献知识单元进行定量分析、揭示文献内部知识内容的一门科学。共现网络分析是文献计量研究中分析文献特征项数据关系的一种可视化方法,根据被分析特征项的数量分为单重共现网络分析和多重共现网络... 文献计量学是运用数学和统计学方法对文献知识单元进行定量分析、揭示文献内部知识内容的一门科学。共现网络分析是文献计量研究中分析文献特征项数据关系的一种可视化方法,根据被分析特征项的数量分为单重共现网络分析和多重共现网络分析。与单重共现网络分析相比,多重共现网络分析增加了特征项的维度,对文献知识的呈现更加深入。但是,由于被分析特征项维度的增加,导致共现网络中的节点数量增多,节点间连线重合度和交叉频率过大,降低了文献计量可视化的效果。因此,目前文献计量共现网络分析主要以单重共现为主,多重共现网络分析可视化效果尚有待提升。为解决多重共现网络中节点过多、连线密度过大、不利于发现数据价值以及可视化效果较低等问题,引入LDA主题模型,采用空间划分的方法,将特征项全域可视化的问题转化为子空间可视化问题。首先,使用SATI文献题录信息分析软件抽取文献关键词,进行TF-IDF计算,以计算结果作为实验数据;其次,使用Python构建主题模型,对目标文献集合进行主题聚类分析;最后,使用Ucinet软件对不同主题子空间文献进行多重共现分析,并将子空间分析结果叠加和重构,完成多重共现可视化系统的结构化表达。结果表明:与原多重共现可视化方法相比,在内容呈现等价的前提下,基于LDA主题模型的多重共现可视化改进方法由于缩小了多重共现网络分析系统的规模,即子空间文献数量与特征词数目,因而降低了共现网络中的节点数量和节点间连线密度,使得多重共现可视化系统的结构更为清晰,增加了数据的可读性,突出了数据价值,有效提升了多重共现可视化效果。因此,多重共现可视化改进方法在一定程度上可以推进文献构成元素在多重组合知识挖掘方面的深入研究,提高不同领域文献计量的实证研究质量。 展开更多
关键词 管理计量学 LDA主题模型 多重共现分析 UCINET 可视化
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部