期刊文献+
共找到296篇文章
< 1 2 15 >
每页显示 20 50 100
我国数据安全政策文本主题挖掘及其演化分析
1
作者 马海群 崔文波 张涛 《现代情报》 北大核心 2024年第8期28-38,共11页
[目的/意义]揭示数据安全政策主题的演化规律,对完善数据安全政策体系具有重要意义。[方法/过程]本文选取我国547部数据安全政策文本,利用NMF主题模型进行主题挖掘并结合Word2Vec词向量模型,从主题内容演化和主题强度演化两个视角进行... [目的/意义]揭示数据安全政策主题的演化规律,对完善数据安全政策体系具有重要意义。[方法/过程]本文选取我国547部数据安全政策文本,利用NMF主题模型进行主题挖掘并结合Word2Vec词向量模型,从主题内容演化和主题强度演化两个视角进行可视化处理与分析。[结果/结论]识别出网络安全、应急处置、安全保障、个人隐私等主题,而主题演化内容呈现聚集性,演化领域呈现扩散性;数据开放、公共数据等核心主题整体演化强度趋势不断提高,但个人隐私、安全可控、监测预警相关主题政策占比失衡。针对主题挖掘及演化分析结果,并结合我国数据安全治理现状提出4点建议:持续加强数据开放与安全的协同;加强全流程的数据安全治理;完善技术与政策融合的数据安全治理机制;平衡政策主题演化注意力分配。 展开更多
关键词 数据安全政策 数据治理 数据开放 数据安全 NMF Word2Vec 主题挖掘 主题演化
下载PDF
高价值专利影响因素分析及主题挖掘——以纳米药物领域为例
2
作者 奉国和 刘任铧 邓伟伟 《图书馆论坛》 北大核心 2024年第7期48-60,共13页
挖掘高价值专利影响因素及主题有利于政府和企业进行前瞻性专利战略部署,对抢占技术先机、赢取竞争优势具有积极意义。文章首先依托专利数据,采用因子分析法计算专利综合价值评分,依据二八原则筛选高价值专利;然后对专利指标及其分类标... 挖掘高价值专利影响因素及主题有利于政府和企业进行前瞻性专利战略部署,对抢占技术先机、赢取竞争优势具有积极意义。文章首先依托专利数据,采用因子分析法计算专利综合价值评分,依据二八原则筛选高价值专利;然后对专利指标及其分类标签进行特征分析、差异性分析和回归分析,探究影响专利价值的因素;最后使用BERTopic主题模型挖掘高价值专利主题。选取“纳米药物”专利数据进行实证分析,结果表明该方法能有效探究出专利价值的强影响因素,筛选出的高价值专利与其他方法获得结果高度一致。 展开更多
关键词 高价值专利 影响因素 主题挖掘 BERTopic 纳米药物
下载PDF
基于主题挖掘和情感分类的综艺评论演化分析
3
作者 薛洁 张艺卓 《统计科学与实践》 2024年第3期18-20,31,共4页
从文化类综艺节目评论中提取隐含的主题和情感,再从观众反馈的角度挖掘其喜好、评价和建议,可以直观地为创作者的内容选题、形式策划提供帮助。本文针对LDA生成式模型未能考虑的上下文隐含语义、主题数难以确定、解释性程度不高等问题,... 从文化类综艺节目评论中提取隐含的主题和情感,再从观众反馈的角度挖掘其喜好、评价和建议,可以直观地为创作者的内容选题、形式策划提供帮助。本文针对LDA生成式模型未能考虑的上下文隐含语义、主题数难以确定、解释性程度不高等问题,提出了一种基于Word2vecTopic主题挖掘和Bi-LSTM情感分类的评论演化分析算法。研究表明,该方法可以反映主题之间的关系,能够主动选择和解释主题数,有效挖掘评论的主题,准确分类评论情感极性,精准展现主题间内在联系和时空情感演变,为文化类综艺创新路径研究提供新的思路与方法。 展开更多
关键词 文化类综艺 主题挖掘 情感分类 HDBSCAN聚类 长短期记忆网络
下载PDF
基于LDA模型的老年人生活满意度主题挖掘与文本实证分析 被引量:2
4
作者 冯艳铭 郝志梅 董春栎 《华北理工大学学报(社会科学版)》 2024年第2期19-25,共7页
通过对老年人生活满意度文献进行分析,明确老年人生活满意度研究的主要方向,为提高老年人生活满意度提供科学建议。检索爬取了CNKI(中国知网)、万方、维普中关于老年人生活满意度领域的文献,将文献摘要部分作为研究对象,采用LDA模型挖... 通过对老年人生活满意度文献进行分析,明确老年人生活满意度研究的主要方向,为提高老年人生活满意度提供科学建议。检索爬取了CNKI(中国知网)、万方、维普中关于老年人生活满意度领域的文献,将文献摘要部分作为研究对象,采用LDA模型挖掘文本主题,分析主题演进趋势,使用回归方程识别冷、热点主题。去除不相关文献后纳入文献402篇,使用潜在狄利克雷分配(LDA)模型挖掘出8个主题,其中利用回归方程识别热点主题1个(家庭关系与情绪健康),冷点主题1个(再教育状况与生活满意度),发现主题研究趋势进行可视化展示。建议未来的老年人生活满意度研究应更加重视老年人教育、知识、能力的研究,从而提高老年人生活质量和满意度。 展开更多
关键词 LDA 老年人生活满意度 主题挖掘 文本实证
下载PDF
基于BTM主题挖掘和Kano模型的运动文胸用户需求研究 被引量:1
5
作者 方蕾蕾 吴巧英 +1 位作者 项钰慧 章杨欣 《丝绸》 CAS CSCD 北大核心 2024年第3期106-114,共9页
为了深入挖掘运动文胸的用户需求,文章采用BTM模型对10个运动文胸品牌的16 248条在线评论进行主题挖掘,构成运动文胸用户需求要素,并通过Kano模型分析用户满意度和需求度,确定各项要素的属性归类和优先级排序。研究结果得到,运动文胸用... 为了深入挖掘运动文胸的用户需求,文章采用BTM模型对10个运动文胸品牌的16 248条在线评论进行主题挖掘,构成运动文胸用户需求要素,并通过Kano模型分析用户满意度和需求度,确定各项要素的属性归类和优先级排序。研究结果得到,运动文胸用户需求维度包括功能质量、款式设计、面料材质、颜色外观、服务品质、品牌营销6个方面;在23项需求要素中,舒适度和防震功能是用户满意度建立的首要因素,下围、罩杯、面料手感、胸垫材质是产品优化中的关键因素,客服态度、退换货服务、声誉口碑、商品信息是服务和营销中的重要因素;进而提出优化建议供相关企业参考。 展开更多
关键词 运动文胸 用户需求 BTM模型 主题挖掘 KANO模型 在线评论 用户满意度
下载PDF
基于情感分类与主题挖掘的MOOC课程评论研究 被引量:1
6
作者 余亚烽 刘兴红 +2 位作者 陶胜阳 王瑰霞 张苏薇 《考试研究》 2024年第1期86-100,共15页
在线精品课程作为MOOC中的高质量教育资源,有效促进了教育公平和均衡发展。但在保持快速增长的态势时,仍存在质量参差不齐的困境。为促进教师深度反思,支持教学问题的诊断与改进,提升课程质量,构建在线精品课程评论情感分类与主题挖掘... 在线精品课程作为MOOC中的高质量教育资源,有效促进了教育公平和均衡发展。但在保持快速增长的态势时,仍存在质量参差不齐的困境。为促进教师深度反思,支持教学问题的诊断与改进,提升课程质量,构建在线精品课程评论情感分类与主题挖掘研究模型。首先,采用网络爬虫技术采集MOOC平台中25门“教育技术学”专业在线精品课程评论数据,并进行数据预处理和情感分类;其次,对负性课程评论进行词云分析、社会网络分析和主题挖掘。结果表明:教师教学能力、学习资源质量、课程内容设计、互动和反馈机制、课程考核评价是导致学生差评、影响课程学习体验和学习质量的主要因素。据此,提出促进在线教育中教师教学能力专业化提升、开发优质在线精品课程学习资源、打造实用生动的在线精品课程内容、优化互动和反馈机制、优化在线精品课程考核评价等课程优化建议。 展开更多
关键词 情感分类 主题挖掘 MOOC 课程评论 课程质量
下载PDF
在线健康社区用户需求主题挖掘研究
7
作者 彭超 李海晨 《图书情报研究》 2024年第3期86-93,111,共9页
[目的/意义]为了进一步提高在线健康社区的使用价值,本文构建在线健康社区用户需求指标体系,对在线健康社区用户需求进行主题挖掘。[方法/过程]利用数据挖掘原理以及LDA主题识别模型,从丰富的在线健康社区评论数据中挖掘用户潜在的需求... [目的/意义]为了进一步提高在线健康社区的使用价值,本文构建在线健康社区用户需求指标体系,对在线健康社区用户需求进行主题挖掘。[方法/过程]利用数据挖掘原理以及LDA主题识别模型,从丰富的在线健康社区评论数据中挖掘用户潜在的需求主题,针对在线健康社区用户使用主题特征向用户需求进行映射,构建在线健康社区用户需求评价指标。[结果/结论]分析在线健康社区评论数据,将用户需求分为医生专业性需求、系统性能需求、服务需求、信息需求和购买需求,构建在线健康社区用户需求指标体系,针对用户需求,为在线健康社区的发展提出建议:提高社区医生的专业性;提高社区系统稳定性;加强社区信息质量管理;提供多样性服务,保证服务质量。 展开更多
关键词 在线健康社区 用户需求 数据挖掘 主题挖掘
下载PDF
基于DTM模型与共词分析法的主题挖掘与演化分析——以智慧物流研究为例
8
作者 龙祖文 王静 严红 《物流工程与管理》 2024年第1期10-15,共6页
随着物联网、大数据、云计算、5G和人工智能等新兴技术的不断发展,我国物流业正逐渐由传统物流向“智慧物流”转变。为探究国内智慧物流领域的研究热点和研究主题的发展演化趋势,文中选取2010-2023年间国内智慧物流研究相关文献,并将其... 随着物联网、大数据、云计算、5G和人工智能等新兴技术的不断发展,我国物流业正逐渐由传统物流向“智慧物流”转变。为探究国内智慧物流领域的研究热点和研究主题的发展演化趋势,文中选取2010-2023年间国内智慧物流研究相关文献,并将其划分为4个时间段,结合DTM动态主题模型和共词分析方法对其进行主题挖掘、热点主题识别和主题演化趋势分析。研究结果表明,物流专业人才培养在2018年后一直是国内智慧物流领域研究的重点,而物联网、大数据、云计算、人工智能等现代新兴技术自问世以来一直都是国内智慧物流领域研究的重点。由此可见,加强人才培养和现代新兴技术的攻关力度,是今后我国物流业转型升级的关键。 展开更多
关键词 DTM模型 共词分析 主题挖掘 演化分析 智慧物流
下载PDF
基于K-means与Word2vec的哺乳文胸评论主题挖掘研究
9
作者 刘妍 刘驰 《人类工效学》 2024年第2期40-45,共6页
目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义... 目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义聚类、主题识别、主题词挖掘及主题重要度计算。结果哺乳文胸评论文本聚类后的主题重要程度排名是:产品品质(45.47%)、产品外观(35.83%)、产品服务(18.79%)。结论通过该方法能够有效的识别和构建哺乳文胸主题及主题词,同时,通过主题的重要程度,能够了解消费者对于网络平台购买哺乳文胸时关注的重点方向,为哺乳内衣企业进行产品改善及生产等提供理论参考。 展开更多
关键词 服装工程 文本聚类分析 哺乳文胸 在线评论 K-MEANS Word2vec 主题挖掘 主题重要程度 文献计量分析
下载PDF
基于LDA模型的乡村振兴研究主题挖掘与热度演化分析
10
作者 冷奇兵 《安徽农业科学》 CAS 2024年第4期240-244,共5页
乡村振兴战略是推动农业高质量发展、促进共同富裕的重要保障。精准识别乡村振兴研究的主题与热点,有助于在新发展阶段下面向农村地区开展精细化研究提供基础。以SCI期刊、EI来源期刊、北大核心、CSSCI和CSCD的13184条文献摘要为研究对... 乡村振兴战略是推动农业高质量发展、促进共同富裕的重要保障。精准识别乡村振兴研究的主题与热点,有助于在新发展阶段下面向农村地区开展精细化研究提供基础。以SCI期刊、EI来源期刊、北大核心、CSSCI和CSCD的13184条文献摘要为研究对象,使用词云图和LDA主题建模的方式分析了乡村振兴相关领域的热点主题和变化趋势。结果显示,学者们最为热衷的是乡村振兴战略、路径和乡村体制及农业农村现代化等宏观方向的研究,而组织振兴、人才振兴和农村土地等具体领域的研究有待进一步扩展。 展开更多
关键词 乡村振兴 主题挖掘 热点 LDA模型 文献计量
下载PDF
基于情感分类的《热辣滚烫》LDA主题挖掘
11
作者 关瑞雪 关瑞勇 《科技和产业》 2024年第16期219-223,共5页
以豆瓣电影网关于电影《热辣滚烫》的用户评论为数据源,采用情感分类和LDA(Latent Dirichlet allocation)主题模型对影评进行深入分析。首先对影评数据进行预处理,包括去重、分词和构建去停用词表,匹配情感词表和修正情感倾向,将评论分... 以豆瓣电影网关于电影《热辣滚烫》的用户评论为数据源,采用情感分类和LDA(Latent Dirichlet allocation)主题模型对影评进行深入分析。首先对影评数据进行预处理,包括去重、分词和构建去停用词表,匹配情感词表和修正情感倾向,将评论分为正面和负面两类。绘制正面和负面情感词云,揭示了观众对电影中女性力量的展现、励志元素的融入及幽默感表达等的正面评价,以及对剧情创新不足、营销宣传过度等负面反馈。LDA主题分析进一步识别“励志人生”和“重塑自我”作为正面主题,以及“过度营销”和“抄袭翻拍”作为负面主题。研究结果为电影制作提供了宝贵的观众洞察,建议制作团队在未来作品中注重剧情创新、真实营销、角色深度塑造和文化传播等,从而提升电影的艺术价值和市场竞争力。 展开更多
关键词 情感分类 主题挖掘 重塑自我
下载PDF
双元演化视角下的专利技术主题挖掘和动态演化分析——以工业机器人领域为例
12
作者 窦路遥 周志刚 +1 位作者 李毅 蒋涛 《科技情报研究》 2024年第1期102-118,共17页
[目的/意义]“整体维度+局部阶段”的双元演化视角下,挖掘工业机器人领域的技术主题及其演化规律,既可了解技术发展整体历程,又可明确技术组合具体范式,对于洞察工业机器人领域的技术进步落脚点和资金投入关注点具有重要的现实意义。[方... [目的/意义]“整体维度+局部阶段”的双元演化视角下,挖掘工业机器人领域的技术主题及其演化规律,既可了解技术发展整体历程,又可明确技术组合具体范式,对于洞察工业机器人领域的技术进步落脚点和资金投入关注点具有重要的现实意义。[方法/过程]基于incoPat专利数据库,以2003—2022年工业机器人领域为例,结合Word2vec词向量模型与LDA主题模型对专利文本进行数据挖掘与语料库扩充,继而在整体生态层面识别领域技能主题;随后结合技术生命周期理论,对各阶段的技术主题进行深度挖掘(相似度计算、相关性分析、技能组合规律);对挖掘出的45种技术主题路径进行刻画和可视化表达,明确技能主题发展现状及演化规律。[结果/结论]研究表明,文章所提方法流程能够更精准地识别出整体维度视角下的工业机器人领域的多个主题,且能识别出局部阶段视角下的主题侧重。在技术发展过程中,技术主题演化呈现出“扩散化→丰富化→系统化”的变化规律。通过计算演化强度来刻画主路径,也能清晰地展示工业机器人领域关键技术的波动情况。文章所提出的方法和流程能够为工业机器人领域的技术整合、资金投入、发展创新提供有力的理论和实践支撑。 展开更多
关键词 主题挖掘 动态波动 双元演化 专利分析 工业机器人
下载PDF
基于情感特征和主题挖掘的日本福岛核污水排海事件舆情分析
13
作者 雷少娟 刘新华 +1 位作者 王晓峰 刘瑞桓 《核安全》 2024年第4期54-63,共10页
福岛核污水排海事件是一个备受国内外公众关注的话题,探寻舆情演化过程、分析公众的情感倾向及其关注的焦点问题对舆情应对和公众沟通具有重要意义。本文采用文本挖掘技术,结合社交媒体、新闻媒体、公众评论等舆情数据,首先对排海事件... 福岛核污水排海事件是一个备受国内外公众关注的话题,探寻舆情演化过程、分析公众的情感倾向及其关注的焦点问题对舆情应对和公众沟通具有重要意义。本文采用文本挖掘技术,结合社交媒体、新闻媒体、公众评论等舆情数据,首先对排海事件舆情的演化趋势进行研究,并统计整理舆情发展的过程中公众参与讨论的话题;选择5个典型话题的评论文本研究公众的情感特征,并运用LDA主题分析模型挖掘公众关注的焦点问题。基于研究结果给出排海事件后续舆情应对及类似重大事件舆情应对的建议及对策,并为核能公众沟通在重大核事故应对问题上提供参考。 展开更多
关键词 核污水排海 网络舆情 情感分析 LDA主题挖掘
下载PDF
基于在线评论的预制菜主题挖掘与情感倾向性分析
14
作者 林子璇 查迎春 《现代商业》 2024年第12期15-18,共4页
本文以天猫预制菜产品的在线评论为研究对象,运用八爪鱼对在线评论进行爬取,并利用Python对评价数据进行情感倾向性分析以及LDA主题挖掘。研究结果表明,根据LDA主题模型,消费者评论主题由产品品质、商家服务、物流及包装及品牌口碑及知... 本文以天猫预制菜产品的在线评论为研究对象,运用八爪鱼对在线评论进行爬取,并利用Python对评价数据进行情感倾向性分析以及LDA主题挖掘。研究结果表明,根据LDA主题模型,消费者评论主题由产品品质、商家服务、物流及包装及品牌口碑及知名度四部分组成。情感分析方面,好评中,消费者对于网购预制菜的产品总体较为满意,但缺乏高度满意情感倾向;差评方面,轻度消极情绪占比较高,高度消极情绪较少。 展开更多
关键词 预制菜 在线评论 LDA主题挖掘 情感倾向性分析
下载PDF
基于集成算法的在线课程评论情感识别与主题挖掘研究 被引量:2
15
作者 李丹丹 陈俊 《北京印刷学院学报》 2023年第12期59-68,共10页
本文构建了集成算法对在线课程评论进行多元分类情感识别与主题挖掘的模型,通过Adaboost多个弱分类器之间的相互加权组合成强分类器对课程评论进行三分类情感识别,提取到不同特征样本下的在线课程评论情感的分类结果,并运用LDA主题模型... 本文构建了集成算法对在线课程评论进行多元分类情感识别与主题挖掘的模型,通过Adaboost多个弱分类器之间的相互加权组合成强分类器对课程评论进行三分类情感识别,提取到不同特征样本下的在线课程评论情感的分类结果,并运用LDA主题模型挖掘评论的隐藏主题,最后搭建语义网络,帮助学习者从整体把握课程的优劣属性及关注主题。以MOOC平台的10583条评论为对象,进行情感识别模型构建,并与机器学习的单独分类模型进行实验对比。实验结果发现,该模型能够有效地识别评论主体的情感,准确率优于单独的分类器,准确值高达88.12%,并能较好地抽取评论关注主题及课程属性,为学习者在选择课程时提供策略支持,帮助学习者做出正确决策,这说明集成学习算法在帮助学习者挑选课程做决策的性能上适应度较高。 展开更多
关键词 在线课程评论 情感分析 主题挖掘 语义网络
下载PDF
基于时空大数据演化的新冠肺炎疫情政策主题挖掘及层级扩散特征分析 被引量:2
16
作者 吴鹏 张蒙蒙 索金琳 《情报理论与实践》 北大核心 2023年第5期185-192,153,共9页
[目的/意义]文章旨在揭示不同层级政府针对新冠肺炎疫情的应急模式,纵向探究新冠肺炎疫情治理体系,对政府应急管理超前布局具有一定借鉴意义。[方法/过程]基于时空大数据演化技术,结合政策内部特征和外部特征视角揭示不同层级政府政策... [目的/意义]文章旨在揭示不同层级政府针对新冠肺炎疫情的应急模式,纵向探究新冠肺炎疫情治理体系,对政府应急管理超前布局具有一定借鉴意义。[方法/过程]基于时空大数据演化技术,结合政策内部特征和外部特征视角揭示不同层级政府政策扩散特征,并通过可视化方法展示。在内部特征方面,通过主题挖掘分析政策时间维度和层级维度主题演变;在外部特征方面,从发文时间、发文部门、发文数量维度上构建政策扩散特征指标,实验以中央、湖北省、北京市政策文本为数据源开展。[结果/结论]研究发现,首先,不同阶段主题存在差异性,但在疫情防控、企业扶持主题上存在延续性;其次,中央政策具有指导性、宏观把控性,湖北省整体注重疫情防控、医疗救治和复工复产,北京市侧重企业扶持、疫情防控、政务服务;最后,同层级政府的政策扩散特征表现不同。 展开更多
关键词 新冠肺炎疫情 主题挖掘 政策扩散 LDA主题模型 政府层级
下载PDF
基于矿工大数据的不安全行为主题挖掘与语义分析 被引量:2
17
作者 李琰 刘珍 陈南希 《煤矿安全》 CAS 北大核心 2023年第9期254-257,共4页
为科学防控煤矿安全事故,深度挖掘不安全行为数据隐藏的信息和知识;基于Python算法、LDA主题模型和NetDraw工具,选取2017—2021年陕西省某大型煤矿集团的44 069条不安全行为数据进行分词处理、主题提取,绘制矿工不安全行为语义网络图并... 为科学防控煤矿安全事故,深度挖掘不安全行为数据隐藏的信息和知识;基于Python算法、LDA主题模型和NetDraw工具,选取2017—2021年陕西省某大型煤矿集团的44 069条不安全行为数据进行分词处理、主题提取,绘制矿工不安全行为语义网络图并对矿工不安全行为语义网络的中心性进行分析;研究得出5个矿工不安全行为高频主题和3个矿工不安全行为高发地点。 展开更多
关键词 矿工大数据 不安全行为 LDA 语义网络图 安全管理 主题挖掘 语义分析
下载PDF
抖音电商平台助农产品在线评论主题挖掘及扩展分析
18
作者 邵婷 杨佩婷 姜红波 《厦门理工学院学报》 2023年第4期55-64,共10页
基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型,引入高频词分析、共现网络分析、情感分析等方法,对抖音电商平台上助农产品在线评论的主题进行挖掘和扩展分析表明,消费者对助农产品的关注点主要包括产品质量和价格、商家... 基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型,引入高频词分析、共现网络分析、情感分析等方法,对抖音电商平台上助农产品在线评论的主题进行挖掘和扩展分析表明,消费者对助农产品的关注点主要包括产品质量和价格、商家服务和物流服务、消费者感知价值、助农活动和县长支持等。通过共现网络分析和情感分析均发现消费者对抖音平台助农产品总体是满意的,但仍有改善空间。建议抖音电商平台通过挖掘消费者需求、保证助农产品性价比、把握“电商助农”宣传方向、加强主播培训等方式来提升消费者的购物体验和满意度。 展开更多
关键词 抖音电商平台 助农产品 在线评论 主题挖掘 扩展分析 LDA模型
下载PDF
基于LDA模型的在线评价物流主题挖掘及可视化分析
19
作者 魏忠 乐玥 《物流技术》 2023年第12期77-83,共7页
电商平台上存在大量的物流数据评价信息,然而,个人语言表达中存在或多或少的差异,导致主题分类词并不能很好的聚类,为商家与消费者提供决策信息。因此,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的同义主题合并的文本分... 电商平台上存在大量的物流数据评价信息,然而,个人语言表达中存在或多或少的差异,导致主题分类词并不能很好的聚类,为商家与消费者提供决策信息。因此,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的同义主题合并的文本分类方法对在线评价进行物流主题挖掘,寻找其中更深层次的决策信息。首先,采用python3.9爬取某电商平台生鲜类、食品类、电器类、个护类、日用类及服务类产品的在线评论数据。运用TF-IDF(Term Frequency-Inverse Document Frequency)分词方法对数据集进行分词处理,获得特征词及其概率分布,利用物流行业同义词库进行特征词的同义替换,并进行概率重整合,最后进行LDA主题模型分析以及可视化分析。在数据实证算例分析中发现,在六大类的商品中,消费者对于物流的要求并不相同,商家可根据在线评论的主题挖掘结果进行物流企业的选择以满足消费者需求,物流企业也可依据此进行自身服务质量的提升。 展开更多
关键词 在线评价 物流主题挖掘 LDA主题模型 可视化分析 电商 文本分类
下载PDF
LDA模型下的我国图书馆人才队伍建设与管理主题
20
作者 王安莉 王建玲 +2 位作者 张文婷 罗海波 杨飞龙 《科技和产业》 2024年第18期270-276,共7页
对我国图书馆人才队伍建设与管理领域进行文本挖掘,揭示该领域研究热点主题。选取中国知网(CNKI)相关文献摘要作为研究语料,运用Python的gensim库构建LDA主题模型,进行文本挖掘,利用困惑度和一致性确定最佳主题数量、计算各主题强度。... 对我国图书馆人才队伍建设与管理领域进行文本挖掘,揭示该领域研究热点主题。选取中国知网(CNKI)相关文献摘要作为研究语料,运用Python的gensim库构建LDA主题模型,进行文本挖掘,利用困惑度和一致性确定最佳主题数量、计算各主题强度。最终确定10个热点主题数量,其中高校图书馆员培养、图书馆建设与阅读推广、公共图书馆服务、多角度合作、用户需求与满意度这五个主题的主题强度较高,揭示了主题演化趋势。 展开更多
关键词 LDA模型 主题挖掘 图书馆 人才队伍建设
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部