期刊文献+
共找到752篇文章
< 1 2 38 >
每页显示 20 50 100
News Text Topic Clustering Optimized Method Based on TF-IDF Algorithm on Spark 被引量:17
1
作者 Zhuo Zhou Jiaohua Qin +3 位作者 Xuyu Xiang Yun Tan Qiang Liu Neal N.Xiong 《Computers, Materials & Continua》 SCIE EI 2020年第1期217-231,共15页
Due to the slow processing speed of text topic clustering in stand-alone architecture under the background of big data,this paper takes news text as the research object and proposes LDA text topic clustering algorithm... Due to the slow processing speed of text topic clustering in stand-alone architecture under the background of big data,this paper takes news text as the research object and proposes LDA text topic clustering algorithm based on Spark big data platform.Since the TF-IDF(term frequency-inverse document frequency)algorithm under Spark is irreversible to word mapping,the mapped words indexes cannot be traced back to the original words.In this paper,an optimized method is proposed that TF-IDF under Spark to ensure the text words can be restored.Firstly,the text feature is extracted by the TF-IDF algorithm combined CountVectorizer proposed in this paper,and then the features are inputted to the LDA(Latent Dirichlet Allocation)topic model for training.Finally,the text topic clustering is obtained.Experimental results show that for large data samples,the processing speed of LDA topic model clustering has been improved based Spark.At the same time,compared with the LDA topic model based on word frequency input,the model proposed in this paper has a reduction of perplexity. 展开更多
关键词 News text topic clustering spark platform countvectorizer algorithm TF-IDF algorithm latent dirichlet allocation model
下载PDF
基于BERTopic模型的网络暴力事件衍生舆情探测 被引量:2
2
作者 胡凯茜 李欣 王龙腾 《情报杂志》 CSSCI 北大核心 2024年第7期146-153,共8页
[研究目的]在海量用户生成内容中及时探测和剖析网络暴力事件的衍生舆情能够为舆情事件链的演化分析、同类舆情的研判介入、衍生事件的监测预警提供理论支持。[研究方法]使用BERTopic模型对短文本内容主题建模并采用聚类的方式展示主题... [研究目的]在海量用户生成内容中及时探测和剖析网络暴力事件的衍生舆情能够为舆情事件链的演化分析、同类舆情的研判介入、衍生事件的监测预警提供理论支持。[研究方法]使用BERTopic模型对短文本内容主题建模并采用聚类的方式展示主题的潜在层次结构。根据词向量余弦相似度设计主题衍生度的计量算法,同时融合词共现网络在文档-词语层面信息捕捉的优势以及桑基图直观演示舆情演化过程的特点,衡量主题间的影响力与衍生关系。[研究结论]在开源数据集下多组主题模型的对照实验中,BERTopic模型在短文本建模以及下游任务的平均得分提高2.13%。在网络暴力热点事件的应用实例中,多维细粒度分析与交互式可视化方法可达到直观展示暴力事件的主题聚类、词义关联与演化态势的效果,实现网络暴力事件衍生舆情的探测与分析。 展开更多
关键词 网络舆情 网络暴力 衍生舆情 舆情监测 短文本 主题建模 BERtopic模型
下载PDF
基于SWPF2vec和DJ-TextRCNN的古籍文本主题分类研究 被引量:1
3
作者 武帅 杨秀璋 +1 位作者 何琳 公佐权 《情报学报》 CSSCI CSCD 北大核心 2024年第5期601-615,共15页
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人... 以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking,word,pattern,and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。 展开更多
关键词 多维特征融合 古籍文本 主题分类 SWPF2vec DJ-textRCNN
下载PDF
基于LDA和TextCNN的跨平台网络舆情风险预警研究
4
作者 管雨翔 王娟 +1 位作者 兰月新 张鹏 《情报探索》 2024年第10期109-115,共7页
[目的/意义]分析多个社交平台上的网络舆情数据,评估网络舆情风险,并进行风险预警研究,具有重要的社会意义和实际价值。[方法/过程]先构建网络舆情风险指标体系,然后使用层次分析法确定指标权重,以此构建网络舆情风险预警模型。实证部... [目的/意义]分析多个社交平台上的网络舆情数据,评估网络舆情风险,并进行风险预警研究,具有重要的社会意义和实际价值。[方法/过程]先构建网络舆情风险指标体系,然后使用层次分析法确定指标权重,以此构建网络舆情风险预警模型。实证部分使用某一地级市的网络舆情数据进行分析,先使用LDA对微博平台上的数据进行主题聚类,再根据聚类后的数据使用TextCNN对其余社交平台数据进行分类,最后使用网络舆情风险预警模型对各主题舆情进行研究。[结果/结论]本文构建的网络舆情风险预警模型具有一定的准确性和有效性。本文的网络舆情风险预警模型可以提供信息支持从而提高决策效率和网络舆情风险的监测效率。 展开更多
关键词 网络舆情 风险预警 主题聚类 文本分类
下载PDF
BURST-LDA: A NEW TOPIC MODEL FOR DETECTING BURSTY TOPICS FROM STREAM TEXT 被引量:3
5
作者 Qi Xiang Huang Yu +4 位作者 Chen Ziyan Liu Xiaoyan Tian Jing Huang Tinglei Wang Hongqi 《Journal of Electronics(China)》 2014年第6期565-575,共11页
Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty... Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty topics that experience a sudden increase during a period of time. In this paper, we propose a new topic model named Burst-LDA, which simultaneously discovers topics and reveals their burstiness through explicitly modeling each topic's burst states with a first order Markov chain and using the chain to generate the topic proportion of documents in a Logistic Normal fashion. A Gibbs sampling algorithm is developed for the posterior inference of the proposed model. Experimental results on a news data set show our model can efficiently discover bursty topics, outperforming the state-of-the-art method. 展开更多
关键词 text mining Burst detection topic model Graphical model Bayesian inference
下载PDF
基于主题模型的通用文本匹配方法
6
作者 黄振业 莫淦清 余可曼 《计算机应用与软件》 北大核心 2024年第5期310-318,349,共10页
检测长文本和短文本相似性的应用场景越来越多,文本对的一致性检测大多可以统一抽象成文本相似性的比较问题。该问题的难点在于短文本是零散的,从而很难判断其属于哪个领域及其背景知识,也难以引入词嵌入来解决在通用场景的具体文本匹... 检测长文本和短文本相似性的应用场景越来越多,文本对的一致性检测大多可以统一抽象成文本相似性的比较问题。该问题的难点在于短文本是零散的,从而很难判断其属于哪个领域及其背景知识,也难以引入词嵌入来解决在通用场景的具体文本匹配问题。基于这个问题,提出一种新的基于文本聚类主题模型的轻量方法,不需要利用额外的背景知识来匹配通用文本相似性。在两个经典测试样本数据集上的实验结果表明,该方法的文本相似性检测效率非常高。 展开更多
关键词 自然语言处理 文本匹配 主题模型 吉布斯采样
下载PDF
战略认知差异会影响企业技术创新吗?——基于文本主题分析的实证研究
7
作者 古志辉 王兰 《研究与发展管理》 CSSCI 北大核心 2024年第3期137-148,共12页
在知识经济时代,知识对创新的边际贡献超过传统物质性生产要素,企业技术创新优势更多源于管理者认知的转变,而不再由异质性的资源所决定。本文探讨了行业场景中管理者的战略认知相较于行业共享信念之间的差异对技术创新的影响,同时考虑... 在知识经济时代,知识对创新的边际贡献超过传统物质性生产要素,企业技术创新优势更多源于管理者认知的转变,而不再由异质性的资源所决定。本文探讨了行业场景中管理者的战略认知相较于行业共享信念之间的差异对技术创新的影响,同时考虑了探索式学习与知识组合多样性在其中所发挥的路径传导作用。研究结果显示:管理者的战略认知差异能够显著促进以专利申请量为表征的技术创新数量,提高以专利外部引用为表征的技术创新质量。进一步研究发现,探索式学习和知识组合多样性在战略认知差异与技术创新的关系中发挥了部分中介作用。异质性分析发现,受到来自家族权威和行政制度的干预,管理者的战略认知差异在非家族企业与非国有企业样本中表现出更为显著的技术创新效果。研究结论从战略认知差异视角拓展了技术创新的前因研究,同时为理解中国企业的创新决策逻辑、探究创新人才培养路径提供了理论参考。 展开更多
关键词 战略认知差异 技术创新 探索式学习 知识组合多样性 文本主题分析
下载PDF
基于社交媒体文本挖掘的居民低碳出行意向分析
8
作者 叶贵 李长帆 +1 位作者 李晋鹏 牛佳晨 《现代城市研究》 北大核心 2024年第10期1-7,14,共8页
城市交通运输是碳减排的重要领域,其中城市居民出行碳排放占比达到了20%,低碳出行对缓解全球气候变化具有重要意义。了解居民对低碳出行的意向有助于推广该行为,社交媒体平台提供了大量有价值的信息,文章基于新浪微博中的低碳出行博文数... 城市交通运输是碳减排的重要领域,其中城市居民出行碳排放占比达到了20%,低碳出行对缓解全球气候变化具有重要意义。了解居民对低碳出行的意向有助于推广该行为,社交媒体平台提供了大量有价值的信息,文章基于新浪微博中的低碳出行博文数据,采用BERT-BiLSTM模型、LDA主题模型的文本挖掘方法分析居民对低碳出行的行为意向和关注主题。结果表明:居民对低碳出行整体上持积极意向;地铁和公交最受欢迎;低碳出行意向是不同因素综合作用的结果;明星效应对低碳出行意向影响显著。研究结论将有助于低碳出行政策的完善。 展开更多
关键词 低碳出行 社交媒体情绪 文本挖掘 主题分析
下载PDF
我国高校心理健康教育政策发展历程与主题演进分析
9
作者 肖娜 阳剑兰 《黑龙江高教研究》 北大核心 2024年第10期128-136,共9页
以1987—2023年国家层面颁布的高校心理健康教育政策文本为研究对象,综合政策效力量化模型和LDA主题模型分别对我国高校心理健康教育政策的演进历程、主题识别及强度演化情况进行分析。研究结果表明:我国高校心理健康教育政策演进历程... 以1987—2023年国家层面颁布的高校心理健康教育政策文本为研究对象,综合政策效力量化模型和LDA主题模型分别对我国高校心理健康教育政策的演进历程、主题识别及强度演化情况进行分析。研究结果表明:我国高校心理健康教育政策演进历程分为萌芽扎根期、成长探索期、深化发展期等三个阶段,政策体系经历了从无到有的发展过程;政策主题涵盖“思想健康与品德教育”“心理健康知识与技能教学”“青年人才择业心理疏导与服务”“心理咨询服务与队伍建设”“心理健康教育环境与体系构建”“心理卫生工作保健与服务”等六个方面,各主题强度随着政策演进阶段的发展而趋于平衡,政府愈加重视高校心理健康教育工作建设并统筹兼顾其各方面发展。 展开更多
关键词 高校心理健康教育 政策演进 主题挖掘 LDA主题模型 政策效力量化模型
下载PDF
基于文本数据的灾害信息风险监测与预警集成方法研究
10
作者 王治莹 陈笑 刘翰界 《灾害学》 CSCD 北大核心 2024年第4期81-87,共7页
基于灾害信息的文本数据,该文提出一种风险监测与预警集成方法,以提高灾害信息风险监测效率及监测支持预警的针对性。首先,运用八爪鱼数据采集器采集和处理灾害信息的文本数据;其次,运用BTM主题模型构建灾害信息风险监测模型,得到主题... 基于灾害信息的文本数据,该文提出一种风险监测与预警集成方法,以提高灾害信息风险监测效率及监测支持预警的针对性。首先,运用八爪鱼数据采集器采集和处理灾害信息的文本数据;其次,运用BTM主题模型构建灾害信息风险监测模型,得到主题热度趋势并确定具有高风险且亟待预警的话题;然后,提出灾害信息风险预警指标体系和预警等级判定方法,计算所确定话题的风险综合指标预警加权值,并结合预警区间判定预警等级;最后,以2021年“7·20”郑州特大暴雨灾害信息的风险监测和预警为例进行实验分析,验证所提方法的可行性。研究表明,该方法可将灾害信息的文本数据贯穿于风险监测与预警两个过程,有助于为监测结果更有针对性地支持预警工作提供参考。 展开更多
关键词 灾害信息 风险监测 风险预警 集成方法 文本数据 BTM主题模型
下载PDF
PPP政策内容分析及其市场影响
11
作者 孙慧 梁英子 +1 位作者 袁婷婷 王轶涵 《系统工程学报》 CSCD 北大核心 2024年第2期175-188,共14页
PPP政策是政府治理PPP模式的主要工具,也是社会资本方制定PPP投资策略的指导文件.从政策文本内容及其市场影响两个角度出发,分析了2014年∼2021年我国中央层面的PPP政策文本.首先,构建了LDA主题模型对PPP政策进行主题演化分析,从主题发... PPP政策是政府治理PPP模式的主要工具,也是社会资本方制定PPP投资策略的指导文件.从政策文本内容及其市场影响两个角度出发,分析了2014年∼2021年我国中央层面的PPP政策文本.首先,构建了LDA主题模型对PPP政策进行主题演化分析,从主题发现、主题强度和演化趋势三个方面分析PPP政策的文本内容;其次,基于LDA主题模型结果及财政部PPP项目库数据,构建了多元线性回归模型进一步研究了不同政策主题对PPP市场的影响机制.从政策内容来看,PPP政策在文本设计方面存在主题分布不均衡的问题,并且呈现出一定的波动性和矛盾性;从政策的市场影响来看,激励性政策并未达到政策预期,且PPP市场对规范性政策更加敏感,社会资本方在进行投资选择时更倾向于监管规范、信息公开的PPP市场. 展开更多
关键词 PPP政策 文本分析 市场影响 主题模型 量化分析
下载PDF
基于话题决策模型的英文文本切题度计算方法研究
12
作者 胡婷 《自动化技术与应用》 2024年第4期60-62,98,共4页
为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,... 为了对英文作文考试中英文文本的切题度加以判断,提出一套基于话题决策模型的英文文本切题度计算方法。介绍该算法的数据处理流程与话题决策模型的数据处理方法,最后通过WIKI_727K数据集对话题决策模型进行训练与测试,经实验研究发现,所提出的话题决策模型在精确率、召回率等方面具有一定的应用优势,并在ASAP数据集上表现出较为理想的切题度判断效果。 展开更多
关键词 英文文本 切题度 话题决策模型
下载PDF
基于三维主题特征测度的新兴主题识别研究
13
作者 郑德俊 程为 《情报学报》 CSSCI CSCD 北大核心 2024年第2期167-180,共14页
识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表... 识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表示,构建基于时间、引用和关联的三维主题特征指标框架,用于新兴主题识别;并以文本分类领域为例,验证本文方法的可行性与有效性。研究发现,以文献为基本单位表示主题能辅助主题深入挖掘,三维主题特征指标框架具有较好的适应性与扩展性,本文提出的新兴主题识别方法存在泛化应用的参考价值。在理论层面,能为新兴主题识别的相关研究提供一种可参考的方法和思路;在实践层面,可作为一种参考工具应用于科技情报分析、领域发展态势分析等场景。 展开更多
关键词 新兴主题识别 主题建模 主题特征测度 文本分类
下载PDF
面向短文本的增强上下文神经主题模型
14
作者 刘刚 王同礼 +2 位作者 唐宏伟 战凯 杨雯莉 《计算机工程与应用》 CSCD 北大核心 2024年第1期154-164,共11页
目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主... 目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主题模型(enhanced context neural topic model,ECNTM)。ECNTM基于主题控制器对主题进行稀疏性约束,过滤掉不相关的主题,同时模型的输入变成BOW向量和SBERT句子嵌入的拼接,在高斯解码器中,通过在嵌入空间中将单词上的主题分布处理为多元高斯分布或高斯混合分布,显式地丰富了短文本有限的上下文信息,解决了短文本词共现特征稀疏问题。在WS、Reuters、KOS、20 NewsGroups四个公开数据集上的实验结果表明,该模型在困惑度、主题一致性以及文本分类准确率上相较基准模型均有明显提升,证明了引入主题稀疏约束特性以及丰富的上下文信息到短文本主题建模的有效性。 展开更多
关键词 神经主题模型 短文本 稀疏约束 变分自编码器 主题建模
下载PDF
基于文本挖掘的新冠肺炎疫情下医药在线消费者的需求研究
15
作者 张丽 张祯 《运筹与管理》 CSSCI CSCD 北大核心 2024年第8期184-190,共7页
基于新冠肺炎疫情下医药电商交易规模的爆炸式增长,对医药电商在线评论进行文本分析,以某B2C医药电商平台2019—2021年在线评论数据为样本,利用LDA主题模型提取在线评论蕴含的主题,并构建情感词典融合深度学习的情感分析模型,对评论和... 基于新冠肺炎疫情下医药电商交易规模的爆炸式增长,对医药电商在线评论进行文本分析,以某B2C医药电商平台2019—2021年在线评论数据为样本,利用LDA主题模型提取在线评论蕴含的主题,并构建情感词典融合深度学习的情感分析模型,对评论和主题词进行情感分析。研究结果显示:1)消费者网购医药商品始终关注平台的可靠性、物流服务、商品价格、药品的使用效果;2)新冠肺炎疫情爆发之前,消费者对服务态度、商品品牌、购买便捷性有很大关注度;疫情爆发后对感冒类和维生素类药品关注度更高,疫情的爆发会影响消费者的购药决策;后疫情时代,消费者更关注商品性价比、购买快捷性以及药品的品质;3)消费者对于在医药电商平台进行购药整体上表现出积极正面的情感态度;4)负面在线评论主要集中在价格、药效、处方药购买、虚假宣传、物流包装、限购等方面。本研究挖掘出疫情下消费者对于网购医药商品的需求重点和痛点,对医药电商平台改善服务质量提供建设性意见。 展开更多
关键词 在线评论 文本挖掘 情感分析 LDA主题模型 COVID-19
下载PDF
基于词-主题-文本异质网络的短文本分类方法
16
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 词共现 文本-主题分布 短文本分类
下载PDF
信息茧房视域下在线问答社区用户健康信息需求对比研究
17
作者 邹筱 刘垣春 周欢 《衡阳师范学院学报》 2024年第3期59-67,共9页
信息获取途径的固化是促使信息茧房形成的重要原因之一,本研究旨在让社区了解用户的健康信息需求热点,并为社区信息治理和社区间信息整合提供参考,减少信息茧房对网络信息空间治理带来的负面影响。借助主题词提取和文本共现网络构建等... 信息获取途径的固化是促使信息茧房形成的重要原因之一,本研究旨在让社区了解用户的健康信息需求热点,并为社区信息治理和社区间信息整合提供参考,减少信息茧房对网络信息空间治理带来的负面影响。借助主题词提取和文本共现网络构建等自然语言处理技术,利用不同类型在线问答社区中真实的用户提问数据,分析用户健康信息需求热点,并对其需求特征的异同进行对比分析。实验结果表明:一方面,综合型与垂直型在线问答社区对于疾病的基础病理知识、药物信息以及饮食方面的关注度较高,且均具有适老化需求。另一方面,综合型在线问答社区对于疾病的预防关注度较高,而垂直型在线问答社区更加关注于疾病治疗,综合型在线问答社区用户存在情感支持需求,但总体上国内在线问答社区的情感支持需求均不高。 展开更多
关键词 信息茧房 在线健康问答社区 健康信息需求 主题提取 文本共现网络
下载PDF
技术交叉主题特征识别研究进展
18
作者 张娴 李嘉晖 《世界科技研究与发展》 CSCD 2024年第3期386-408,共23页
技术交叉主题识别研究对于技术创新研究意义重大。本文首先分析了技术交叉的内涵,随后对技术交叉主题识别主要方法进行了系统调研、归纳与分析,最后总结现有研究特点及优劣。研究发现,当前技术交叉主题识别主要方法有信息计量、引文分... 技术交叉主题识别研究对于技术创新研究意义重大。本文首先分析了技术交叉的内涵,随后对技术交叉主题识别主要方法进行了系统调研、归纳与分析,最后总结现有研究特点及优劣。研究发现,当前技术交叉主题识别主要方法有信息计量、引文分析、网络分析、文本挖掘、知识图谱、机器学习,涉及弱信号、突破性、颠覆性识别。主要特点包括:1)由形态特征层面的计量测度转向内容特征层面的文本主题挖掘;2)基于技术交叉特性的关联分析、文本挖掘方法等成为主流;3)多种方法与技术结合运用。技术交叉主题识别的未来研究方向包括:深入微观层面主题特征识别;多种方法的综合性创新运用;多元数据融汇;多领域异构大数据融合与应用关键技术。 展开更多
关键词 技术交叉 主题识别 技术融合 网络分析 文本挖掘
下载PDF
基于文本挖掘的线上课程教学质量评价——以我国大学MOOC为例
19
作者 陈艳萍 康人堂 《办公自动化》 2024年第23期34-36,共3页
作为“互联网+教育”的典范,大规模开放在线课程(MOOC)在推动教育公平和高等教育数字化转型中扮演至关重要的角色。文章以我国大学MOOC平台为例,爬取大量评论文本,采用LDA主题模型识别潜在主题信息,识别出课程内容、教学风格和课程感受... 作为“互联网+教育”的典范,大规模开放在线课程(MOOC)在推动教育公平和高等教育数字化转型中扮演至关重要的角色。文章以我国大学MOOC平台为例,爬取大量评论文本,采用LDA主题模型识别潜在主题信息,识别出课程内容、教学风格和课程感受三个主题,大部分用户的体验感较好。随后,对国家精品课程和非国家精品课程的教学质量进行综合评估,非国家精品课程评论数明显较国家精品评论数低,从评价结果看并无明显的区别。文章准确反映线上课程的教学质量,对提升MOOC教学质量至关重要。 展开更多
关键词 MOOC LDA主题模型 文本挖掘 教学质量
下载PDF
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究
20
作者 高娜 东梅 《网络安全与数据治理》 2024年第7期47-55,共9页
运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、... 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。 展开更多
关键词 LDA主题模型 Word2Vec 五年规划 文化政策 文本分析
下载PDF
上一页 1 2 38 下一页 到第
使用帮助 返回顶部