期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于WordCloud技术的MBSE发展态势研究
1
作者 董梦如 王国新 +2 位作者 鲁金直 马君达 阎艳 《系统工程与电子技术》 EI CSCD 北大核心 2024年第2期534-548,共15页
基于IEEE及国际系统工程协会(International Council on Systems Engineering,INCOSE)社区会刊,提取与基于模型的系统工程(model based systems engineering,MBSE)领域相关的167篇顶刊的关键词和摘要。采用Python及其第三方库WordCloud... 基于IEEE及国际系统工程协会(International Council on Systems Engineering,INCOSE)社区会刊,提取与基于模型的系统工程(model based systems engineering,MBSE)领域相关的167篇顶刊的关键词和摘要。采用Python及其第三方库WordCloud技术,以可视化形式展示MBSE领域研究内容并对MBSE发展态势进行研究。研究结果表明,MBSE在产品研发全生命周期,应用建模技术来支持系统需求、设计、分析、验证与确认等活动,在系统架构设计方面具有重要作用,将MBSE与安全性分析、可靠性分析方法结合也是MBSE的重要研究内容;系统建模语言(system modeling language,SysML)和对象过程方法(object process method,OPM)分别是目前MBSE研究领域中最受欢迎的建模语言和建模方法;将MBSE方法与本体进行结合是规范MBSE模型表达的重要手段,将MBSE与信息物理系统、数字孪生、并行工程领域进行融合研究是MBSE的重要发展方向。所提研究为使用WordCloud文本分析技术来探索当前的MBSE研究提供了技术路线参考,有助于对MBSE的未来发展态势进行预测。 展开更多
关键词 基于模型的系统工程(model based systems engineering MBSE) MBSE顶刊 wordcloud MBSE发展态势
下载PDF
应用Jieba和Wordcloud库的词云设计与优化 被引量:20
2
作者 徐博龙 《福建电脑》 2019年第6期25-28,共4页
分词是Python中的一项重要应用,实现分词功能的工具有很多种,如jieba、SnowNLP、THULAC、NLPIR等。词云是在分词的基础上设计并实现的,它提供阅读整个信息的重点,揭示关键概念,并可使用不同的展示形式,以有趣、高效、新颖的方式呈现给... 分词是Python中的一项重要应用,实现分词功能的工具有很多种,如jieba、SnowNLP、THULAC、NLPIR等。词云是在分词的基础上设计并实现的,它提供阅读整个信息的重点,揭示关键概念,并可使用不同的展示形式,以有趣、高效、新颖的方式呈现给阅读者。在此,以中文分词为例,详细介绍使用jieba库和wordcloud库实现词云的设计与优化。 展开更多
关键词 PYTHON 中文分词 词云 Jieba wordcloud
下载PDF
基于文本挖掘的图书馆舆情情感分析
3
作者 王龙军 王晶 +1 位作者 李光华 陈亮 《电脑与电信》 2024年第3期13-16,共4页
随着移动互联网在高校图书馆年轻读者的影响越来越大,新生代读者使用QQ即时通信软件的比例越来越大,对于图书馆QQ群文本信息进行文本挖掘从而了解图书馆的舆情,可以用于图书馆舆情预警,为图书馆决策层提供更强的舆情应对能力。采用网络... 随着移动互联网在高校图书馆年轻读者的影响越来越大,新生代读者使用QQ即时通信软件的比例越来越大,对于图书馆QQ群文本信息进行文本挖掘从而了解图书馆的舆情,可以用于图书馆舆情预警,为图书馆决策层提供更强的舆情应对能力。采用网络爬虫技术爬取2022年9月至2022年12月份时间段内的QQ群中聊天记录作为图书馆舆情数据,接着对原始的舆情数据进行数据去重、清洗等数据预处理操作,然后运用清华大学Thulac分词技术提取舆情数据的关键字、计算其权重,并使用WordCloud库进行可视化展示,接下来采用spaCy库给舆情数据计算出具体的情感倾向及分值,最后通过实验来分析图书馆舆情的情感倾向。 展开更多
关键词 文本挖掘 图书馆 舆情 情感分析 Thulac wordcloud spaCy
下载PDF
基于事故报告挖掘的矿工不安全行为管控 被引量:3
4
作者 吕月颖 季嘉琪 +2 位作者 陈修杰 王文浩 苗德俊 《煤矿安全》 CAS 北大核心 2023年第2期252-256,共5页
人因是诱发煤矿事故的重要致因,为研究人因事故中的规律性,并提高人因治理的针对性;采用文本数据挖掘的方法,依照事故诱发机制,对事故报告文本数据进行WordCloud-LDA分析,构建了煤矿事故人因因素体系;在此基础上,生成煤矿事故人因矩阵集... 人因是诱发煤矿事故的重要致因,为研究人因事故中的规律性,并提高人因治理的针对性;采用文本数据挖掘的方法,依照事故诱发机制,对事故报告文本数据进行WordCloud-LDA分析,构建了煤矿事故人因因素体系;在此基础上,生成煤矿事故人因矩阵集,并对人因矩阵集进行关联分析,得出人因因素与一般事故、顶板事故间的强关联规则。结果表明:事故报告挖掘下煤矿人因关联规则研究可以得出人因因素间趋势性的结论,为人因管控决策提供依据和基础。 展开更多
关键词 事故挖掘 文本分析 wordcloud-LDA分析 APRIORI算法 强关联规则
下载PDF
弹幕文本挖掘与情感分析
5
作者 刘宇婷 杨燕 《人工智能与机器人研究》 2023年第4期361-372,共12页
弹幕文本数据的流行,为短文本处理和实时数据处理提供了大量新的文本数据。本文首先对近年来关于弹幕文本的研究进行了系统性梳理归纳,然后基于文本挖掘技术对节目视频弹幕进行深层数据分析,围绕弹幕文本情感分析的关键技术和基本流程... 弹幕文本数据的流行,为短文本处理和实时数据处理提供了大量新的文本数据。本文首先对近年来关于弹幕文本的研究进行了系统性梳理归纳,然后基于文本挖掘技术对节目视频弹幕进行深层数据分析,围绕弹幕文本情感分析的关键技术和基本流程进行重点阐述,主要包括通过Python进行文本获取、文本预处理、高频词与词云图可视化、弹幕文本主题词分析、弹幕文本情感分析等多个模块,完成弹幕情感倾向分析,探究弹幕文本数据结构及文本特征,提高弹幕文本情感分析准确度。 展开更多
关键词 文本挖掘 弹幕情感分析 wordcloud LDA SnowNLP
下载PDF
基于Python的词云生成技术分析 被引量:12
6
作者 唐婷 《科学技术创新》 2021年第23期77-78,共2页
近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖... 近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖掘、人工智能、web开发等领域发挥着巨大的潜能。Python作为高校的计算机程序设计课程,它拥有丰富的标准库和第三方库函数,本文主要介绍jieba库的中文分词技术以及WordCloud库的词云制作技术,通过案例分析可以轻松生成形态各异的词云图片,词云图将文本中出现频率较高的关键词放大呈现,在视觉上形成冲击,读者可以一眼扫过就能领略文本的主旨。 展开更多
关键词 PYTHON jieba库 wordcloud 词云图片
下载PDF
基于PyQt5界面的词云制作软件设计 被引量:4
7
作者 姜华林 《电脑知识与技术》 2021年第13期74-76,92,共4页
文章基于PyQt5界面设计,python编程语言调用第三方库WordCloud设计词云制作软件,通过文件选择提取关键词及词云绘制,用QtWebEngineWidgets网页组件展示词云,把海量的数据以丰富的视觉效果呈现出来凸显关键词及其频率或权重,能帮助阅读... 文章基于PyQt5界面设计,python编程语言调用第三方库WordCloud设计词云制作软件,通过文件选择提取关键词及词云绘制,用QtWebEngineWidgets网页组件展示词云,把海量的数据以丰富的视觉效果呈现出来凸显关键词及其频率或权重,能帮助阅读者快速抓住信息的要点。 展开更多
关键词 PyQt5 窗体界面 wordcloud 词云 关键词权重
下载PDF
政策工具视角下我国养老产业政策量化研究 被引量:53
8
作者 李晓娣 原媛 黄鲁成 《情报杂志》 CSSCI 北大核心 2021年第4期147-154,共8页
[目的/意义]优化调配养老产业政策的整体布局,有效提升产业发展的治理成效,对于推进我国经济高质量发展具有重要意义。[方法/过程]基于政策工具——养老模式参与主体——创新价值链的三维分析框架,采用内容分析法和词云图对我国2011-202... [目的/意义]优化调配养老产业政策的整体布局,有效提升产业发展的治理成效,对于推进我国经济高质量发展具有重要意义。[方法/过程]基于政策工具——养老模式参与主体——创新价值链的三维分析框架,采用内容分析法和词云图对我国2011-2020年中央层面出台的养老产业政策进行纵向和横向的量化分析。[结果/结论]研究发现,促进养老产业发展的政策工具呈现偏供给型轻需求型、养老模式参与主体中政策分布不均衡、创新价值链维度养老产业发展尚未成熟的发展状况,进而提出优化调配政策工具、发挥各参与主体作用价值、保障养老产业创新价值链合理化进程的对策建议。 展开更多
关键词 政策工具 养老产业 内容分析法 词云图 政策文本
下载PDF
一种教育舆情的爬虫程序设计 被引量:4
9
作者 仇明 《河北软件职业技术学院学报》 2021年第1期12-14,18,共4页
教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高... 教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高教育质量和效果。在实际工作中尝试通过爬虫程序获取某市寄语市长网站中近三年的教育类留言,统计出群众留言中的高频词语并绘制词云,获得社会关注的热点教育问题,从而为教育教学改革提供依据和参考。 展开更多
关键词 PYTHON 网络爬虫 Jieba库 wordcloud
下载PDF
基于Python的数据分析与可视化平台研究 被引量:25
10
作者 宋永生 黄蓉美 王军 《现代信息科技》 2019年第21期7-9,共3页
数据分析与可视化有助于人们从繁杂的数据中快速获取有用的信息。利用Python中的Pandas对结构化数据进行分析,采用Matplotlib进行图表展示;从非结构化数据中提取文本,利用Jieba对文本进行分词处理,利用Wordcloud进行词云展示。利用Flas... 数据分析与可视化有助于人们从繁杂的数据中快速获取有用的信息。利用Python中的Pandas对结构化数据进行分析,采用Matplotlib进行图表展示;从非结构化数据中提取文本,利用Jieba对文本进行分词处理,利用Wordcloud进行词云展示。利用Flask对上述图表及词云进行Web发布,构建数据分析与可视化平台,成本较低,简便易用。 展开更多
关键词 可视化 PANDAS Matplotlib Jieba wordcloud
下载PDF
数据挖掘方法在文本分析中的应用——以十九大报告、习近平讲话等文本为例 被引量:3
11
作者 张林泉 《哈尔滨师范大学自然科学学报》 CAS 2020年第6期47-52,共6页
基于Python自然语言处理方法,运用思维导图、词云、知识图谱、情感分析、文本结构分析了文本文件,给出了文本的词云图、知识图谱图,情感极性分析值及短语结构树与依存树.研究发现数据挖掘可以达到整体化、系统化地反映文本重要的内容,... 基于Python自然语言处理方法,运用思维导图、词云、知识图谱、情感分析、文本结构分析了文本文件,给出了文本的词云图、知识图谱图,情感极性分析值及短语结构树与依存树.研究发现数据挖掘可以达到整体化、系统化地反映文本重要的内容,揭示文本的逻辑结构和逻辑体系和精神实质,提升深刻理解准确把握文本文件核心要义的能力为文本文件的学习提供了重要启示和借鉴. 展开更多
关键词 思维导图 词云 知识图谱 情感分析 结构分析
下载PDF
高职院校教学文档数据化及价值分析研究——以常州信息职业技术学院为例 被引量:1
12
作者 唐小燕 李建新 《柳州职业技术学院学报》 2022年第4期130-134,共5页
“互联网+”时代的智慧教育需要教学数据价值分析思维和方法的革新,文章分析高职院校教学文档数据实际应用中存在的不足,基于信息化技术构建教学文档数据化及价值分析体系,以一个教学文档为例,对其中的教学数据进行应用实践,分析其数据... “互联网+”时代的智慧教育需要教学数据价值分析思维和方法的革新,文章分析高职院校教学文档数据实际应用中存在的不足,基于信息化技术构建教学文档数据化及价值分析体系,以一个教学文档为例,对其中的教学数据进行应用实践,分析其数据价值,支撑教学管理决策。该应用实践具有可推广性,能有效促进智慧教育发展。 展开更多
关键词 智慧教育 数据价值 数据分析 教学决策 词云
下载PDF
词云生成系统的构建 被引量:10
13
作者 冯与诘 《通讯世界》 2019年第3期190-192,共3页
在这个高速发展的大数据时代,各种各样的文本充斥着整个互联网,而这些文本的质量也是鱼龙混杂,如何从中提取出重要信息是个很好的问题。一篇文章的主要内容主要由其关键字体现,如果我们能够提取关键字并将其用图片的形式展示出来,那会... 在这个高速发展的大数据时代,各种各样的文本充斥着整个互联网,而这些文本的质量也是鱼龙混杂,如何从中提取出重要信息是个很好的问题。一篇文章的主要内容主要由其关键字体现,如果我们能够提取关键字并将其用图片的形式展示出来,那会让人一目了然,并且节省阅读的时间。"词云"就是将文章中出现频率比较高的词提取出来并以图片的形式展现,同时可以过滤掉大量无用信息,使得文章阅读者只要扫一眼"词云"就可以领略文章的主旨。本文将介绍提取关键词的算法并利用python库进行实验,提取文章的关键词并进行词云的生成展示。 展开更多
关键词 TF-IDF 分词 wordcloud
下载PDF
基于贝叶斯分类算法的用户评论数据挖掘系统设计 被引量:4
14
作者 孙含笑 《现代计算机》 2021年第4期56-59,共4页
随着人工智能和大数据的蓬勃发展,传统的现场购物的方式已经被颠覆,电子购物逐渐成为人们生活不可或缺的一部分。电子购物不仅方便了消费者,而且电商平台也可以获得海量的非结构化文本数据,如商品描述、用户评论、用户咨询等,进而实现... 随着人工智能和大数据的蓬勃发展,传统的现场购物的方式已经被颠覆,电子购物逐渐成为人们生活不可或缺的一部分。电子购物不仅方便了消费者,而且电商平台也可以获得海量的非结构化文本数据,如商品描述、用户评论、用户咨询等,进而实现商品优化。但是电商平台所获得的信息繁冗复杂,数据量大且夹杂大量无效信息,如何从其中高效提取有效信息成为电商平台发展的掣肘所在。基于这一关键问题,一种全新的数据挖掘系统被提出。以某知化妆品为案例,通过Python爬取其购物评论,利用WordCloud制作词云,从词云图捕捉客户对商品的满意度以及客户对商品的主要关注点。随后基于朴素贝叶斯分类算法对评论进行类别训练,并提取好差评评论中的敏感词汇,进而找到商品改进的突破点。 展开更多
关键词 非结构化文本数据 wordcloud 数据挖掘 朴素贝叶斯分类算法
下载PDF
基于R语言分析某院处方点评大数据 被引量:1
15
作者 宋宗辉 刘跃辉 +2 位作者 周义录 万杰 文洋 《中国药业》 CAS 2022年第23期20-23,共4页
目的预警临床不合理使用频数出现较高的药品,促进合理用药。方法从某院2020年1月至12月门急诊41万张处方中按每月5000张抽取点评处方6万张,以平均用药品种数、基本药物使用率、抗菌药物使用率、注射剂使用率、医师抽样率、总体合格率为... 目的预警临床不合理使用频数出现较高的药品,促进合理用药。方法从某院2020年1月至12月门急诊41万张处方中按每月5000张抽取点评处方6万张,以平均用药品种数、基本药物使用率、抗菌药物使用率、注射剂使用率、医师抽样率、总体合格率为指标评价整体合理用药情况;采用4.1.0版R语言词云软件包统计“用药与临床诊断不相符”药品的出现频数,绘制不合理用药词云。结果6万张点评处方中,平均用药品种数,基本药物使用率、抗菌药物使用率、注射剂使用率,医师抽样率及总体合格率分别为(2.05±0.04)种及66.66%,14.37%,16.21%,34.58%,95.56%;不合理用药词云分析显示,阿托伐他汀钙片、兰索拉唑肠溶片、蒲地蓝消炎口服液、枸橼酸莫沙必利片出现频数最多。结论将R语言词云软件包应用于处方点评大数据分析,能直观、清晰地预警临床不合理使用的药品。 展开更多
关键词 R语言 药物词云 处方点评 合理用药 大数据
下载PDF
采用Scrapy分布式爬虫技术的微博热点舆情信息获取与分析 被引量:3
16
作者 董少林 李钟慎 《电脑与信息技术》 2020年第5期23-26,共4页
文章通过2020年3月28日到4月4日四川凉山发生的火灾期间,相关微博话题“凉山木里火灾”的微博内容和微博评论内容进行舆情分析,设计Scrapy分布式爬虫以及分布式数据库技术对该热点话题进行数据获取,再采用Matlab的视图化技术进行时间上... 文章通过2020年3月28日到4月4日四川凉山发生的火灾期间,相关微博话题“凉山木里火灾”的微博内容和微博评论内容进行舆情分析,设计Scrapy分布式爬虫以及分布式数据库技术对该热点话题进行数据获取,再采用Matlab的视图化技术进行时间上的热度分析,最后基于评论内容的文本信息进行利用SnowNLP等进行情感分析,利用Wordcloud得到关键词词云,可以看出人们的情绪偏悲观,关键词多以“辛苦”、“平安”等对消防员的致敬为主。 展开更多
关键词 微博话题 分布式爬虫 情感分析 文本聚类 词云
下载PDF
基于词云和文章主题的校园综合新闻聚类
17
作者 郝秀慧 方贤进 杨高明 《安徽理工大学学报(自然科学版)》 CAS 2021年第6期39-44,共6页
面对大量繁杂的新闻数据,为了让人们从大量的数据中了解主要类别信息,将采集到的11456条校园综合新闻作为研究对象,采用了基于词云和top3文章主题的k-means聚类方法。通过词频-反文档频率技术将采集到的11456条校园综合新闻进行主题提取... 面对大量繁杂的新闻数据,为了让人们从大量的数据中了解主要类别信息,将采集到的11456条校园综合新闻作为研究对象,采用了基于词云和top3文章主题的k-means聚类方法。通过词频-反文档频率技术将采集到的11456条校园综合新闻进行主题提取,并用词云结果来估计k值,结果可将采集到的校园综合新闻数据聚为7个类别,与不基于文章主题的k-means聚类方法对比。评估结果表明,当将数据聚为2到10不同的类别数时,基于top3文章主题聚类的戴维森堡丁指数值整体小于不基于文章主题的聚类方法。因此,基于词云和top3文章主题的聚类方法比不基于文章主题的聚类方法稍好。聚类结果能为用户了解或查找想要的类别信息提供一定参考。 展开更多
关键词 词云 文章主题 校园新闻 词频-反文档频率 K-MEANS聚类
下载PDF
广播内容研判与分析的探索及实现 被引量:1
18
作者 郑小波 刘越 《电声技术》 2021年第6期76-80,共5页
为实现广播电视安全播出监管智慧化,广播电视AI安播值守系统在广播内容智能监管领域进行探索性研发,创新实现了节目内容的监测、敏感词汇的捕捉以及热点内容的分析等内容研判功能。基于此,详细介绍广播电视AI安播值守系统的功能及实现。
关键词 AI内容监管 敏感词捕捉 节目识别 排期比对 热词分析
下载PDF
Text Mining and Visualization Based on R Software
19
作者 Qiuxue Xu Yongmin Quan Zhezhi Jin 《信息工程期刊(中英文版)》 2017年第2期53-59,共7页
关键词 可视化分析 统计软件 采矿 中华人民共和国 关键词检索 可视化工具 国家经济 频率分析
下载PDF
知识产权保护文本的爬虫与词云研究
20
作者 陈一 《电脑知识与技术》 2021年第19期118-119,共2页
为研究国家对知识产权保护的重点关注领域,更好地发挥知识产权保护在创新和发展中的重要作用。运用Python对国家知识产权局官网2020年发布的关于知识产权保护文本进行爬虫,再运用jieba和wordcloud制作词云,分析国家对知识产权保护的侧... 为研究国家对知识产权保护的重点关注领域,更好地发挥知识产权保护在创新和发展中的重要作用。运用Python对国家知识产权局官网2020年发布的关于知识产权保护文本进行爬虫,再运用jieba和wordcloud制作词云,分析国家对知识产权保护的侧重点。 展开更多
关键词 知识产权保护 PYTHON 爬虫 词云
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部