期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于字典和jieba库的“党的二十大报告”词频分析
1
作者 谢光艺 《现代信息科技》 2023年第18期195-198,共4页
在“Python程序设计”课程中,字典的概念和应用是一个难点。结合字典功能和jieba库对“党的二十大报告”进行词频分析,针对直接统计结果的不足,通过词语替换改进程序达到了较好的效果,并利用Matplotlib库对统计结果进行了直观显示。通... 在“Python程序设计”课程中,字典的概念和应用是一个难点。结合字典功能和jieba库对“党的二十大报告”进行词频分析,针对直接统计结果的不足,通过词语替换改进程序达到了较好的效果,并利用Matplotlib库对统计结果进行了直观显示。通过以上实际案例编程,有利于学生掌握字典的概念和应用,以及统计结果的可视化。 展开更多
关键词 词频 字典 jieba库 党的二十大报告
下载PDF
中文分词神器Jieba分词库的应用 被引量:1
2
作者 江锐鹏 钟广玲 《电脑编程技巧与维护》 2023年第9期87-89,110,共4页
Jieba分词库是一个基于Python的中文分词工具包,它具有高效、准确的分词性能,广泛应用于中文自然语言处理领域。通过研究Jieba分词库的应用案例发现,随着深度学习技术在自然语言处理领域的进一步发展,Jieba分词库能够在性能、准确性和... Jieba分词库是一个基于Python的中文分词工具包,它具有高效、准确的分词性能,广泛应用于中文自然语言处理领域。通过研究Jieba分词库的应用案例发现,随着深度学习技术在自然语言处理领域的进一步发展,Jieba分词库能够在性能、准确性和功能上得到更大提升。对于需要处理中文文本的开发者和研究者来说,Jieba分词库是重要的工具和资源。 展开更多
关键词 jieba库 中文分析 情感分析 自然语言处理
下载PDF
基于Python技术的《红楼梦》文本分析研究
3
作者 唐明珍 李宝 《科技风》 2024年第22期141-143,共3页
随着互联网技术的普及,信息呈指数级增长,如何从大量文本中挖掘有价值的信息一直是文本分析研究的主题。本文使用Python技术对《红楼梦》从基本信息统计、词频云图绘制、人物关系分析、章回聚类分析等方面做可视化分析,挖掘小说文本中... 随着互联网技术的普及,信息呈指数级增长,如何从大量文本中挖掘有价值的信息一直是文本分析研究的主题。本文使用Python技术对《红楼梦》从基本信息统计、词频云图绘制、人物关系分析、章回聚类分析等方面做可视化分析,挖掘小说文本中隐蔽性信息。与传统文学作品分析方法相比,该数据挖掘的定量分析方法可以高效获取文本文献中有潜在性的信息,具有一定的普适性和应用价值。 展开更多
关键词 红楼梦 文本分析 Python技术 jieba库 聚类分析
下载PDF
基于Python的词云生成技术分析 被引量:12
4
作者 唐婷 《科学技术创新》 2021年第23期77-78,共2页
近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖... 近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖掘、人工智能、web开发等领域发挥着巨大的潜能。Python作为高校的计算机程序设计课程,它拥有丰富的标准库和第三方库函数,本文主要介绍jieba库的中文分词技术以及WordCloud库的词云制作技术,通过案例分析可以轻松生成形态各异的词云图片,词云图将文本中出现频率较高的关键词放大呈现,在视觉上形成冲击,读者可以一眼扫过就能领略文本的主旨。 展开更多
关键词 PYTHON jieba库 WordCloud 词云图片
下载PDF
基于网评文本的LDA游客目的地印象分析
5
作者 张超群 郝小芳 +2 位作者 王大睿 李晓翔 完颜兵 《现代计算机》 2022年第2期12-20,61,共10页
随着大数据时代的到来及人民生活水平的不断提高,旅游业迅速发展。鉴于游客满意度直接影响目的地美誉度,有必要对游客目的地印象进行分析。本文根据文本分析理论,首先对“泰迪杯”挑战赛官网、穷游网的网评文本数据进行数据预处理,再用J... 随着大数据时代的到来及人民生活水平的不断提高,旅游业迅速发展。鉴于游客满意度直接影响目的地美誉度,有必要对游客目的地印象进行分析。本文根据文本分析理论,首先对“泰迪杯”挑战赛官网、穷游网的网评文本数据进行数据预处理,再用Jieba库分词,接着用TF-IDF算法提取关键词,根据Kmeans得出聚类中心,结合KNN算法将其分类,最后用LDA模型进行主题分析并映射为特征需求。实验结果表明,游客主要关注目的地的服务、位置、设施、性价比、卫生,根据特征需求了解游客偏好,据此对旅游企业健康持续发展提出三条有益建议,有助于优化旅游资源配置,提高游客满意度和提升目的地美誉度。 展开更多
关键词 网评文本 游客满意度 目的地美誉度 jieba库 TF-IDF K-means KNN LDA模型
下载PDF
TF-IDF模型和LSI模型文本相似度算法的应用 被引量:4
6
作者 马伟彬 《电子技术与软件工程》 2022年第1期130-133,共4页
本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的基础文本进行调整,减少了噪声信息的影响。相似度算法可以计算不同文本之间的相似程度。词频-逆文档频率(Term Freq... 本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的基础文本进行调整,减少了噪声信息的影响。相似度算法可以计算不同文本之间的相似程度。词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)模型、潜在语义索引(Latent Semantic Indexing,LSI)模型是常见的文本相似度计算模型。本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的咨询矢量进行调整,减少了噪声信息的影响。 展开更多
关键词 智能检索 文本相似度 jieba库 TF-IDF LSI SVD分解
下载PDF
一种教育舆情的爬虫程序设计 被引量:4
7
作者 仇明 《河北软件职业技术学院学报》 2021年第1期12-14,18,共4页
教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高... 教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高教育质量和效果。在实际工作中尝试通过爬虫程序获取某市寄语市长网站中近三年的教育类留言,统计出群众留言中的高频词语并绘制词云,获得社会关注的热点教育问题,从而为教育教学改革提供依据和参考。 展开更多
关键词 PYTHON 网络爬虫 jieba库 Wordcloud
下载PDF
景区在线评论爬虫程序设计
8
作者 仇明 《安徽电子信息职业技术学院学报》 2022年第6期19-24,共6页
利用Python语言构建网络爬虫,较为高效地获取旅游网站中游客关于景区的在线评论并进行分析,统计出其中的高频词语进而绘制词云图,从而发现游客对于相应景区较为关注的热点问题,使得景区能够针对这些热点问题做出相应的改进和提高,从而... 利用Python语言构建网络爬虫,较为高效地获取旅游网站中游客关于景区的在线评论并进行分析,统计出其中的高频词语进而绘制词云图,从而发现游客对于相应景区较为关注的热点问题,使得景区能够针对这些热点问题做出相应的改进和提高,从而为旅游业服务质量的提升做出有益的探索和尝试。 展开更多
关键词 PYTHON语言 在线评论 网络爬虫 jieba库
下载PDF
基于Python的《水浒传》中人物分析 被引量:3
9
作者 杨旭东 《网络安全技术与应用》 2019年第1期42-43,共2页
随着大数据技术的应用领域不断扩大,信息量也在日益膨胀,而有价值的信息是有限的,利用文本挖掘技术可以高效地获取长文本文献中的有价值信息,实现热点追踪。作为当前最流行的编程语言,Python能够快速而准确地进行词频统计、获取高频词,... 随着大数据技术的应用领域不断扩大,信息量也在日益膨胀,而有价值的信息是有限的,利用文本挖掘技术可以高效地获取长文本文献中的有价值信息,实现热点追踪。作为当前最流行的编程语言,Python能够快速而准确地进行词频统计、获取高频词,从而获得文献的主题思想。 展开更多
关键词 PYTHON语言 jieba库 文本挖掘
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部