期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于字典和jieba库的“党的二十大报告”词频分析
被引量:
1
1
作者
谢光艺
《现代信息科技》
2023年第18期195-198,共4页
在“Python程序设计”课程中,字典的概念和应用是一个难点。结合字典功能和jieba库对“党的二十大报告”进行词频分析,针对直接统计结果的不足,通过词语替换改进程序达到了较好的效果,并利用Matplotlib库对统计结果进行了直观显示。通...
在“Python程序设计”课程中,字典的概念和应用是一个难点。结合字典功能和jieba库对“党的二十大报告”进行词频分析,针对直接统计结果的不足,通过词语替换改进程序达到了较好的效果,并利用Matplotlib库对统计结果进行了直观显示。通过以上实际案例编程,有利于学生掌握字典的概念和应用,以及统计结果的可视化。
展开更多
关键词
词频
字典
jieba库
党的二十大报告
下载PDF
职称材料
中文分词神器Jieba分词库的应用
被引量:
2
2
作者
江锐鹏
钟广玲
《电脑编程技巧与维护》
2023年第9期87-89,110,共4页
Jieba分词库是一个基于Python的中文分词工具包,它具有高效、准确的分词性能,广泛应用于中文自然语言处理领域。通过研究Jieba分词库的应用案例发现,随着深度学习技术在自然语言处理领域的进一步发展,Jieba分词库能够在性能、准确性和...
Jieba分词库是一个基于Python的中文分词工具包,它具有高效、准确的分词性能,广泛应用于中文自然语言处理领域。通过研究Jieba分词库的应用案例发现,随着深度学习技术在自然语言处理领域的进一步发展,Jieba分词库能够在性能、准确性和功能上得到更大提升。对于需要处理中文文本的开发者和研究者来说,Jieba分词库是重要的工具和资源。
展开更多
关键词
jieba库
中文分析
情感分析
自然语言处理
下载PDF
职称材料
基于Python技术的《红楼梦》文本分析研究
3
作者
唐明珍
李宝
《科技风》
2024年第22期141-143,共3页
随着互联网技术的普及,信息呈指数级增长,如何从大量文本中挖掘有价值的信息一直是文本分析研究的主题。本文使用Python技术对《红楼梦》从基本信息统计、词频云图绘制、人物关系分析、章回聚类分析等方面做可视化分析,挖掘小说文本中...
随着互联网技术的普及,信息呈指数级增长,如何从大量文本中挖掘有价值的信息一直是文本分析研究的主题。本文使用Python技术对《红楼梦》从基本信息统计、词频云图绘制、人物关系分析、章回聚类分析等方面做可视化分析,挖掘小说文本中隐蔽性信息。与传统文学作品分析方法相比,该数据挖掘的定量分析方法可以高效获取文本文献中有潜在性的信息,具有一定的普适性和应用价值。
展开更多
关键词
红楼梦
文本分析
Python技术
jieba库
聚类分析
下载PDF
职称材料
基于Python的词云生成技术分析
被引量:
12
4
作者
唐婷
《科学技术创新》
2021年第23期77-78,共2页
近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖...
近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖掘、人工智能、web开发等领域发挥着巨大的潜能。Python作为高校的计算机程序设计课程,它拥有丰富的标准库和第三方库函数,本文主要介绍jieba库的中文分词技术以及WordCloud库的词云制作技术,通过案例分析可以轻松生成形态各异的词云图片,词云图将文本中出现频率较高的关键词放大呈现,在视觉上形成冲击,读者可以一眼扫过就能领略文本的主旨。
展开更多
关键词
PYTHON
jieba库
WordCloud
库
词云图片
下载PDF
职称材料
基于网评文本的LDA游客目的地印象分析
5
作者
张超群
郝小芳
+2 位作者
王大睿
李晓翔
完颜兵
《现代计算机》
2022年第2期12-20,61,共10页
随着大数据时代的到来及人民生活水平的不断提高,旅游业迅速发展。鉴于游客满意度直接影响目的地美誉度,有必要对游客目的地印象进行分析。本文根据文本分析理论,首先对“泰迪杯”挑战赛官网、穷游网的网评文本数据进行数据预处理,再用J...
随着大数据时代的到来及人民生活水平的不断提高,旅游业迅速发展。鉴于游客满意度直接影响目的地美誉度,有必要对游客目的地印象进行分析。本文根据文本分析理论,首先对“泰迪杯”挑战赛官网、穷游网的网评文本数据进行数据预处理,再用Jieba库分词,接着用TF-IDF算法提取关键词,根据Kmeans得出聚类中心,结合KNN算法将其分类,最后用LDA模型进行主题分析并映射为特征需求。实验结果表明,游客主要关注目的地的服务、位置、设施、性价比、卫生,根据特征需求了解游客偏好,据此对旅游企业健康持续发展提出三条有益建议,有助于优化旅游资源配置,提高游客满意度和提升目的地美誉度。
展开更多
关键词
网评文本
游客满意度
目的地美誉度
jieba库
TF-IDF
K-means
KNN
LDA模型
下载PDF
职称材料
TF-IDF模型和LSI模型文本相似度算法的应用
被引量:
5
6
作者
马伟彬
《电子技术与软件工程》
2022年第1期130-133,共4页
本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的基础文本进行调整,减少了噪声信息的影响。相似度算法可以计算不同文本之间的相似程度。词频-逆文档频率(Term Freq...
本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的基础文本进行调整,减少了噪声信息的影响。相似度算法可以计算不同文本之间的相似程度。词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)模型、潜在语义索引(Latent Semantic Indexing,LSI)模型是常见的文本相似度计算模型。本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的咨询矢量进行调整,减少了噪声信息的影响。
展开更多
关键词
智能检索
文本相似度
jieba库
TF-IDF
LSI
SVD分解
下载PDF
职称材料
一种教育舆情的爬虫程序设计
被引量:
4
7
作者
仇明
《河北软件职业技术学院学报》
2021年第1期12-14,18,共4页
教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高...
教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高教育质量和效果。在实际工作中尝试通过爬虫程序获取某市寄语市长网站中近三年的教育类留言,统计出群众留言中的高频词语并绘制词云,获得社会关注的热点教育问题,从而为教育教学改革提供依据和参考。
展开更多
关键词
PYTHON
网络爬虫
jieba库
Wordcloud
库
下载PDF
职称材料
景区在线评论爬虫程序设计
8
作者
仇明
《安徽电子信息职业技术学院学报》
2022年第6期19-24,共6页
利用Python语言构建网络爬虫,较为高效地获取旅游网站中游客关于景区的在线评论并进行分析,统计出其中的高频词语进而绘制词云图,从而发现游客对于相应景区较为关注的热点问题,使得景区能够针对这些热点问题做出相应的改进和提高,从而...
利用Python语言构建网络爬虫,较为高效地获取旅游网站中游客关于景区的在线评论并进行分析,统计出其中的高频词语进而绘制词云图,从而发现游客对于相应景区较为关注的热点问题,使得景区能够针对这些热点问题做出相应的改进和提高,从而为旅游业服务质量的提升做出有益的探索和尝试。
展开更多
关键词
PYTHON语言
在线评论
网络爬虫
jieba库
下载PDF
职称材料
基于Python的《水浒传》中人物分析
被引量:
3
9
作者
杨旭东
《网络安全技术与应用》
2019年第1期42-43,共2页
随着大数据技术的应用领域不断扩大,信息量也在日益膨胀,而有价值的信息是有限的,利用文本挖掘技术可以高效地获取长文本文献中的有价值信息,实现热点追踪。作为当前最流行的编程语言,Python能够快速而准确地进行词频统计、获取高频词,...
随着大数据技术的应用领域不断扩大,信息量也在日益膨胀,而有价值的信息是有限的,利用文本挖掘技术可以高效地获取长文本文献中的有价值信息,实现热点追踪。作为当前最流行的编程语言,Python能够快速而准确地进行词频统计、获取高频词,从而获得文献的主题思想。
展开更多
关键词
PYTHON语言
jieba库
文本挖掘
原文传递
题名
基于字典和jieba库的“党的二十大报告”词频分析
被引量:
1
1
作者
谢光艺
机构
西安培华学院智能科学与信息工程学院
出处
《现代信息科技》
2023年第18期195-198,共4页
基金
西安培华学院校改课题重点项目(PHKCSZ202102)。
文摘
在“Python程序设计”课程中,字典的概念和应用是一个难点。结合字典功能和jieba库对“党的二十大报告”进行词频分析,针对直接统计结果的不足,通过词语替换改进程序达到了较好的效果,并利用Matplotlib库对统计结果进行了直观显示。通过以上实际案例编程,有利于学生掌握字典的概念和应用,以及统计结果的可视化。
关键词
词频
字典
jieba库
党的二十大报告
Keywords
word frequency
dictionary
jieba
library
Report of the 20th National Congress of the Communist Party of China
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
中文分词神器Jieba分词库的应用
被引量:
2
2
作者
江锐鹏
钟广玲
机构
广州华商学院数据科学与大数据技术系
出处
《电脑编程技巧与维护》
2023年第9期87-89,110,共4页
文摘
Jieba分词库是一个基于Python的中文分词工具包,它具有高效、准确的分词性能,广泛应用于中文自然语言处理领域。通过研究Jieba分词库的应用案例发现,随着深度学习技术在自然语言处理领域的进一步发展,Jieba分词库能够在性能、准确性和功能上得到更大提升。对于需要处理中文文本的开发者和研究者来说,Jieba分词库是重要的工具和资源。
关键词
jieba库
中文分析
情感分析
自然语言处理
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP312.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Python技术的《红楼梦》文本分析研究
3
作者
唐明珍
李宝
机构
安康学院文学与传媒学院
安康学院电子与信息工程学院
出处
《科技风》
2024年第22期141-143,共3页
文摘
随着互联网技术的普及,信息呈指数级增长,如何从大量文本中挖掘有价值的信息一直是文本分析研究的主题。本文使用Python技术对《红楼梦》从基本信息统计、词频云图绘制、人物关系分析、章回聚类分析等方面做可视化分析,挖掘小说文本中隐蔽性信息。与传统文学作品分析方法相比,该数据挖掘的定量分析方法可以高效获取文本文献中有潜在性的信息,具有一定的普适性和应用价值。
关键词
红楼梦
文本分析
Python技术
jieba库
聚类分析
分类号
I207.411 [文学—中国文学]
下载PDF
职称材料
题名
基于Python的词云生成技术分析
被引量:
12
4
作者
唐婷
机构
四川职业技术学院计算机科学系
出处
《科学技术创新》
2021年第23期77-78,共2页
文摘
近几年来,随着"人工智能"、"大数据"等技术的发展,Python已经成为最热门的计算机程序设计语言之一。Python具有简单、易学、开放源代码、面向对象、可扩展性等特点,可与C、C++等语言混合编译,它在数据分析、数据挖掘、人工智能、web开发等领域发挥着巨大的潜能。Python作为高校的计算机程序设计课程,它拥有丰富的标准库和第三方库函数,本文主要介绍jieba库的中文分词技术以及WordCloud库的词云制作技术,通过案例分析可以轻松生成形态各异的词云图片,词云图将文本中出现频率较高的关键词放大呈现,在视觉上形成冲击,读者可以一眼扫过就能领略文本的主旨。
关键词
PYTHON
jieba库
WordCloud
库
词云图片
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于网评文本的LDA游客目的地印象分析
5
作者
张超群
郝小芳
王大睿
李晓翔
完颜兵
机构
广西民族大学人工智能学院
广西民族大学电子信息学院
出处
《现代计算机》
2022年第2期12-20,61,共10页
基金
国家自然科学基金项目:基于数据流的微分代数事件结构及其层次化理论研究(62062011)
广西自然科学基金项目:化工动态优化控制问题的不等分离散化智能数值法研究与应用(2018JJA120160)
广西民族大学研究生科研创新项目:基于Spark技术的旅游景点推荐系统(gxun-chxps202088)。
文摘
随着大数据时代的到来及人民生活水平的不断提高,旅游业迅速发展。鉴于游客满意度直接影响目的地美誉度,有必要对游客目的地印象进行分析。本文根据文本分析理论,首先对“泰迪杯”挑战赛官网、穷游网的网评文本数据进行数据预处理,再用Jieba库分词,接着用TF-IDF算法提取关键词,根据Kmeans得出聚类中心,结合KNN算法将其分类,最后用LDA模型进行主题分析并映射为特征需求。实验结果表明,游客主要关注目的地的服务、位置、设施、性价比、卫生,根据特征需求了解游客偏好,据此对旅游企业健康持续发展提出三条有益建议,有助于优化旅游资源配置,提高游客满意度和提升目的地美誉度。
关键词
网评文本
游客满意度
目的地美誉度
jieba库
TF-IDF
K-means
KNN
LDA模型
Keywords
review text data from web
tourists’satisfaction
destination reputation
jieba
library
TF-IDF
K-means
KNN
LDA model
分类号
F592 [经济管理—旅游管理]
F274 [经济管理—企业管理]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
TF-IDF模型和LSI模型文本相似度算法的应用
被引量:
5
6
作者
马伟彬
机构
国家知识产权局专利局专利审查协作广东中心
出处
《电子技术与软件工程》
2022年第1期130-133,共4页
文摘
本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的基础文本进行调整,减少了噪声信息的影响。相似度算法可以计算不同文本之间的相似程度。词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)模型、潜在语义索引(Latent Semantic Indexing,LSI)模型是常见的文本相似度计算模型。本文分析探讨基于TF-IDF、LSI的文本相似度算法在专利文献相似度计算中的实现,并对现有的TF-IDF、LSI的文本相似度算法的咨询矢量进行调整,减少了噪声信息的影响。
关键词
智能检索
文本相似度
jieba库
TF-IDF
LSI
SVD分解
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种教育舆情的爬虫程序设计
被引量:
4
7
作者
仇明
机构
江苏旅游职业学院
出处
《河北软件职业技术学院学报》
2021年第1期12-14,18,共4页
文摘
教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高教育质量和效果。在实际工作中尝试通过爬虫程序获取某市寄语市长网站中近三年的教育类留言,统计出群众留言中的高频词语并绘制词云,获得社会关注的热点教育问题,从而为教育教学改革提供依据和参考。
关键词
PYTHON
网络爬虫
jieba库
Wordcloud
库
Keywords
Python
crawler
jieba
Wordcloud
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
景区在线评论爬虫程序设计
8
作者
仇明
机构
江苏旅游职业学院
出处
《安徽电子信息职业技术学院学报》
2022年第6期19-24,共6页
文摘
利用Python语言构建网络爬虫,较为高效地获取旅游网站中游客关于景区的在线评论并进行分析,统计出其中的高频词语进而绘制词云图,从而发现游客对于相应景区较为关注的热点问题,使得景区能够针对这些热点问题做出相应的改进和提高,从而为旅游业服务质量的提升做出有益的探索和尝试。
关键词
PYTHON语言
在线评论
网络爬虫
jieba库
Keywords
Python language
online comments
web crawler
jieba
library
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Python的《水浒传》中人物分析
被引量:
3
9
作者
杨旭东
机构
重庆安全技术职业学院网络与信息安全系
出处
《网络安全技术与应用》
2019年第1期42-43,共2页
文摘
随着大数据技术的应用领域不断扩大,信息量也在日益膨胀,而有价值的信息是有限的,利用文本挖掘技术可以高效地获取长文本文献中的有价值信息,实现热点追踪。作为当前最流行的编程语言,Python能够快速而准确地进行词频统计、获取高频词,从而获得文献的主题思想。
关键词
PYTHON语言
jieba库
文本挖掘
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP312.2 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于字典和jieba库的“党的二十大报告”词频分析
谢光艺
《现代信息科技》
2023
1
下载PDF
职称材料
2
中文分词神器Jieba分词库的应用
江锐鹏
钟广玲
《电脑编程技巧与维护》
2023
2
下载PDF
职称材料
3
基于Python技术的《红楼梦》文本分析研究
唐明珍
李宝
《科技风》
2024
0
下载PDF
职称材料
4
基于Python的词云生成技术分析
唐婷
《科学技术创新》
2021
12
下载PDF
职称材料
5
基于网评文本的LDA游客目的地印象分析
张超群
郝小芳
王大睿
李晓翔
完颜兵
《现代计算机》
2022
0
下载PDF
职称材料
6
TF-IDF模型和LSI模型文本相似度算法的应用
马伟彬
《电子技术与软件工程》
2022
5
下载PDF
职称材料
7
一种教育舆情的爬虫程序设计
仇明
《河北软件职业技术学院学报》
2021
4
下载PDF
职称材料
8
景区在线评论爬虫程序设计
仇明
《安徽电子信息职业技术学院学报》
2022
0
下载PDF
职称材料
9
基于Python的《水浒传》中人物分析
杨旭东
《网络安全技术与应用》
2019
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部