摘要
随着大数据、云计算及人工智能技术的爆发式发展,Python这类面向对象的解释型计算机程序设计语言已迅速成为数据科学语言发展的中流砥柱。Python爬虫、数据挖掘技术将庞大而又无序的数据转化为结构化数据,便于大数据的分析与处理。数据整合后利用可视化技术输出,完成整个数据的处理流程,使数据真正成为有价值的资产。本文利用Python对钱钟书先生的《围城》一书进行文本数据分析及词云生成,词云可根据场合和趣味性需求运用mask效果生成轮廓图,也可根据需要利用.generate( )方法和.fit_word( )方法分别生成文本轮廓图和词频轮廓图。通过词云生成可使读者快速攫取关键词、高频词,迅速掌握文本的中心思想,真正实现数据可视化。
出处
《中小学电教(综合)》
2023年第1期149-151,共3页
Primary and Middle School Educational Technology
基金
无锡市教育科学“十四五”规划课题“核心素养视角下高中PythonPBL课程构建”(青年专项)(课题编号:I/C-c/2021/05)。