摘要
随着互联网时代的发展,大数据的应用范围越来越广,同时用户可获取的信息量也越来越大,而大部分数据类型都是以txt文本格式出现的。那么如何对大量的文本数据的信息进行管理和组织,并且准确地提取出其中关键和精华部分就成了一个辄待解决的问题。利用Python编程语言就可以对文本进行分词处理,重新组织信息内容,获取高频词汇,过滤边缘内容,同时将结果做可视化处理以词云形式展示,减少用户获取文本主旨的时间。
出处
《科学技术创新》
2020年第28期144-145,共2页
Scientific and Technological Innovation