期刊文献+

基于词频统计的文本可视化实现 被引量:3

The Realization of Text Visualization Based on Word Frequency Statistics
下载PDF
导出
摘要 随着海量文本的涌现,信息超载和信息提取速度慢等问题促使了文本可视化技术的出现。文本可视化通过对文本资源的分析,提取信息,并以图形化方式呈现出来,为人们提供了一种快速获取文本关键信息的有效手段。在介绍了文本可视化的概念和重要性的基础上,着重阐述了基于词频统计的中文文本可视化的实现方法。基于某微博账户的微博数据,首先使用TF-IDF算法进行关键词提取,得到带有权重的词语,然后基于SVG技术和四叉树算法,实现了文本布局算法。最后得到的可视化效果良好,能全面、直观地反映出用户的兴趣和关注点。 Along with the emergence of massive text, the problem of information overload and the slow speed of information extraction prompted the emergence of text visualization. By analyzing the text, extracting the information and presenting it in a graphical way, text visualization provides an effective way to extract the key information of a text. After introduce the concept and importance of text visualization, emphatically expounds the realization of text visualization based on word frequency statistics. A micro-blog account's data is chosen as the source data. First, use the TF-IDF algorithm for keyword extraction, and get keywords with weight. Then, realize the text layout algorithm based on SVG and quad-tree algorithm. The visual effect is good, and it can fully and directly reflect the account's interests.
作者 朱巧
出处 《软件》 2016年第11期114-117,共4页 Software
关键词 文本可视化 关键词提取 四叉树算法 TF-IDF Text visualization Word frequency statistics Quad-tree algorithm TF-IDF
  • 相关文献

参考文献3

二级参考文献125

共引文献434

同被引文献36

引证文献3

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部