期刊文献+

Web文本预处理技术探析 被引量:3

Explore and Analyse Web Text Processsing Technology
下载PDF
导出
摘要 文本预处理是Web数据挖掘的前提和关键,文中介绍了Web文本预处理的四个步骤,给出了TF-IDF权重计算和文本相似度计算的实现方法。 Web text processing is the premise and key of web data ming techlonogy .This paper introduces the four steps of web text preprocessing,the implementation methods of the TF-IDF weight calculation and text similarity computing are given.
作者 阳小兰 钱程 赵海廷 YANG Xiao-lan,QIAN Cheng,ZHAO Hai-ting(College of Information Engineering,Wuhan University of Science and Technology Zhongnan Branch,Wuhan 430223,China)
出处 《电脑知识与技术(过刊)》 2010年第29期8247-8249,共3页 Computer Knowledge and Technology
关键词 文本预处理 分词 TF-IDF权重 文本表示 text processing word segmentation the TF-IDF weight text representation
  • 相关文献

同被引文献14

引证文献3

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部