期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种新的HTML页面清洗压缩算法 被引量:1
1
作者 任仲晟 《福建电脑》 2009年第1期60-61,共2页
本文提出了一种新的适用于Web信息抽取的HTML页面清洗压缩算法。该算法充分利用了HTML页面树中各标签的相对位置信息。实验表明,该算法能够有效地处理页面中的语法错误,并实现对页面冗余数据的压缩,具有良好的实用价值和应用前景。
关键词 html页面清洗 html页面压缩 预处理 信息抽取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部