期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于视觉特征的主题型网页信息抽取
1
作者 胡瑞 郭星 黄永聪 《赤峰学院学报(自然科学版)》 2016年第6期23-25,共3页
互联网高速发展的多年积累,如今web已经成为我们每一个普通人日常的一部分.Web绝对是世界上最大的信息数据库.同时每一个web页面中也包含这个目标信息以外的各种广告链接.称之为噪声.如何有效的过滤噪声,提取想要的目标内容已经成为一... 互联网高速发展的多年积累,如今web已经成为我们每一个普通人日常的一部分.Web绝对是世界上最大的信息数据库.同时每一个web页面中也包含这个目标信息以外的各种广告链接.称之为噪声.如何有效的过滤噪声,提取想要的目标内容已经成为一个实用且重要的研究领域.传统的方法大多都是基于DOM树及网页源代码的.这里在基于网页视觉特征分块算法VIPS的基础上,通过观察归纳网页目标内容和噪声的视觉特征来进行噪声过滤和目标内容提取.并提出了基于噪声和目标内容的视觉特征区别算法NGFV(Based on noise and goal content visual feature algorithm). 展开更多
关键词 VIPS ngfv 噪声过滤 DOM树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部