期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
网页Pagelet的自动抽取方法
1
作者 朱明 李伟 《计算机应用》 CSCD 北大核心 2005年第11期2612-2614,共3页
W eb页面中除了所包含的数据外,往往还包含很多导航信息、广告等。针对W eb页面的特点,提出了DOM树比较算法,通过对多个页面进行比较,识别出主体内容。实验结果证明该方法是有效可行的。
关键词 WEB挖掘 信息获取 dom相似度 dom节点聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部