期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于页面Block的Web信息提取方法 被引量:3
1
作者 蒙韧 邵延振 袁鼎荣 《计算机技术与发展》 2010年第1期197-200,共4页
基于页面结构的信息提取是Web数据挖掘中三大研究领域之一。该研究的关键技术是如何识别Web页面的组织形式,从中挖掘所需要的页面信息。文中基于页面的语义分块(Block)给出一个新的块主题提取算法,与传统的以页面为单位的Web信息提取相... 基于页面结构的信息提取是Web数据挖掘中三大研究领域之一。该研究的关键技术是如何识别Web页面的组织形式,从中挖掘所需要的页面信息。文中基于页面的语义分块(Block)给出一个新的块主题提取算法,与传统的以页面为单位的Web信息提取相比,更符合实际情况,粒度优势明显。该算法针对页面中不同分块的重要性给予不同的权值,依据权值大小取舍页面信息提供给用户。针对该算法进行了模拟实验,从实验结果可以看出该算法具有一定的实用性和有效性。 展开更多
关键词 语义block block权值 block主题提取 WEB信息挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部