期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于分块重要性模型与Xpath的Web信息抽取的研究
1
作者 庞秋奔 顾平 杨小梅 《计算机与现代化》 2009年第8期73-75,79,共4页
网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析。结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过... 网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析。结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过程,并给出形式化描述与实验结果,结果表明该方法适合于抽取多记录型的网页。 展开更多
关键词 网页分块 块重要性权重 XPATH web信息抽取
下载PDF
基于页面分块模型的PageRank算法研究 被引量:4
2
作者 白似雪 刘华斌 《南昌大学学报(工科版)》 CAS 2008年第2期179-183,共5页
提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及... 提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及其改进算法相比,该算法以基于视觉特征的页面分块算法为核心,更好地反映了网页的特性,符合了用户的使用习惯,具有良好的效果。 展开更多
关键词 PAGERANK 页面分块重要性模型 链接分析 主题漂移 支持向量机
下载PDF
面向导航型网页关键词自动抽取的视觉模型与算法
3
作者 彭浩 蔡美玲 +2 位作者 陈继锋 刘炽 余炳锐 《计算机应用》 CSCD 北大核心 2012年第8期2360-2363,2368,共5页
导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区... 导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区域;然后,依据人类视觉特点,对各区域进行视觉"奇异性"量化,同时利用奇异性传递规则进一步强化关键词相关区域的视觉"奇异性"。P-KEA根据PIX-PAGE模型模型的视觉量化结果,能够较准确地找到视觉突出区域中的关键词。实验结果表明,与基于DocView模型的算法DVM相比,P-KEA的准确率平均提高了20.9%。 展开更多
关键词 区域合并 视觉量化 网页表示模型 关键词自动抽取
下载PDF
利用分块重要度进行中文网页分类的研究
4
作者 段昕 马军 宋玲 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期1-4,共4页
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网... 由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法. 展开更多
关键词 网页分割 块重要度 网页分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部