期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于特征树的Web碎片信息抽取算法 被引量:3
1
作者 向程冠 熊世桓 《兰州理工大学学报》 CAS 北大核心 2014年第1期104-107,共4页
为进一步解决Web碎片信息所特有的随意性给信息抽取带来的困难,通过对Web碎片信息DOM树的结构特征和Web碎片信息的文本特征(如时间、作者、信息等)进行研究,发现将两者相结合能有效地进行Web碎片信息抽取,提出一种基于特征树的Web碎片... 为进一步解决Web碎片信息所特有的随意性给信息抽取带来的困难,通过对Web碎片信息DOM树的结构特征和Web碎片信息的文本特征(如时间、作者、信息等)进行研究,发现将两者相结合能有效地进行Web碎片信息抽取,提出一种基于特征树的Web碎片信息抽取算法.以新浪微博、腾讯微博、搜狐微博等在内的100个信息分享平台作为实验对象,实验结果表明,该算法具有良好的性能,可以达到较高的召回率与查准率. 展开更多
关键词 web web碎片信息 DOM树 信息抽取 召回率
下载PDF
基于CSS视觉分块的Web碎片信息抽取算法
2
作者 向程冠 熊世桓 《计算机光盘软件与应用》 2013年第16期63-65,共3页
为进一步解决在半结构化的Web页面中抽取Web碎片信息的困难,针对Web页面设计的目的是给用户显示相关的信息,浏览器只是呈现的中间手段,在抽取Web碎片信息时应该"以人为本",从"人"的视觉效果出发,将Web页面按照CSS... 为进一步解决在半结构化的Web页面中抽取Web碎片信息的困难,针对Web页面设计的目的是给用户显示相关的信息,浏览器只是呈现的中间手段,在抽取Web碎片信息时应该"以人为本",从"人"的视觉效果出发,将Web页面按照CSS视觉效果进行分块,提出一种基于CSS视觉分块的Web碎片信息抽取算法。以随机输入的1000个Web碎片信息站点作为实验对象,实验结果表明,算法具有良好的性能,达到了较高的召回率与查准率。 展开更多
关键词 web web碎片信息 CSS 信息抽取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部