期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于图模型的Web表格中视觉并列关系的研究
1
作者 李雯琴 谢志鹏 《小型微型计算机系统》 CSCD 北大核心 2014年第7期1567-1572,共6页
Web不仅包含海量文本信息,还包含大量表格数据.与自由格式的文本信息相比,Web表格所包含的信息更为精练并且结构化,便于数据挖掘.Web表格挖掘已成为一个热点研究问题.为挖掘Web表格的行列结构、背景、颜色、文本字体、字号等视觉信息所... Web不仅包含海量文本信息,还包含大量表格数据.与自由格式的文本信息相比,Web表格所包含的信息更为精练并且结构化,便于数据挖掘.Web表格挖掘已成为一个热点研究问题.为挖掘Web表格的行列结构、背景、颜色、文本字体、字号等视觉信息所蕴含的语义,一种图结构模型以及构造方法被提出.基于图模型,Web表格的视觉并列关系被形式化定义.一种自动抽取Web表格的视觉并列关系的算法被提出.实验表明所提取的视觉并列关系与语义相似度之间存在着显著的正相关性,Web表格视觉并列关系的提取将有助于其他语义分析工作. 展开更多
关键词 web表格挖掘 视觉要素 图模型 视觉并列关系
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部