摘要
Web表格的定位作为Web表格抽取的一个重要研究内容,现在越来越得到更多人的重视。根据Web表格的结构标记和自定义的启发式规则,通过对〈TABLE〉嵌套问题的解决、数据表格完整性的判断、〈TABLE〉树的遍历来完成表格的定位。
Web table positioning technology is considered as essential components of Web table information extraction, and more and more people pay attention to them. This paper realized table positioning according to Web table structure label and heuristic method rules of user-definition, which includes the solution of (TABLE) nesting problem, the determination of table data's integrality, and traversal of (TABLE) tree.
出处
《计算机科学》
CSCD
北大核心
2009年第9期227-230,共4页
Computer Science
基金
国家自然科学基金(60575035)
上海市重点学科建设项目(J50103)资助