-
题名页面包装器自动生成的改进算法
被引量:3
- 1
-
-
作者
李文奇
张忠能
-
机构
上海交通大学计算机科学与工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第22期113-115,122,共4页
-
文摘
论文提出了一种页面包装器自动生成的改进算法,在对两个HTML页面进行匹配生成页面包装器的过程中,该算法使用树型数据模型作为基础,比原算法具有更高的执行效率。
-
关键词
web数据抽取
包装器
匹配算法
算法优化
-
Keywords
web data extraction,wrapper,match algorithm,algorithm optimization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于树结构的包装器全自动生成方法的研究
被引量:1
- 2
-
-
作者
李亚桥
王晓东
李智
-
机构
中国民航大学交通工程学院
河北工业大学继续教育学院
河北工业大学计算机科学与软件学院
-
出处
《河北工业大学学报》
CAS
2007年第6期41-46,共6页
-
文摘
论文研究并实现了一种包装器全自动生成算法,使用两个页面的树形结构,从对比两棵树之间的相同与差异发现模式,从树结构中结点的不匹配之处推导出包装器.在实际HTML页面上的实验已经证明,这种方法能够更好的发现可选结构和迭代结构.
-
关键词
web数据抽取
包装器
树结构
匹配算法
自动
-
Keywords
web data extraction
wrapper
tree structure
match algorithm
automatic
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-