摘要
论文提出了一种页面包装器自动生成的改进算法,在对两个HTML页面进行匹配生成页面包装器的过程中,该算法使用树型数据模型作为基础,比原算法具有更高的执行效率。
This paper presents an improved algorithm for the automatic generation of page wrapper.In the process of generating the wrapper from tow HTML pages,this algorithm uses the tree data model,and can run more efficiently.
出处
《计算机工程与应用》
CSCD
北大核心
2004年第22期113-115,122,共4页
Computer Engineering and Applications
关键词
WEB数据抽取
包装器
匹配算法
算法优化
Web data extraction,wrapper,match algorithm,algorithm optimization