摘要
在分析网络商品信息特点的基础上,改进现有的Web信息提取技术,设计一种基于元搜索技术的网络商品信息提取模型,实现对搜索范围的自动确定、网页搜索、以及商品信息的自动抽取。通过大量商品信息的搜索测试,在抓取范围的自动确定和商品信息的自动抽取上取得了很好的效果。
We improve the existing web information extraction technology base on the analysis of the network commodity information features,and design a metasearch technology-based network commodity information extraction model. It achieves the automatic determination of the search range,webpage search and automatic extraction of the network commodity information. Through search test on a large number of commodity information,the model shows good effects in automatic determination of the capture range and automatic extraction of commodity information.
出处
《计算机应用与软件》
CSCD
北大核心
2014年第4期98-101,168,共5页
Computer Applications and Software
关键词
WEB信息抽取
元搜索
提取模型
Web information extraction Metasearch Extraction model