摘要
本文利用xml和java的httpclient技术及正则表,通过对网络中视频信息的列表抓取,列表页面分析获得视频的名称、图片地址、视频播放页地址、视频播放页连接地址、标签和视频流地址,充分挖掘网络视频资源,节省存储空间和带宽;其次,通过抓取分析视频信息的rss文件,获取其新增的内容扩大自己视频资源,定时抓取他人主页,分析视频信息获取焦点的视频内容,以减少编辑成本;最后运用lucene搜索引擎框架,把获取的信息建成索引库,为客户提供强大搜索功能。
出处
《海峡科学》
2007年第7期63-65,69,共4页
Straits Science