-
题名基于WebLech的内容搜索引擎设计
- 1
-
-
作者
戴明星
杜彦辉
-
机构
中国人民公安大学信息安全工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第9期278-280,共3页
-
基金
公安部2005年应用创新计划基金资助项目
-
文摘
网络蜘蛛WebLech是一种优秀的Web站点下载开源工具。该文分析WebLech的特点和工作流程,完善WebLech的起始地址设置,并丰富其链接和所获取的网页类型。使用改进后的WebLech设计了一款能在用户设置的IP范围内进行搜索的基于内容的搜索引擎。
-
关键词
weblech开源软件
网络蜘蛛
搜索引擎
-
Keywords
weblech open source software
Web spider
search engine
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名Web教学资源信息抽取技术研究
被引量:2
- 2
-
-
作者
罗文
韩永国
-
机构
西南科技大学计算机应用与技术学院
-
出处
《微计算机信息》
2009年第30期188-189,198,共3页
-
文摘
针对网上以HTML形式发布的教学资源共享性不高,提出了一种新的信息抽取模式,首先用WebLech从资料的文档头部抓取指定的信息,并生成一个规范的HTML文档,然后用GRDDL进行信息抽取并进行格式转化,并写入RDF一种结构化形式存在的资源,便于数据共享,并设计和实现了该方法的原型系统。
-
关键词
WEB信息抽取
WEB
Lech
GRDDL
XSLT
-
Keywords
Web information extraction
weblech
GRDDL
XSLT
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-