-
题名基于本体增量学习的主题爬行
- 1
-
-
作者
王鑫
王英
-
机构
长春工程学院软件职业技术学院
吉林大学计算机科学与技术学院
-
出处
《长春工程学院学报(自然科学版)》
2010年第4期81-85,共5页
-
基金
国家自然科学基金(60973040)
国家教育部高等学校博士学科点专项科研基金(200801830021)
-
文摘
在面向领域的信息搜索中,本体作为相关的领域知识往往有助于改善搜索效果,在信息检索中被广泛应用。基于本体增量学习的主题爬行技术的研究工作主要包括:首先,利用本体对领域概念及关系的描述作为网页主题判定的依据;其次,在爬行过程中,将学习得到的新概念和关系加入到本体中,以丰富完善领域本体,进而提高主题爬虫的收获率;最后,经过大量的实验数据分析,在词条提取准确率、收获率和响应速度等多个指标方面,证明了所提出的方法是可行的并且是高效的。
-
关键词
主题爬虫
本体增量学习
概念树
SF-CF模型
准术语窗口提取模型
-
Keywords
focused crawler
incremental ontology learning
concept tree
SF-CF model
quasi-term window extraction model
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-