-
题名网站简约本体垂直搜索系统的设计与实现
被引量:2
- 1
-
-
作者
杨和平
陈瑜
张志强
-
机构
国家气象信息中心资料服务室
中国农业科学院植物保护研究所
列日大学生物技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第19期257-264,共8页
-
基金
公益性行业(气象)科研专项(重大专项)(No.GYHY(QX)20150600-7)
第五届青年科技基金(No.NMICQJ201604)
-
文摘
针对单个网站构建本体库垂直搜索引擎的过程中,叙词及其间逻辑关系等收集整理所耗人力成本高,导致该技术框架虽成熟,而大多网站搜索功能仍以字符匹配为主,缺乏分词、查询扩展及结果的相关度排序,很难准确命中相关查询内容等问题,设计并开发了一套基于网站简约本体库的垂直搜索系统。该系统以中国气象数据网(http://data.cma.cn)为例,利用protégé根据网站的导航目录,构建了中国气象数据网的本体库,基于Lucene引擎构建技术框架,对本体库中的对象及网页内容分别进行分词,并构建本体对象索引库及网页索引库;前端对查询内容分词后,先在本体对象索引库中进行扩展,利用TF-IDF相关度算法计算扩展结果的相关度并排序,该值作为各扩展本体对象的权值,并将各自的权值动态赋给利用Jena二次语义分析技术扩展的对象,最后将所有带有权值的关键词在网页索引库中查询检索,计算结果相关度并排序。实验结果表明,该系统构建简便,能为用户扩展、推荐相关查询内容,提高了针对网站检索的查准率及查全率。
-
关键词
本体库
垂直搜索引擎
语义扩展
中国气象数据网
-
Keywords
ontology
vertical search engine
semantic expansion
China Meteorological Data Service Center(CMDC)
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-