期刊文献+

基于结构和属性特征的政府开放数据检索方法研究 被引量:12

Retrieval Method for Open Government Data Based on Structure and Attribute
下载PDF
导出
摘要 [目的/意义]排序是信息检索中的一个重要环节,其核心是如何利用特征构建更为有效的排序函数。目前已提出了多种文档、网页特征用于构建排序函数,但由于检索对象上的差异,针对非结构化信息检索对象的特征难以有效地为政府开放数据的检索排序进行服务。[方法/过程]针对这一问题,提出了一种基于结构和属性特征的政府开放数据检索方法,对政府开放数据检索对象的特点进行分析,设计出尽可能全面反映检索对象的特征,利用新特征学习排序函数,并构建二维偏移量的倒排索引对选择的特征进行索引。[结果/结论]实验结果显示,基于结构和属性特征的政府开放数据检索性能优于传统的本地检索方法。 [ Purpose/Significance ] Ranking is an essential part of information retrieve, and it is a hot research topic that how to use fea- tures to construct more efficient ranking functions. Nowadays there are a lot of features of documents and web pages for constructing rank- ing function, however, the searchable objects to the information retrieval and data retrieval are different, existing features can't be effec- tively applied to construct ranking function of the open government data retrieval. [ Method/Process~ In this paper, an open government data retrieval based on features of structure and attribute is proposed. Firstly, analyze the object features of data retrieval. Secondly, design features that can fully as possible to reflect the object of retrieval. And finally ranking functions are learned through new design features. [ Result/Contusion ] To achieve the algorithms, the inverted index are established, where offset is represented by two-dimensional coor- dinates, compared with traditional method. The experimental results show the feature rank model is more feasible than local rank model.
出处 《情报杂志》 CSSCI 北大核心 2017年第5期148-152,123,共6页 Journal of Intelligence
基金 国家社会科学基金项目"基于关联数据的政府数据开放研究"(编号:14BTQ009)研究成果之一
关键词 政府开放数据 数据检索 特征设计 特征排序 倒排索引 open government data; data retrieval ;feature design; feature rank ;Inverted index
  • 相关文献

参考文献8

二级参考文献98

  • 1刘静,尹存燕,陈家骏.一种规则和贝叶斯方法相结合的文本自动分类策略[J].计算机应用研究,2005,22(7):84-86. 被引量:7
  • 2赖茂生.知识组织理论与技术[M].北京:北京大学信息管理系(编印),1994..
  • 3-.因特网培训教程[M].宇航出版社,1997..
  • 4董小英.网络环境下的信息资源管理:博士学位论文[M].北京:北京大学,1997..
  • 5张建刚.因特网环境下的信息组织与检索技术:硕士学位论文[M].北京:北京大学,1998..
  • 6王芳.网络信息检索机制研究:硕士学位论文[M].四川联合大学,1998..
  • 7Dub K,Kirchhoff K.Learning to rank with partially-labeled data[C] //SIGIR 2008,2008:251-258.
  • 8Robertson S E.Overview of the okapi projects[J].Journal of Documentation,1997,53(1):3-7.
  • 9Crammer K,Singer Y.Pranking with ranking[C] //NIPS 2002,2002.
  • 10Herbrich R,Graepel T,Obermayer K.Large margin rank boundaries for ordinal regression[C] //Advances in Large Margin Classifiers,2000:115-132.

共引文献103

同被引文献190

引证文献12

二级引证文献41

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部