期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
双服务器模型下支持相关度排序的多关键字密文搜索方案 被引量:1
1
作者 李宇溪 周福才 +1 位作者 徐剑 徐紫枫 《计算机研究与发展》 EI CSCD 北大核心 2018年第10期2149-2163,共15页
围绕当前云存储环境中用户数据机密性以及可用性的问题,对多关键字密文搜索方案展开研究,提出双服务器模型下支持相关度排序的多关键字密文搜索方案(multi-keyword encrypted search with relevance ranking,MES-RR),在能够保证高效地... 围绕当前云存储环境中用户数据机密性以及可用性的问题,对多关键字密文搜索方案展开研究,提出双服务器模型下支持相关度排序的多关键字密文搜索方案(multi-keyword encrypted search with relevance ranking,MES-RR),在能够保证高效地实现多关键字密文搜索的同时,实现对于搜索结果的排序.方案基于TF-IDF加权技术并融合Paillier同态加密体制,构建关键字相关度安全索引,优化计算代价并降低了存储复杂度;设计双服务器模型架构,引入安全可信的协同处理机制来构造安全排序协议,实现对于搜索结果的高效排序.在安全性方面,在诚实与好奇的威胁场景下构建方案的安全模型,并对安全性进行严格分析,结果表明方案能够在随机预言模型下抵抗自适应性选择关键字攻击,具有IND-CKA2安全性.性能分析表明:该方案用户生成q个关键字搜索令牌仅需要常数级时间O(q),而且仅需和服务器进行1次交互即可得到搜索结果,与以往的支持排序的多关键字密文搜索方案相比,该方案大大降低了计算代价和访问交互次数,适用于实际的云存储环境. 展开更多
关键词 密文搜索 相关度排序 双服务器 同态加密 自适应性选择关键字攻击
下载PDF
图书馆发现系统功能及相关度排序评价研究 被引量:5
2
作者 刘艳民 魏清华 《情报科学》 CSSCI 北大核心 2015年第3期90-94,共5页
介绍图书馆发现服务系统的产生背景、工作原理,从元数据及功能架构检索方面对Primo、Summon、EDS三大发现系统进行整体性能评估,提出运用评价模型指标MAP&MRR对图书馆发现服务系统采用的相关度排序算法进行评价,以对图书馆选取资源... 介绍图书馆发现服务系统的产生背景、工作原理,从元数据及功能架构检索方面对Primo、Summon、EDS三大发现系统进行整体性能评估,提出运用评价模型指标MAP&MRR对图书馆发现服务系统采用的相关度排序算法进行评价,以对图书馆选取资源发现系统起到指导帮助作用。 展开更多
关键词 发现系统 性能评估 相关度排序 元数据
原文传递
基于Lucene的地名数据库快速检索系统 被引量:20
3
作者 张文元 周世宇 谈国新 《计算机应用研究》 CSCD 北大核心 2017年第6期1756-1761,共6页
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器... 针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。 展开更多
关键词 LUCENE 地名 全文检索 数据库 中文分词 相关度排序
下载PDF
基于Web的DCI垂直搜索引擎的研究与设计 被引量:7
4
作者 吴洁明 冀单单 韩云辉 《计算机工程与设计》 CSCD 北大核心 2013年第4期1481-1487,共7页
为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎。首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据... 为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎。首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据采集和正文信息抽取,并将抽取的数据保存到本地;然后基于Lucene的全文检索工具包,对本地数据进行分词、倒排索引、索引检索和改进的相关度排序等处理,最终设计实现了一个通用可扩展的DCI垂直搜索引擎。实验结果表明,该搜索引擎在很大程度上提高了网页信息抽取的准确度和数据的检索效率。 展开更多
关键词 数据采集 倒排索引 垂直搜索引擎 信息抽取 相关度排序
下载PDF
基于Lucene的数字作品搜索引擎的研究与设计 被引量:10
5
作者 吴洁明 韩云辉 冀单单 《计算机工程与科学》 CSCD 北大核心 2013年第5期166-172,共7页
在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的... 在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的搜索引擎,为用户提供对海量数字作品信息的快速、准确的搜索服务。实验分析比较了分词速度和分词效果,还比较了关键词搜索结果的响应时间、命中数量、准确率和召回率。实验结果表明,本系统在很大程度上提高了搜索速度,保证了搜索结果的准确性。 展开更多
关键词 LUCENE 分词算法 索引 相关度排序算法 分布式
下载PDF
PHP+MYSQL环境下的中文分词技术研究 被引量:1
6
作者 徐殿军 崔宝华 《辽宁师范大学学报(自然科学版)》 CAS 北大核心 2008年第1期57-59,共3页
要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP+MYSQL环... 要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP+MYSQL环境下实现传统分词的实现过程.并在此基础上引入了字典的概念,因其在分词之前已提前调入内存,从而大大提高了分词的效率和准确性.在PHP+MYSQL环境下为中文的分词过程实现提供了良好的平台基础,丰富的PHP函数为实现精确的分词提供了语言和语法的支持,MYSQL轻型数据库为字典提供快速的存取. 展开更多
关键词 全文检索 中文分词 相关度排序 PHP MYSQL
下载PDF
一种基于概念抽取的元搜索引擎
7
作者 张选平 袁明轩 +2 位作者 蒋宇 马琮 梁平 《微电子学与计算机》 CSCD 北大核心 2006年第3期156-159,共4页
文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供... 文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供了概念图这种独特的结果显示方式,引导用户细化搜索范围以得到更为精确的结果。 展开更多
关键词 元搜索引擎 概念抽取 相关度排序
下载PDF
万维网信息检索系统开发技术 被引量:7
8
作者 张开舟 张惠惠 《情报学报》 CSSCI 北大核心 2002年第1期42-47,共6页
当前搜索引擎技术有很大的局限性 ,本文首先分析了当前搜索引擎的若干缺陷 ,然后深入探讨在检索服务器端的若干处理技术 ,包括了Robot技术、索引技术、数据库技术、检索技术和相关度排序技术 ,同时还介绍了智能浏览器和智能体等客户端技... 当前搜索引擎技术有很大的局限性 ,本文首先分析了当前搜索引擎的若干缺陷 ,然后深入探讨在检索服务器端的若干处理技术 ,包括了Robot技术、索引技术、数据库技术、检索技术和相关度排序技术 ,同时还介绍了智能浏览器和智能体等客户端技术 ; 展开更多
关键词 万维网 ROBOT 索引 数据库 相关度排序 智能浏览器 智能体 信息检索系统 系统开发技术 服务器端技术 搜索引擎
下载PDF
微课管理系统站内搜索增强研究与实现
9
作者 叶文全 《数字技术与应用》 2017年第10期35-36,共2页
本文结合分词搜索、相关度排序、自定义分页,并使用存储过程实现搜索。在搜索的准确性、相关度、性能、安全等方面都有较大的改良,较好的解决了微课管理系统的站内搜索难题。
关键词 微课 分词搜索 相关度排序 存储过程
下载PDF
S系统联合Patentics在测量领域的检索应用 被引量:1
10
作者 聂林 宋婉甜 陶颖 《中国发明与专利》 2018年第A01期88-92,共5页
测量领域相关案件存在IPC分类号分布广泛、关键词难以表达的问题,分类号通常对应IPC分类中的G部、B部、E部等,机械部件关键词表达多种多样,难以准确表达。检索中若不对分类号和关键词扩展,则会导致漏检,若对分类号和关键词盲目扩展,则... 测量领域相关案件存在IPC分类号分布广泛、关键词难以表达的问题,分类号通常对应IPC分类中的G部、B部、E部等,机械部件关键词表达多种多样,难以准确表达。检索中若不对分类号和关键词扩展,则会导致漏检,若对分类号和关键词盲目扩展,则会出现大量噪声,使得对比文件淹没在上千篇检索结果中,给对比文件筛选造成巨大困难。S系统具有丰富的检索方式,但检索结果需要人为逐篇筛选;而Patentics具有相关度排序的功能,本文联合S系统和Patentics,将S系统的检索结果导入Patentics中排序,有效避免了漏检,同时提高了对比文件筛选效能。 展开更多
关键词 Patentics S系统 检索 相关度排序 效率
下载PDF
浅析Google Patent Search在专利文献检索中的应用 被引量:1
11
作者 胡璇 徐盛辉 《中国发明与专利》 2017年第2期108-112,共5页
本文通过三个实际案例得出利用Google Patent Search检索的一般策略,针对具体案情和初步检索结果需要动态调整检索策略,利用Google Patent Search强大的相关度排序功能、"追踪"功能快速获得对比文件。
关键词 GOOGLE PATENT SEARCH 相关度排序 追踪
下载PDF
面向期刊论文的搜索技术的研究与设计 被引量:4
12
作者 郭峰 韩云凤 《信息技术》 2018年第8期59-65,共7页
为了解决期刊论文的大量存储、PDF文本解析、无法快速准确搜索等问题,文章首先使用HDFS分布式系统存储大量期刊论文,其次采用PDF抽取技术将非纯文本格式的PDF期刊转换为纯文本格式,然后分析比较主流中文分词器,最后采用倒排索引、分布... 为了解决期刊论文的大量存储、PDF文本解析、无法快速准确搜索等问题,文章首先使用HDFS分布式系统存储大量期刊论文,其次采用PDF抽取技术将非纯文本格式的PDF期刊转换为纯文本格式,然后分析比较主流中文分词器,最后采用倒排索引、分布式索引和优化相关度排序算法等,分析并设计了一个面向期刊论文的搜索引擎。实验结果表明,本文有效的解决大量论文的存储和访问,缩短建立索引时间,提高了搜索结果的准确性。 展开更多
关键词 HDFS 信息抽取 倒排索引 分布式索引 相关度排序算法
下载PDF
基于Bayes网络的信息检索研究
13
作者 唐坚波 《电脑知识与技术(过刊)》 2010年第15期4122-4124,共3页
信息检索技术广泛的应用与社会的各个领域,为提高信息检索的普及率和效率,首先,通过对用户检索语言进行结构化,然后,采用扩展的Bayes网络模型,提出一种结构化检索策略,它有效改善了检索的查准率,提高用户的满意度。
关键词 信息检索 结构化 BAYES网络 相关度排序 查准率
下载PDF
WebGIS搜索引擎系统研究与实现
14
作者 芦淑娟 《软件导刊》 2007年第3期82-84,共3页
通过设计一个完整的基于WebGIS的搜索引擎系统,研究了中文处理技术在不同领域中的应用。该系统实现了中文分词、中文校正和结果排序等搜索引擎的关键技术。
关键词 搜索引擎 中文分词 相关度排序 汉字校对
下载PDF
一种用户军事信息需求分析挖掘方法
15
作者 戴礼灿 《信息与电脑》 2017年第10期172-175,共4页
针对军事领域用户个性化信息需求分析缺乏有效工程化技术支撑问题,笔者提出了一种通过数据驱动的用户军事信息需求分析挖掘方法。该方法借助门户系统采集用户相关的文本关联数据,然后学习回归模型对关联数据进行筛选过滤,最后建立需求... 针对军事领域用户个性化信息需求分析缺乏有效工程化技术支撑问题,笔者提出了一种通过数据驱动的用户军事信息需求分析挖掘方法。该方法借助门户系统采集用户相关的文本关联数据,然后学习回归模型对关联数据进行筛选过滤,最后建立需求概率模型对需求相关度进行排序。该方法支持开放的需求词典,同时能够有效应对噪声数据干扰。搭建的演示验证系统实验结果证明了提出方法的实用性和有效性。 展开更多
关键词 需求挖掘 门户交互 需求概率模型 相关度排序
下载PDF
企业内网项目档案检索方法的优化
16
作者 王建永 《电子技术与软件工程》 2017年第19期158-158,共1页
现阶段,计算机技术应用在各行各业,企业项目档案也全部转换为电子版,并构建企业内网档案检索系统方便管理。当前的企业内网项目档案检索方法存在效率低、准确率低的问题,已经无法满足企业使用要求。为此,提出一种基于计量算法的企业内... 现阶段,计算机技术应用在各行各业,企业项目档案也全部转换为电子版,并构建企业内网档案检索系统方便管理。当前的企业内网项目档案检索方法存在效率低、准确率低的问题,已经无法满足企业使用要求。为此,提出一种基于计量算法的企业内网项目档案检索优化方法。该检索方法通过计量算法算法对档案数据进行分类处理,强化了信息查询环节,加强了检索的智能程度,提高检索效率,为档案检索技术发展提供借鉴作用。 展开更多
关键词 企业项目档案 数据 B/S模式 相关度排序算法
下载PDF
上海光源PDM全文检索系统的改进
17
作者 李玖栋 邓辉宇 《核技术》 CAS CSCD 北大核心 2011年第10期721-725,共5页
上海光源的产品数据管理(PDM)原有的全文检索系统是一个基于数据库的检索系统,该系统在检全率、检准率以及相关度排序上均存在着不足。通过修改中文分词算法和细化相关度排序算法等手段对该系统进行改进,提高了系统的性能。测试结果表... 上海光源的产品数据管理(PDM)原有的全文检索系统是一个基于数据库的检索系统,该系统在检全率、检准率以及相关度排序上均存在着不足。通过修改中文分词算法和细化相关度排序算法等手段对该系统进行改进,提高了系统的性能。测试结果表明检全率和检准率均得以提高,满足了上海光源对图文档管理的需求。 展开更多
关键词 产品数据管理(PDM) 全文检索 中文分词 相关度排序
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部