期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
Evaluating Relational Ranking Queries Involving both Text Attributes and Numeric Attributes
1
作者 Liang Zhu Zhaoliang Xie Qin Ma 《Journal of Software Engineering and Applications》 2012年第12期88-93,共6页
In many database applications, ranking queries may reference both text and numeric attributes, where the ranking functions are based on both semantic distances/similarities for text attributes and numeric distances fo... In many database applications, ranking queries may reference both text and numeric attributes, where the ranking functions are based on both semantic distances/similarities for text attributes and numeric distances for numeric attributes. In this paper, we propose a new method for evaluating such type of ranking queries over a relational database. By statistics and training, this method builds a mechanism that combines the semantic and numeric distances, and the mechanism can be used to balance the effects of text attributes and numeric attributes on matching a given query and tuples in database search. The basic idea of the method is to create an index based on WordNet to expand the tuple words semantically for text attributes and on the information of numeric attributes. The candidate results for a query are retrieved by the index and a simple SQL selection statement, and then top-N answers are obtained. The results of extensive experiments indicate that the performance of this new strategy is efficient and effective. 展开更多
关键词 RELATIONAL Database ranking query Semantic DISTANCE Numeric DISTANCE WORDNET
下载PDF
基于Manifold Ranking和结合前景背景特征的显著性检测 被引量:7
2
作者 朱征宇 汪梅 《计算机应用》 CSCD 北大核心 2016年第9期2560-2565,共6页
针对基于图和流形排序(Manifold Ranking)的显著性检测算法(MR算法)过度依赖边界节点的背景特征的问题,提出一种改进的结合前景背景特征的显著性检测算法。首先,对图像进行超像素分割,建立闭环图模型;然后利用流形排序算法根据图像前景... 针对基于图和流形排序(Manifold Ranking)的显著性检测算法(MR算法)过度依赖边界节点的背景特征的问题,提出一种改进的结合前景背景特征的显著性检测算法。首先,对图像进行超像素分割,建立闭环图模型;然后利用流形排序算法根据图像前景特征和背景特征分别得出前景种子和背景种子;再通过亮度和颜色特征对两类种子进行结合,筛选出更为准确的查询节点;最后再利用流形排序算法进行显著值计算,得到最终的显著图。实验表明,改进方法与MR算法相比在精确率、召回率、F值等多个评价指标上均有明显提升,得到的显著图更接近真值。 展开更多
关键词 显著性检测 流形排序 查询节点 显著图 显著区域
下载PDF
Top-K Query Framework in Wireless Sensor Networks for Smart Grid 被引量:2
3
作者 WANG Hui GUAN Zhitao +1 位作者 YANG Tingting XU Yue 《China Communications》 SCIE CSCD 2014年第6期89-98,共10页
The smart grid has caught great attentions in recent years, which is poised to transform a centralized, producer-controlled network to a decentralized, consumer- interactive network that's supported by fine-grained m... The smart grid has caught great attentions in recent years, which is poised to transform a centralized, producer-controlled network to a decentralized, consumer- interactive network that's supported by fine-grained monitoring. Large-scale WSNs (Wireless Sensor Networks) have been considered one of the very promising technologies to support the implementation of smart grid. WSNs are applied in almost every aspect of smart grid, including power generation, power transmission, power distribution, power utilization and power dispatch, and the data query processing of 'WSNs in power grid' become an hotspot issue due to the amount of data of power grid is very large and the requirement of response time is very high. To meet the demands, top-k query processing is a good choice, which performs the cooperative query by aggregating the database objects' degree of match for each different query predicate and returning the best k matching objects. In this paper, a framework that can effectively apply top-k query to wireless sensor network in smart grid is proposed, which is based on the cluster-topology sensor network. In the new method, local indices are used to optimize the necessary query routing and process intermediate results inside the cluster to cut down the data traffic, and the hierarchical join query is executed based on the local results.Besides, top-k query results are verified by the clean-up process, and two schemes are taken to deal with the problem of node's dynamicity, which further reduce communication cost. Case studies and experimental results show that our algorithm has outperformed the current existing one with higher quality results and better efficiently. 展开更多
关键词 smart grid wireless sensornetwork top-k query framework.
下载PDF
Probabilistic Top-k Query:Model and Application on Web Traffic Analysis 被引量:1
4
作者 Xiaolin Gui Jun Liu +2 位作者 Qiujian Lv Chao Dong Zhenming Lei 《China Communications》 SCIE CSCD 2016年第6期123-137,共15页
Top-k ranking of websites according to traffic volume is important for Internet Service Providers(ISPs) to understand network status and optimize network resources. However, the ranking result always has a big deviati... Top-k ranking of websites according to traffic volume is important for Internet Service Providers(ISPs) to understand network status and optimize network resources. However, the ranking result always has a big deviation with actual rank for the existence of unknown web traffic, which cannot be identified accurately under current techniques. In this paper, we introduce a novel method to approximate the actual rank. This method associates unknown web traffic with websites according to statistical probabilities. Then, we construct a probabilistic top-k query model to rank websites. We conduct several experiments by using real HTTP traffic traces collected from a commercial ISP covering an entire city in northern China. Experimental results show that the proposed techniques can reduce the deviation existing between the ground truth and the ranking results vastly. In addition, we find that the websites providing video service have higher ratio of unknown IP as well as higher ratio of unknown traffic than the websites providing text web page service. Specifically, we find that the top-3 video websites have more than 90% of unknown web traffic. All these findings are helpful for ISPs understanding network status and deploying Content Distributed Network(CDN). 展开更多
关键词 top-k query traffic model temporal bipartite graph uncertain data unknown traffic
下载PDF
SmartCrawler:A Three-Stage Ranking Based Web Crawler for Harvesting Hidden Web Sources
5
作者 Sawroop Kaur Aman Singh +2 位作者 G.Geetha Mehedi Masud Mohammed A.Alzain 《Computers, Materials & Continua》 SCIE EI 2021年第12期2933-2948,共16页
Web crawlers have evolved from performing a meagre task of collecting statistics,security testing,web indexing and numerous other examples.The size and dynamism of the web are making crawling an interesting and challe... Web crawlers have evolved from performing a meagre task of collecting statistics,security testing,web indexing and numerous other examples.The size and dynamism of the web are making crawling an interesting and challenging task.Researchers have tackled various issues and challenges related to web crawling.One such issue is efficiently discovering hidden web data.Web crawler’s inability to work with form-based data,lack of benchmarks and standards for both performance measures and datasets for evaluation of the web crawlers make it still an immature research domain.The applications like vertical portals and data integration require hidden web crawling.Most of the existing methods are based on returning top k matches that makes exhaustive crawling difficult.The documents which are ranked high will be returned multiple times.The low ranked documents have slim chances of being retrieved.Discovering the hidden web sources and ranking them based on relevance is a core component of hidden web crawlers.The problem of ranking bias,heuristic approach and saturation of ranking algorithm led to low coverage.This research represents an enhanced ranking algorithm based on the triplet formula for prioritizing hidden websites to increase the coverage of the hidden web crawler. 展开更多
关键词 Hidden web COVERAGE adaptive link ranking query selection depth crawling
下载PDF
不确定性Top-K查询处理 被引量:56
6
作者 李文凤 彭智勇 李德毅 《软件学报》 EI CSCD 北大核心 2012年第6期1542-1560,共19页
高效Top-K查询处理在涉及大量数据交互的应用中是一项重要技术,随着应用中不确定性数据的大量涌现,不确定性数据的管理逐渐引起人们的重视.不确定性数据上Top-K查询从语义和处理上都呈现出与传统Top-K查询不同的特点.在主流不确定性数... 高效Top-K查询处理在涉及大量数据交互的应用中是一项重要技术,随着应用中不确定性数据的大量涌现,不确定性数据的管理逐渐引起人们的重视.不确定性数据上Top-K查询从语义和处理上都呈现出与传统Top-K查询不同的特点.在主流不确定性数据模型和可能世界语义模型下,学者们已经提出了多种不确定性Top-K查询的语义和处理方法.介绍了当前不确定性Top-K查询的研究工作,并对其进行分类,讨论包括语义、排序标准、算法以及应用等方面的技术.最后提出不确定性Top-K查询面临的挑战和下一步的发展方向. 展开更多
关键词 Top—K查询语义 top-k查询处理 排序标准 不确定性数据 可能世界
下载PDF
不确定数据Top-k查询算法 被引量:6
7
作者 周帆 李树全 +1 位作者 肖春静 吴跃 《电子测量与仪器学报》 CSCD 2010年第7期650-657,共8页
不确定数据普遍存在于大量应用之中,如移动计算、RFID技术和传感器网络等。针对不确定数据的各种查询算法是数据库领域近年来的热点研究课题。其中,基于不确定数据的Top-k查询和排序查询提出了很多有价值的查询语义和查询算法。详细分... 不确定数据普遍存在于大量应用之中,如移动计算、RFID技术和传感器网络等。针对不确定数据的各种查询算法是数据库领域近年来的热点研究课题。其中,基于不确定数据的Top-k查询和排序查询提出了很多有价值的查询语义和查询算法。详细分析这一最新领域提出的各种查询算法、数据模型、算法复杂度和不同算法所适应的应用场景,并用实验从多个方面比较不同查询算法执行效率、查询语义以及结果集的关联程度。 展开更多
关键词 概率数据库 不确定top-k查询 排序查询 查询算法 数据处理
下载PDF
不确定数据库中概率top-k和排序查询算法 被引量:3
8
作者 周帆 李树全 +1 位作者 肖春静 吴跃 《计算机应用》 CSCD 北大核心 2010年第10期2605-2609,共5页
传感器网络等技术的广泛应用产生了大量不确定数据。近年来,对于不确定数据的处理和查询成为数据库和数据挖掘领域研究的热点。其中,传统关系数据库中的top-k查询和排序查询怎样拓展到不确定数据是其中的焦点之一。研究近年来提出的不... 传感器网络等技术的广泛应用产生了大量不确定数据。近年来,对于不确定数据的处理和查询成为数据库和数据挖掘领域研究的热点。其中,传统关系数据库中的top-k查询和排序查询怎样拓展到不确定数据是其中的焦点之一。研究近年来提出的不确定数据库上top-k查询和排序查询算法,归纳和比较目前各种不同查询算法所适应的语义世界和应用场景,并详细分析各种算法的执行效率和算法复杂度。另外,对于不确定数据top-k查询和排序查询所面临的挑战和可能的研究方向进行了总结。 展开更多
关键词 不确定数据库 top-k查询 排序查询 不确定性数据
下载PDF
基于位置-文本关系的空间对象top-k查询与排序方法 被引量:2
9
作者 孟祥福 张霄雁 +2 位作者 赵路路 李盼 毕崇春 《智能系统学报》 CSCD 北大核心 2020年第2期235-242,共8页
针对普通的空间关键字查询通常会导致多查询结果的问题。本文提出了一种基于空间对象位置-文本相关度的top-k查询与排序方法,用于获取与给定空间关键字查询在文本上相关且位置上相近的典型空间对象。该方法分为离线处理和在线查询处理2... 针对普通的空间关键字查询通常会导致多查询结果的问题。本文提出了一种基于空间对象位置-文本相关度的top-k查询与排序方法,用于获取与给定空间关键字查询在文本上相关且位置上相近的典型空间对象。该方法分为离线处理和在线查询处理2个阶段。在离线阶段,根据空间对象之间的位置相近性和文本相似性,度量任意一对空间对象之间的位置-文本关系紧密度。在此基础上,提出了基于概率密度的代表性空间对象选取算法,根据空间对象之间的位置-文本关系为每个代表性空间对象构建相应的空间对象序列。在线查询处理阶段,对于一个给定的空间关键字查询,利用Cosine相似度评估方法计算查询条件与代表性空间对象之间的相关度,然后使用阈值算法(threshold algorithm,TA)在预先创建的空间对象序列上快速选出top-k个满足查询需求的典型空间对象。实验结果表明:提出的空间对象top-k查询与排序方法能够有效地满足用户查询需求,并且具有较高的准确性、典型性和执行效率。 展开更多
关键词 空间数据库 空间关键字查询 位置-文本关系 概率密度 代表性对象选取 top-k查询与排序
下载PDF
不确定数据Top-K查询技术研究
10
作者 黄玲玲 杨剀 《智能计算机与应用》 2017年第1期35-37,42,共4页
高效的Top-K查询处理是不确定数据管理的一项重要技术。从确定性算法技术和近似算法技术两方面研究典型的不确定数据的Top-K查询算法,分析概率与分值的平衡方式,介绍统一化排序思想以及综合多种查询特征的新型查询方式,最后提出不确定性... 高效的Top-K查询处理是不确定数据管理的一项重要技术。从确定性算法技术和近似算法技术两方面研究典型的不确定数据的Top-K查询算法,分析概率与分值的平衡方式,介绍统一化排序思想以及综合多种查询特征的新型查询方式,最后提出不确定性Top-K查询的研究方向及不确定性查询处理技术的研究热点。 展开更多
关键词 不确定性数据 top-k查询 确定算法技术 近似算法技术 排序函数 概率
下载PDF
基于Top-k查询算法的图书馆电子资源分类搜索方法 被引量:2
11
作者 富国瑞 《电子设计工程》 2021年第16期173-176,180,共5页
为在严格遵循分类查询规则的基础上,快速得到待查找的图书馆电子信息参量,提出基于Top-k查询算法的图书馆电子资源分类搜索方法。以分类模板作为底层查询模式,通过分析数据查询确定性的方式,得到准确的电子资源排名函数,实现基于Top-k... 为在严格遵循分类查询规则的基础上,快速得到待查找的图书馆电子信息参量,提出基于Top-k查询算法的图书馆电子资源分类搜索方法。以分类模板作为底层查询模式,通过分析数据查询确定性的方式,得到准确的电子资源排名函数,实现基于Top-k查询算法的电子资源特性分析。在此基础上,连接搜索服务器,借助信息索引模型,实现对分类节点的兴趣化代理处理,完成基于Top-k查询算法的图书馆电子资源分类搜索方法的顺利应用。对比实验结果表明,与传统CID引擎索引器相比,应用新型分类搜索方法后,电子信息参量的查询等待时间缩短至0.48 ms,而分类精准度却提升至90%,能够在满足Top-k查询规则的同时,实现对图书馆电子信息参量的快速查找。 展开更多
关键词 top-k查询算法 电子资源 分类搜索 排名函数 搜索器 索引模型
下载PDF
面向知识图谱问答的查询图选择模型研究
12
作者 贾永辉 陈文亮 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1925-1931,共7页
在基于查询图的知识图谱问答系统(KBQA)中,查询图选择旨在实现问句和候选查询图的语义匹配,从中选出最优查询图来生成答案.受限于问句(序列结构)和候选查询图(图结构)表示形式上的不统一,两者在进行语义匹配时经常存在编码结构复杂以及... 在基于查询图的知识图谱问答系统(KBQA)中,查询图选择旨在实现问句和候选查询图的语义匹配,从中选出最优查询图来生成答案.受限于问句(序列结构)和候选查询图(图结构)表示形式上的不统一,两者在进行语义匹配时经常存在编码结构复杂以及匹配效果差的问题.为了解决上述问题,提出一种基于序列匹配的查询图选择方法.具体地,首先将图结构的查询图转换为序列形式,使得语义匹配从图结构与序列结构的相似计算变成两个序列结构之间的相似计算,提高了匹配效果.在此基础上,通过考虑候选查询图集合的全局信息,提出一种新的查询图排序模型.与已往方法相比,所提方法一方面有效地对问句和查询图之间交互信息进行建模,另一方面引入候选查询图集合的全局信息,提升了查询图选择的性能.实验结果表明,所提方法在WebQuestions和ComplexQuestions两个常用KBQA数据集上的F1值分别达到了55.3和44.4. 展开更多
关键词 知识图谱问答 查询图排序 查询图生成 查询图选择 知识图谱
下载PDF
A Simple yet Effective Framework for Active Learning to Rank
13
作者 Qingzhong Wang Haifang Li +7 位作者 Haoyi Xiong Wen Wang Jiang Bian Yu Lu Shuaiqiang Wang Zhicong Cheng Dejing Dou Dawei Yin 《Machine Intelligence Research》 EI CSCD 2024年第1期169-183,共15页
While China has become the largest online market in the world with approximately 1 billion internet users,Baidu runs the world's largest Chinese search engine serving more than hundreds of millions of daily active... While China has become the largest online market in the world with approximately 1 billion internet users,Baidu runs the world's largest Chinese search engine serving more than hundreds of millions of daily active users and responding to billions of queries per day.To handle the diverse query requests from users at the web-scale,Baidu has made tremendous efforts in understanding users'queries,retrieving relevant content from a pool of trillions of webpages,and ranking the most relevant webpages on the top of the res-ults.Among the components used in Baidu search,learning to rank(LTR)plays a critical role and we need to timely label an extremely large number of queries together with relevant webpages to train and update the online LTR models.To reduce the costs and time con-sumption of query/webpage labelling,we study the problem of active learning to rank(active LTR)that selects unlabeled queries for an-notation and training in this work.Specifically,we first investigate the criterion-Ranking entropy(RE)characterizing the entropy of relevant webpages under a query produced by a sequence of online LTR models updated by different checkpoints,using a query-by-com-mittee(QBC)method.Then,we explore a new criterion namely prediction variances(PV)that measures the variance of prediction res-ults for all relevant webpages under a query.Our empirical studies find that RE may favor low-frequency queries from the pool for la-belling while PV prioritizes high-frequency queries more.Finally,we combine these two complementary criteria as the sample selection strategies for active learning.Extensive experiments with comparisons to baseline algorithms show that the proposed approach could train LTR models to achieve higher discounted cumulative gain(i.e.,the relative improvement DCG4=1.38%)with the same budgeted labellingefforts. 展开更多
关键词 SEARCH information retrieval learning to rank active learning query by committee
原文传递
基于语义相似度的数据库自适应查询松弛方法 被引量:17
14
作者 孟祥福 严丽 +2 位作者 马宗民 张富 王星 《计算机学报》 EI CSCD 北大核心 2011年第5期812-824,共13页
为了解决数据库空查询结果问题,提出了一种基于语义相似度的数据库自适应查询松弛方法.首先,基于初始查询条件和数据分布推测用户对查询指定属性的重视程度,据此提出了一种属性权重评估方法;然后,通过考察属性值的特征信息,分别提出了... 为了解决数据库空查询结果问题,提出了一种基于语义相似度的数据库自适应查询松弛方法.首先,基于初始查询条件和数据分布推测用户对查询指定属性的重视程度,据此提出了一种属性权重评估方法;然后,通过考察属性值的特征信息,分别提出了分类型属性值之间和数值型属性值之间的语义相似度评估方法;在此基础上,根据松弛阈值、属性权重和属性值之间的语义相似度,提出了一种自适应查询松弛重写算法.对于满足松弛查询的近似查询结果,按照它们对初始查询的满足度进行排序.实验结果表明,提出的属性权重和属性值之间的语义相似度评估方法性能稳定,评估结果合理,提出的查询松弛方法具有较高的查全率,能够较好地满足当前用户的需求和偏好. 展开更多
关键词 WEB数据库 查询松弛 属性权重 语义相似度 查询结果排序
下载PDF
云环境下一种隐私保护的高效密文排序查询方法 被引量:21
15
作者 程芳权 彭智勇 +2 位作者 宋伟 王书林 崔一辉 《计算机学报》 EI CSCD 北大核心 2012年第11期2215-2227,共13页
数据前端加密是保护云环境下外包数据隐私的一种有效手段,但却给数据查询等操作带来挑战.针对云环境下多数据拥有者数据外包及选择性访问授权特征,为支持大规模加密云数据上高效且隐私保护的用户个性化密文查询,文中提出了一种隐私保护... 数据前端加密是保护云环境下外包数据隐私的一种有效手段,但却给数据查询等操作带来挑战.针对云环境下多数据拥有者数据外包及选择性访问授权特征,为支持大规模加密云数据上高效且隐私保护的用户个性化密文查询,文中提出了一种隐私保护的高效密文排序查询方法RQED.通过设计无证书认证的PKES(支持关键词检索的公钥加密),并构建RQED框架来实现强隐私保护的密文查询.基于该框架,设计了更合理的多属性多关键词密文查询排序函数,并提出了基于层次动态布隆过滤器的RQED索引机制,提高密文查询时空效率.理论分析和实验性能对比证明:RQED在确保查询强隐私保护和高准确性的同时,具有较明显的时空效率优势. 展开更多
关键词 云计算 布隆过滤器 排序查询 层次索引 无证书认证
下载PDF
多查询相关的排序支持向量机融合算法 被引量:7
16
作者 王扬 黄亚楼 +3 位作者 谢茂强 刘杰 卢敏 廖振 《计算机研究与发展》 EI CSCD 北大核心 2011年第4期558-566,共9页
排序学习是目前信息检索与机器学习领域研究的热点问题.现有排序学习算法在学习时把训练样本集中的所有查询及其相关文档等同对待,忽视了查询之间的差异,影响了排序模型的性能.对查询之间的差异进行描述,并在训练过程中考虑这种差异,提... 排序学习是目前信息检索与机器学习领域研究的热点问题.现有排序学习算法在学习时把训练样本集中的所有查询及其相关文档等同对待,忽视了查询之间的差异,影响了排序模型的性能.对查询之间的差异进行描述,并在训练过程中考虑这种差异,提出一种基于有监督学习的融合多个与查询相关排序子模型的方法.该方法为每一个查询及其相关文档建立一个子排序模型,并将子排序模型的输出进行向量化表示,将多个查询相关的排序模型转化为体现查询差异的特征数据,实现多排序模型的集成.以排序支持向量机为例,在查询级和样本级建立新的损失函数作为优化目标,并利用此损失函数调节不同查询产生损失之间的权重,提出多查询相关的排序支持向量机融合算法.在文档检索和网页检索中的实验结果表明,使用多查询相关的排序支持向量机融合算法可以取得比传统排序学习模型更好的性能. 展开更多
关键词 信息检索 查询相关 排序学习 模型融合 排序支持向量机
下载PDF
一种基于领域知识的XML数据模糊查询 被引量:10
17
作者 孟祥福 张霄雁 +1 位作者 马宗民 彭晏飞 《智能系统学报》 北大核心 2012年第6期525-535,共11页
为了解决普通用户对XML数据的模糊查询问题,提出了一种基于领域知识的XML数据模糊查询方法.以模糊集理论为基础,首先介绍了XML数据模糊查询的构成形式;然后提出了将领域知识和模糊集的隶属函数相结合的方法实现XML数据的模糊查询条件转... 为了解决普通用户对XML数据的模糊查询问题,提出了一种基于领域知识的XML数据模糊查询方法.以模糊集理论为基础,首先介绍了XML数据模糊查询的构成形式;然后提出了将领域知识和模糊集的隶属函数相结合的方法实现XML数据的模糊查询条件转换,转换过程考虑了查询谓词的重要程度和用户偏好;最后按结果元素对模糊查询的满足程度对模糊查询结果进行排序.该方法无需改变传统的XML查询语言和XDBMS就能够实现模糊查询,从而提高了用户与系统之间的交互能力.实验结果表明,提出的模糊查询方法具有较高的查全率和准确率. 展开更多
关键词 XML 模糊查询 领域知识 用户偏好 排序
下载PDF
XML关键字查询处理研究 被引量:25
18
作者 周军锋 孟小峰 《计算机学报》 EI CSCD 北大核心 2012年第12期2459-2478,共20页
关键字查询作为一种有效的信息检索手段,一直以来都是XML数据管理领域研究的热点问题,每年均有大量最新研究成果出现在各种顶级会议和期刊上.针对众多国内外研究者在XML关键字查询领域所作出的创新性工作,该文以XML关键字查询处理系统... 关键字查询作为一种有效的信息检索手段,一直以来都是XML数据管理领域研究的热点问题,每年均有大量最新研究成果出现在各种顶级会议和期刊上.针对众多国内外研究者在XML关键字查询领域所作出的创新性工作,该文以XML关键字查询处理系统为框架来组织现有工作,重点分析和比较了查询生成、语义定义、排序机制、查询算法及结果展示等5个关键技术点所涉及的代表性工作的特点,并结合最新的应用需求从有效性和高效性的角度归纳出XML关键字查询技术后续研究面临的问题和挑战. 展开更多
关键词 可扩展标记语言 关键字查询 查询生成 查询语义 排序机制 结果展示
下载PDF
基于P2P的Wleb搜索技术 被引量:13
19
作者 方启明 杨广文 +1 位作者 武永卫 郑纬民 《软件学报》 EI CSCD 北大核心 2008年第10期2706-2719,共14页
Web搜索引擎已经成为人们从海量Web信息中快速找到所需信息的重要工具,随着Web数据量的爆炸性增长,传统的集中式搜索引擎已经越来越不能满足人们不断增长的信息获取需求.随着对等网络(peer-to-peer,简称P2P)技术的快速发展,人们提出了基... Web搜索引擎已经成为人们从海量Web信息中快速找到所需信息的重要工具,随着Web数据量的爆炸性增长,传统的集中式搜索引擎已经越来越不能满足人们不断增长的信息获取需求.随着对等网络(peer-to-peer,简称P2P)技术的快速发展,人们提出了基于P2P的Web搜索技术并迅速成为研究热点.研究的目的是对现有的基于P2P的Web搜索技术进行总结,以期为进一步研究指明方向.首先分析了基于P2P的Web搜索面临的诸多挑战;然后重点总结分析了基于P2P的Web搜索的各项关键技术的研究现状,包括系统拓扑结构、数据存放策略、查询路由机制、索引切分策略、数据集选择、相关性排序、网页收集方法等;最后对已有的3个较有特色的基于P2P的Web搜索原型系统进行了介绍. 展开更多
关键词 WEB搜索 对等网络 查询路由 索引切分 相关性排序
下载PDF
专利查询扩展的词向量方法研究 被引量:12
20
作者 许侃 林原 +2 位作者 曲忱 徐博 林鸿飞 《计算机科学与探索》 CSCD 北大核心 2018年第6期972-980,共9页
查询扩展技术被广泛地应用于信息检索系统中。为提高专利检索的结果,采用查询扩展方法进行优化,利用相关专利文本训练词向量,并选择与原始查询相似度高的候选词作为查询扩展词,加入原始查询中。提出4种方法运用词向量获取查询扩展词,并... 查询扩展技术被广泛地应用于信息检索系统中。为提高专利检索的结果,采用查询扩展方法进行优化,利用相关专利文本训练词向量,并选择与原始查询相似度高的候选词作为查询扩展词,加入原始查询中。提出4种方法运用词向量获取查询扩展词,并提出两种方法进行扩展词相关性排序,改进已有的查询扩展词选择方法。在TREC数据集上的实验显示,将词向量模型进行扩展词选择的方法与传统的TF-IDF扩展词选择方法相融合,可以有效提高查询扩展模型的性能,对于理解用户的查询意图有着很好的促进作用。 展开更多
关键词 信息检索 查询扩展 排序学习 专利检索
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部