期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向排序的基于查询需求的查询聚类模型 被引量:2
1
作者 花贵春 张敏 +2 位作者 刘奕群 马少平 茹立云 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2407-2413,共7页
排序是信息检索中的一个重要的环节,当今已经提出百余种用于构建排序函数的特征,如何利用这些特征构建更有效的排序函数成为当今的一个热点问题,因此排序学习(learningtorank)作为信息检索与机器学习的交叉学科,越来越受到人们的重视.... 排序是信息检索中的一个重要的环节,当今已经提出百余种用于构建排序函数的特征,如何利用这些特征构建更有效的排序函数成为当今的一个热点问题,因此排序学习(learningtorank)作为信息检索与机器学习的交叉学科,越来越受到人们的重视.根据不同的原则,查询可以分为不同的类别.不同类别的查询,排序特征的重要性不同,在排序函数的构建过程中的权重也会不同.为所有的查询都采用统一的排序函数是不合理的.针对这一问题,首先对利用关键词匹配原则得到的查询特征进行分析,选择出适当的查询特征集合构建查询特征向量,然后基于查询特征向量之间的距离对查询进行聚类,并为每个聚类类别学习得到排序函数,最后为一个新来的查询选择最适合的排序函数对文档进行排序.实验结果显示,在经过查询特征选择的查询聚类基础上得到的排序函数,和在所有的查询类别上得到的排序函数,两者的性能具有可比性,甚至前者优于后者. 展开更多
关键词 查询聚类 关键词匹配 排序学习 查询需求 信息检索
下载PDF
基于内容和用户行为的查询聚类 被引量:4
2
作者 程舒杨 熊锦华 +1 位作者 公帅 程学旗 《中文信息学报》 CSCD 北大核心 2016年第2期121-127,共7页
现有方法没有有效利用查询文本特征、点击行为和session信息来挖掘用户的搜索意图,获取的查询特征对于多意图查询在不同意图下的区分度不足,对于多意图查询的相关查询聚类效果不佳。针对以上问题,该文提出了基于查询图信息的GPLSI模型,... 现有方法没有有效利用查询文本特征、点击行为和session信息来挖掘用户的搜索意图,获取的查询特征对于多意图查询在不同意图下的区分度不足,对于多意图查询的相关查询聚类效果不佳。针对以上问题,该文提出了基于查询图信息的GPLSI模型,并利用该模型学习所得的查询特征进行查询聚类。基于查询图信息的GPLSI模型利用查询的词语、点击和session共现现象,从查询的文本特征、点击行为和session信息等多个方面来模拟查询意图的产生和表现,学习查询在不同搜索意图上的概率分布。最后,实验结果验证了基于查询图信息的PLSI模型用于查询相似度计算和多意图查询聚类中的有效性。 展开更多
关键词 查询聚类 多意图查询 搜索意图
下载PDF
一种基于查询聚类的物化视图动态调整策略 被引量:5
3
作者 冯霞 张江 左海超 《北京邮电大学学报》 EI CAS CSCD 北大核心 2018年第4期16-22,共7页
为了提高数据仓库的查询响应性能,避免视图集频繁调整引发的"抖动性",提出了一种基于查询聚类的物化视图动态调整策略,运用关联规则挖掘方法计算属性字段相似性,进而计算查询语句相似性,并对一个查询周期内的查询语句集进行聚类,产生... 为了提高数据仓库的查询响应性能,避免视图集频繁调整引发的"抖动性",提出了一种基于查询聚类的物化视图动态调整策略,运用关联规则挖掘方法计算属性字段相似性,进而计算查询语句相似性,并对一个查询周期内的查询语句集进行聚类,产生候选视图集,根据效益模型计算候选视图的效益,再运用物化视图动态调整算法生成物化视图.在航空公司机票结算数据集上的实验结果表明,在单机环境和分布式环境下,较基准算法相比,所提出的方法均能显著提升数据仓库的查询响应性能,尤其是对高频查询语句的响应性能. 展开更多
关键词 数据仓库 物化视图集 动态选择 查询聚类 属性字段相似度
原文传递
基于潜在语义分析的Deep Web查询接口聚类研究 被引量:3
4
作者 强保华 李巍 +2 位作者 邹显春 汪天天 吴春明 《计算机科学》 CSCD 北大核心 2013年第11期228-230,247,共4页
集成查询接口的生成是Deep Web数据集成的重要组成环节。如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一。针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语... 集成查询接口的生成是Deep Web数据集成的重要组成环节。如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一。针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语义分析(LSA)的方法来发掘查询接口之间的语义关系,并给出了基于潜在语义分析的Deep Web查询接口聚类算法,最后采用UIUC的Web集成资源库提供的数据进行了实验。结果表明,潜在语义分析的方法提高了同一领域查询接口之间的相似度,明显改善了Deep Web查询接口聚类的质量。 展开更多
关键词 潜在语义分析 奇异值分解 DEEP Web 查询接口
下载PDF
流数据复杂聚类查询处理算法
5
作者 刘宇雷 秦小麟 +1 位作者 储网林 黄瑛 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第6期762-766,共5页
流数据上的连续查询,尤其连续聚类查询是流数据处理研究的难点。草图算法能够计算流数据上等值连接大小的高精度近似值,而直方图算法能够较精确地统计流数据的分布。本文结合这两种算法的优势,提出了一种能够高效处理流数据上复杂聚类... 流数据上的连续查询,尤其连续聚类查询是流数据处理研究的难点。草图算法能够计算流数据上等值连接大小的高精度近似值,而直方图算法能够较精确地统计流数据的分布。本文结合这两种算法的优势,提出了一种能够高效处理流数据上复杂聚类查询的算法。理论和实验结果表明,该算法具有较高的精度和较小的空间复杂度。 展开更多
关键词 流数据 连续查询 查询
下载PDF
Auto-expanded multi query examples technology in content-based image retrieval 被引量:1
6
作者 王小玲 谢康林 《Journal of Southeast University(English Edition)》 EI CAS 2005年第3期287-292,共6页
In order to narrow the semantic gap existing in content-based image retrieval (CBIR),a novel retrieval technology called auto-extended multi query examples (AMQE) is proposed.It expands the single one query image ... In order to narrow the semantic gap existing in content-based image retrieval (CBIR),a novel retrieval technology called auto-extended multi query examples (AMQE) is proposed.It expands the single one query image used in traditional image retrieval into multi query examples so as to include more image features related with semantics.Retrieving images for each of the multi query examples and integrating the retrieval results,more relevant images can be obtained.The property of the recall-precision curve of a general retrieval algorithm and the K-means clustering method are used to realize the expansion according to the distance of image features of the initially retrieved images.The experimental results demonstrate that the AMQE technology can greatly improve the recall and precision of the original algorithms. 展开更多
关键词 content-based image retrieval SEMANTIC multi query examples K-means clustering
下载PDF
MR-CLOPE: A Map Reduce based transactional clustering algorithm for DNS query log analysis 被引量:2
7
作者 李晔锋 乐嘉锦 +2 位作者 王梅 张滨 刘良旭 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第9期3485-3494,共10页
DNS(domain name system) query log analysis has been a popular research topic in recent years. CLOPE, the represented transactional clustering algorithm, could be readily used for DNS query log mining. However, the alg... DNS(domain name system) query log analysis has been a popular research topic in recent years. CLOPE, the represented transactional clustering algorithm, could be readily used for DNS query log mining. However, the algorithm is inefficient when processing large scale data. The MR-CLOPE algorithm is proposed, which is an extension and improvement on CLOPE based on Map Reduce. Different from the previous parallel clustering method, a two-stage Map Reduce implementation framework is proposed. Each of the stage is implemented by one kind Map Reduce task. In the first stage, the DNS query logs are divided into multiple splits and the CLOPE algorithm is executed on each split. The second stage usually tends to iterate many times to merge the small clusters into bigger satisfactory ones. In these two stages, a novel partition process is designed to randomly spread out original sub clusters, which will be moved and merged in the map phrase of the second phase according to the defined merge criteria. In such way, the advantage of the original CLOPE algorithm is kept and its disadvantages are dealt with in the proposed framework to achieve more excellent clustering performance. The experiment results show that MR-CLOPE is not only faster but also has better clustering quality on DNS query logs compared with CLOPE. 展开更多
关键词 DNS data mining MR-CLOPE algorithm transactional clustering algorithm Map Reduce framework
下载PDF
利用查询重构识别查询意图 被引量:6
8
作者 张晓娟 陆伟 《现代图书情报技术》 CSSCI 北大核心 2013年第1期8-14,共7页
基于AOL查询日志数据集,在不给定查询意图类目体系情况下,尝试利用查询重构来识别用户查询意图。主要探讨如何识别出能表达原查询用户意图的查询重构以及如何对识别的查询意图进行聚类两个问题。人工评测结果表明,该方法能够取得较好的... 基于AOL查询日志数据集,在不给定查询意图类目体系情况下,尝试利用查询重构来识别用户查询意图。主要探讨如何识别出能表达原查询用户意图的查询重构以及如何对识别的查询意图进行聚类两个问题。人工评测结果表明,该方法能够取得较好的实验效果。 展开更多
关键词 查询意图 查询重构 随机游走 查询意图
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部