期刊文献+
共找到193篇文章
< 1 2 10 >
每页显示 20 50 100
ISTC: A New Method for Clustering Search Results 被引量:2
1
作者 ZHANG Wei XU Baowen +1 位作者 ZHANG Weifeng XU Junling 《Wuhan University Journal of Natural Sciences》 CAS 2008年第4期501-504,共4页
A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phr... A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phrases, which improve the accuracy of clustering. Also, the equation to measure the in-dependence of a phrase is proposed in this paper. The new algorithm which improves suffix tree clustering algorithm (STC) is named as improved suffix tree clustering (ISTC). To validate the proposed algorithm, a prototype system is implemented and used to cluster several groups of web search results obtained from Google search engine. Experimental results show that the improved algorithm offers higher accuracy than traditional suffix tree clustering. 展开更多
关键词 Web search results clustering suffix tree term frequency-inverse document frequency (TFIDF) independence of phrases
下载PDF
Online Learning a Binary Classifier for Improving Google Image Search Results 被引量:1
2
作者 WAN Yu-Chai LIU Xia-Bi HAN Fei-Fei TONG Kun-Qi LIU Yu 《自动化学报》 EI CSCD 北大核心 2014年第8期1699-1708,共10页
关键词 搜索结果 在线学习 二元分类 贝叶斯分类器 算法框架 训练数据 图片 支持向量机
下载PDF
Search Result Diversification Based on Query Facets
3
作者 胡莎 窦志成 +1 位作者 王晓捷 文继荣 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第4期888-901,共14页
In search engines, different users may search for different information by issuing the same query. To satisfy more users with limited search results, search result diversification re-ranks the results to cover as many... In search engines, different users may search for different information by issuing the same query. To satisfy more users with limited search results, search result diversification re-ranks the results to cover as many user intents as possible. Most existing intent-aware diversification algorithms recognize user intents as subtopics, each of which is usually a word, a phrase, or a piece of description. In this paper, we leverage query facets to understand user intents in diversification, where each facet contains a group of words or phrases that explain an underlying intent of a query. We generate subtopics based on query facets and propose faceted diversification approaches. Experimental results on the public TREC 2009 dataset show that our faceted approaches outperform state-of-the-art diversification models. 展开更多
关键词 query intent query facet search result diversification
原文传递
RESEARCH ON OPTIMIZING THE MERGING RESULTS OF MULTIPLE INDEPENDENT RETRIEVAL SYSTEMS BY A DISCRETE PARTICLE SWARM OPTIMIZATION 被引量:1
4
作者 XieXingsheng ZhangGuoliang XiongYan 《Journal of Electronics(China)》 2012年第1期111-119,共9页
The result merging for multiple Independent Resource Retrieval Systems (IRRSs), which is a key component in developing a meta-search engine, is a difficult problem that still not effectively solved. Most of the existi... The result merging for multiple Independent Resource Retrieval Systems (IRRSs), which is a key component in developing a meta-search engine, is a difficult problem that still not effectively solved. Most of the existing result merging methods, usually suffered a great influence from the usefulness weight of different IRRS results and overlap rate among them. In this paper, we proposed a scheme that being capable of coalescing and optimizing a group of existing multi-sources-retrieval merging results effectively by Discrete Particle Swarm Optimization (DPSO). The experimental results show that the DPSO, not only can overall outperform all the other result merging algorithms it employed, but also has better adaptability in application for unnecessarily taking into account different IRRS's usefulness weight and their overlap rate with respect to a concrete query. Compared to other result merging algorithms it employed, the DPSO's recognition precision can increase nearly 24.6%, while the precision standard deviation for different queries can decrease about 68.3%. 展开更多
关键词 Multiple resource retrievals result merging Meta-search engine Discrete Particle Swarm Optimization (DPSO)
下载PDF
指纹库容量对指纹检索结果的影响
5
作者 韩文强 罗亚平 《刑事技术》 2024年第4期367-374,共8页
近年来,指纹库容量的快速增长导致指纹比对难度加大,尤其体现在检索结果中相似异源指纹对比中同源指纹的干扰上。为了探究不同指纹库容量对同源指纹与相似异源指纹出现情况的影响,本实验建立600万人级、1000万人级和1亿人级数据库,对箕... 近年来,指纹库容量的快速增长导致指纹比对难度加大,尤其体现在检索结果中相似异源指纹对比中同源指纹的干扰上。为了探究不同指纹库容量对同源指纹与相似异源指纹出现情况的影响,本实验建立600万人级、1000万人级和1亿人级数据库,对箕型纹三角区域各部分发起查询并讨论检索结果。结果显示:指纹库容量增长幅度越大,同源指纹出现率降低越明显,同时其排位显著降低,而相似异源指纹数量显著增加,当相似异源指纹排在同源指纹之前时,会对指纹鉴定人员造成干扰。此外,还发现特征点密度可以影响相似异源指纹的出现数量,特征点密度越大,特征组合的特定性越小,越容易产生相似异源指纹。本研究旨在增强大数据条件下指纹鉴定人员的风险意识。 展开更多
关键词 指纹自动识别系统 指纹库容量 同源指纹 相似异源指纹 检索结果
下载PDF
一种层次化的检索结果聚类方法 被引量:15
6
作者 张刚 刘悦 +1 位作者 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别... 检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高. 展开更多
关键词 信息检索 检索结果聚类 层次化聚类 文本聚类 聚类
下载PDF
基于ontology抽取优化初始选择的检索结果聚类 被引量:8
7
作者 陈毅恒 秦兵 +2 位作者 宋凡 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期166-170,156,共6页
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结... 本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高. 展开更多
关键词 检索结果聚类 ONTOLOGY 标签
下载PDF
基于Web服务的异构数据源统一检索研究 被引量:7
8
作者 吴泽彬 魏洁 +1 位作者 李蔚清 吴慧中 《计算机集成制造系统》 EI CSCD 北大核心 2007年第7期1444-1450,共7页
为使统一检索能够适应当前Internet和异构数据源的不断发展,基于目前流行的Web服务技术,设计了一个异构数据源统一检索框架,并针对检索服务分发和结果融合提出了检索服务统一模型、记录统一模型,以及相应的结果融合算法。结合可扩展标... 为使统一检索能够适应当前Internet和异构数据源的不断发展,基于目前流行的Web服务技术,设计了一个异构数据源统一检索框架,并针对检索服务分发和结果融合提出了检索服务统一模型、记录统一模型,以及相应的结果融合算法。结合可扩展标记语言,统一各数据源检索返回的异构数据记录,利用Web服务机制的完好封装性、规范性、松散耦合、高度集成能力等特点,实现异构数据源检索接口的透明集成。基于Web服务的异构数据源统一检索系统实现简单,时空性能好,可扩展性强,能兼顾各数据源的特点实现全局优化。 展开更多
关键词 WEB服务 异构 数据源 检索 结果融合
下载PDF
山东焦家金矿床深部成矿预测与找矿效果对比 被引量:10
9
作者 李德亭 孙之夫 +2 位作者 张锐 许道学 王兆军 《地质找矿论丛》 CAS CSCD 2002年第2期107-115,共9页
焦家金矿床是著名的构造破碎蚀变岩型金矿床 ,通过物化探研究 ,对深部成矿远景进行预测并布置了钻探工程 ,大致查明了矿床深部破碎蚀变带地质特征及含矿性 ;基本探明了矿体的规模、形态、产状及赋存部位、矿石的类型和结构构造等特征 ,... 焦家金矿床是著名的构造破碎蚀变岩型金矿床 ,通过物化探研究 ,对深部成矿远景进行预测并布置了钻探工程 ,大致查明了矿床深部破碎蚀变带地质特征及含矿性 ;基本探明了矿体的规模、形态、产状及赋存部位、矿石的类型和结构构造等特征 ,并合理地圈定了矿体。以深部原生晕建立了深部化探异常模式 ,指出了深部矿体矿头和近矿指示元素组合特点 ,从而为深部是否继续开展普查提供了依据。通过钻探工程验证 ,矿体及构造带的位置与物探结果比较吻合 。 展开更多
关键词 焦家金矿床 深部成矿预测 找矿效果 山东省
下载PDF
元搜索引擎结果合成算法 被引量:5
10
作者 李红梅 丁振国 +1 位作者 周水生 周利华 《北京邮电大学学报》 EI CAS CSCD 北大核心 2008年第5期78-81,共4页
提出了一种基于文本/位置分析和群决策的查询结果合成算法.在充分考虑搜索结果文本信息的基础上,提出了查询匹配度的概念,并对搜索结果的标题和短文摘进行相关度分析。通过将文本分析与规范化的搜索结果排序值相结合来计算文档的相关分... 提出了一种基于文本/位置分析和群决策的查询结果合成算法.在充分考虑搜索结果文本信息的基础上,提出了查询匹配度的概念,并对搜索结果的标题和短文摘进行相关度分析。通过将文本分析与规范化的搜索结果排序值相结合来计算文档的相关分值.在估计非相关文档的相关分值时.对不同假设条件分别进行了讨论,并提出了改进的影子文档算法.然后,采用基于群决策的合成方法对相关分值进行合并,实现搜索结果的一致性排序.实验结果表明,采用该算法搜索结果的相关性明显优于Round-robin、CombSum和CombMNZ 3种合成算法. 展开更多
关键词 元搜索 信息检索 搜索结果合成 文本分析
下载PDF
基于潜在语义索引和自组织映射网的检索结果聚类方法 被引量:4
11
作者 陈毅恒 秦兵 +2 位作者 刘挺 王平 李生 《计算机研究与发展》 EI CSCD 北大核心 2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检... 随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高. 展开更多
关键词 检索结果聚类 潜在语义索引 自组织映射网 标签 边界划分
下载PDF
一种元搜索引擎的查询结果处理模型 被引量:10
12
作者 张强弓 喻国宝 +1 位作者 廖湖声 隋树林 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期47-51,57,共6页
为克服元搜索引擎查询速度慢、独立性差的缺点,设计了一个元搜索引擎的结果处理模型.在该模型中引入了一种4级结果集的结构,从而提高了元搜索引擎结果处理的效率.在结果提取部分提出了根据反馈信息自动调整权重的算法(FBWM),从而能够在... 为克服元搜索引擎查询速度慢、独立性差的缺点,设计了一个元搜索引擎的结果处理模型.在该模型中引入了一种4级结果集的结构,从而提高了元搜索引擎结果处理的效率.在结果提取部分提出了根据反馈信息自动调整权重的算法(FBWM),从而能够在没有人工干预的情况下自动监视各独立搜索引擎的性能变化,并随之动态调整其权重.在结果排序部分提出了改进的位置/全文排序法(IPFTS),在算法中引入了词条匹配等级的概念,提高了搜索结果和查询串的相关度的精度,保证了排名在前的搜索结果中链接地址的有效性. 展开更多
关键词 元搜索引擎 结果处理 FBWM算法 IPFTS算法 词条匹配等级
下载PDF
SCI数据库中地址信息著录差异与错误分析 被引量:4
13
作者 丁海德 庞芳芳 李德成 《现代情报》 北大核心 2008年第4期173-174,177,共3页
SCI地址信息著录存在的差异与错误易产生论文被漏检和误检,影响着本单位SCI论文检索结果的准确性和全面性。文章通过对青岛科技大学2005-2006年SCI论文中地址信息著录中出现的差异与错误现象,进行了揭示、归纳,列举了署名作者单位为&qu... SCI地址信息著录存在的差异与错误易产生论文被漏检和误检,影响着本单位SCI论文检索结果的准确性和全面性。文章通过对青岛科技大学2005-2006年SCI论文中地址信息著录中出现的差异与错误现象,进行了揭示、归纳,列举了署名作者单位为"单边"论文时,SCI地址信息著录中存在的单位名称被"张冠李戴",以及作者单位为"双边"合作论文时,存在的单位署名被"颠倒位次"的实例,分析了产生的原因,提出了相应的防范措施。 展开更多
关键词 SCI 数据库 地址著录 检索结果 青岛科技大学
下载PDF
专业搜索引擎搜索结果融合算法研究 被引量:3
14
作者 郝伟 杨国霞 郝志杰 《河北科技大学学报》 CAS 北大核心 2011年第4期355-358,390,共5页
为了提高专业搜索引擎的查询精度,提出了一种基于PageRank算法的改进搜索结果融合算法。首先,通过对元搜索引擎技术的分析,将rtf算法和PageRank算法进行融合,提出了基于PageRank算法的改进算法。该算法可以实现基于同义词、近义词的查询... 为了提高专业搜索引擎的查询精度,提出了一种基于PageRank算法的改进搜索结果融合算法。首先,通过对元搜索引擎技术的分析,将rtf算法和PageRank算法进行融合,提出了基于PageRank算法的改进算法。该算法可以实现基于同义词、近义词的查询,将这种改进的算法在煤地质学专业搜索引擎上进行使用,实验结果表明,采用该修改后的排序算法,从一定程度上能够把独立搜索引擎的搜索结果有机地融合在一起,进一步提高了专业搜索引擎的查准率和查全率。 展开更多
关键词 元搜索 专业搜索 结果融合 PAGERANK算法 煤地质学
下载PDF
元搜索引擎中基于用户兴趣的查询结果合成研究 被引量:8
15
作者 徐科 崔志明 郑冬冬 《微电子学与计算机》 CSCD 北大核心 2006年第7期199-201,共3页
元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量,也大大提高了用户检索的代价。针对这一问题,文章提出了基于用户兴趣的结果... 元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量,也大大提高了用户检索的代价。针对这一问题,文章提出了基于用户兴趣的结果合成算法。它根据用户兴趣对结果进行相似度计算和结果去重,从而为用户提供贴切的查询结果。实验表明,该算法提高了用户的检索效率和质量。 展开更多
关键词 个性化 元搜索引擎 查询结果合成 用户兴趣
下载PDF
中文Google和百度的排序方式与检索效率比较分析 被引量:10
16
作者 谈大军 林明茵 叶赛 《现代情报》 北大核心 2005年第3期87-89,92,共4页
中文Google和百度是大陆网民最常使用的两个中文搜索引擎,因此对其检索效率的比较分析就显得格外重要。而检索结果的排序是影响检索效率的关键因素,因为根据统计很多网络用户只有耐心看检索结果的前5页。本文在概括介绍目前搜索引擎采... 中文Google和百度是大陆网民最常使用的两个中文搜索引擎,因此对其检索效率的比较分析就显得格外重要。而检索结果的排序是影响检索效率的关键因素,因为根据统计很多网络用户只有耐心看检索结果的前5页。本文在概括介绍目前搜索引擎采用的三种结果排序规则地点和频率法、人气质量定律、自信心定律的基础上,比较分析了中文Google和百度的排序技术。最后笔者通过检索实践得出结论,中文Google和百度各有所长,但是在检索效率上尤其是检索结果的有效性上,中文Goole比百度要好。 展开更多
关键词 信息检索 搜索引擎 排序技术 中文Google 百度 检索效率
下载PDF
基于Word2Vec模型特征扩展的Web搜索结果聚类性能的改进 被引量:5
17
作者 杨楠 李亚平 《计算机应用》 CSCD 北大核心 2019年第6期1701-1706,共6页
对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类... 对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类性能下降。一个有效的方法就是通过一个外部的知识库对短文本进行扩展。受到基于神经网络词表示方法的启发,提出了通过词嵌入技术的Word2Vec模型对短文本扩展,即采用Word2Vec模型的TopN个最相似的单词用于对片段(snippet)的扩展,扩展文档使得TF-IDF模型特征选择得到聚类性能的提高。同时考虑到通用性单词造成的噪声引入,对扩展文档的TF-IDF矩阵进行了词频权重修正。实验在两个公开数据集ODP239和SearchSnippets上完成,将所提方法和纯snippet无扩展的方法、基于Wordnet的特征扩展方法和基于Wikipedia的特征扩展方法进行了对比。实验结果表明,所提方法在聚类性能方面优于对比方法。 展开更多
关键词 特征扩展 片段 词嵌入技术 搜索结果聚类
下载PDF
基于模糊概念格的Web搜索结果聚类算法 被引量:6
18
作者 黄健斌 姬红兵 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2005年第6期856-860,共5页
提出了一种模糊形式概念分析方法,给出了在对象和属性的模糊二元关系上生成模糊概念格的过程.提出了一种在格的拓扑序列上进行概念聚类的快速算法,并且定义了概念聚类间基于偏序的层次关系.该方法利用格理论解决了概念聚类中概念间的多... 提出了一种模糊形式概念分析方法,给出了在对象和属性的模糊二元关系上生成模糊概念格的过程.提出了一种在格的拓扑序列上进行概念聚类的快速算法,并且定义了概念聚类间基于偏序的层次关系.该方法利用格理论解决了概念聚类中概念间的多重继承关系,应用在W eb搜索结果聚类上,实验结果表明算法在聚类质量和检索性能上都有改进和提高. 展开更多
关键词 模糊概念格 概念聚类 Web搜索结果聚类
下载PDF
跨设备搜索引擎结果页面注意力分布研究——基于眼动视觉数据的实证分析 被引量:8
19
作者 梁少博 吴丹 +1 位作者 董晶 唐源 《图书情报知识》 CSSCI 北大核心 2018年第1期27-35,15,共10页
用户在搜索引擎结果页面的视觉注视行为,一直是信息检索领域的重要研究内容,有助于优化搜索引擎结果页面(Serach Engine Result Page,SERP)的布局,提升用户搜索效率。而针对用户在跨设备搜索情境下的SERP注视行为的研究还较少。本研究... 用户在搜索引擎结果页面的视觉注视行为,一直是信息检索领域的重要研究内容,有助于优化搜索引擎结果页面(Serach Engine Result Page,SERP)的布局,提升用户搜索效率。而针对用户在跨设备搜索情境下的SERP注视行为的研究还较少。本研究通过跨设备搜索实验,对用户在不同跨设备情境下的SERP视觉行为分布展开研究。研究发现,用户在跨设备后,其视觉注意力相比之前有所分散,关注点减少。跨设备后,用户的"眼动熵"值在SERP的搜索结果列表中,呈现出总体上升的趋势。用户在跨设备后对SERP首屏的搜索结果区域内搜索结果摘要的关注度最高,对于记录跨设备历史信息的区域关注度提升最高,这说明搜索引擎为用户提供的跨设备历史信息能够有效地帮助用户恢复搜索任务,提高用户的搜索效率。在单条搜索结果区域内,跨设备前后用户的视觉分布不存在显著性差异。 展开更多
关键词 跨设备搜索 搜索行为 眼动追踪 用户研究 搜索引擎结果页面
下载PDF
国内外管理科学与工程研究热点的比较分析 被引量:38
20
作者 佘丛国 席酉民 《科学学研究》 CSSCI 北大核心 2002年第4期406-410,共5页
本文以管理科学与工程学科代码为基础 ,以 1990~ 2 0 0 0年各领域发表文章的关键词检索统计为依据 ,通过对检索到的文献的阅读与比较 ,回顾了 2 0世纪最后十年国内外管理科学与工程研究的现状和特征 ,对国内外研究的热点问题进行了比... 本文以管理科学与工程学科代码为基础 ,以 1990~ 2 0 0 0年各领域发表文章的关键词检索统计为依据 ,通过对检索到的文献的阅读与比较 ,回顾了 2 0世纪最后十年国内外管理科学与工程研究的现状和特征 ,对国内外研究的热点问题进行了比较分析 ,并重点就热点问题的形成、热点问题内容的异同等方面进行了研究 ,得出了有意义的结论。它将对我国 2 1世纪初管理科学与工程研究主体及资助主体活动有一定的指导作用。 展开更多
关键词 管理科学与工程 研究热点 比较分析
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部