期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
集成概念空间与潜在语义索引的文本聚类检索研究 被引量:2
1
作者 韩毅 张克菊 金碧辉 《情报理论与实践》 CSSCI 北大核心 2009年第6期102-105,共4页
信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方... 信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方法、同义词近义词处理方法及基准向量的生成方法,分析了网络条件下基于概念空间的文本分类、聚类检索基本机制,最后给出了完善概念空间的自学习机制。 展开更多
关键词 概念空间 潜在语义索引 文本检索 聚类检索
下载PDF
实现分类主题一体化的自动聚类检索系统
2
作者 苏丽珍 《情报理论与实践》 CSSCI 北大核心 1990年第4期26-28,共3页
运用文献自动聚类的原理,阐述了实现分类主题一体化的方法、步骤;论证了在文献自动聚类检索系统中,分类体系和主题体系能够和谐地融为一体;并提出了优化该检索体系的有关措施。
关键词 主题 一体化 聚类检索
下载PDF
基于模糊聚类分析的数据检索的应用 被引量:11
3
作者 潘玉奇 周劲 +1 位作者 杨秀丽 袁宁 《微电子学与计算机》 CSCD 北大核心 2005年第6期167-169,172,共4页
为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类... 为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类中心和查询数据的相似程度来进行聚类检索。 展开更多
关键词 模糊分析 相似度 中心 聚类检索
下载PDF
聚类检索述评 被引量:4
4
作者 马丽萍 《图书情报工作》 CSSCI 北大核心 2006年第7期122-124,共3页
介绍聚类和聚类检索的概念以及聚类检索在数据库与Web上的应用现状,对聚类检索目前存在的问题,如聚类效果不突出、用户无法参与聚类过程等进行分析,认为将聚类检索作为数据库或搜索引擎的一种检索功能,是对信息的一种增值性开发利用,会... 介绍聚类和聚类检索的概念以及聚类检索在数据库与Web上的应用现状,对聚类检索目前存在的问题,如聚类效果不突出、用户无法参与聚类过程等进行分析,认为将聚类检索作为数据库或搜索引擎的一种检索功能,是对信息的一种增值性开发利用,会更加完善检索系统;提出聚类检索应基于个性化用户模式来发展,要将聚类结果可视化,设置允许用户参与操作的检索界面等建议,以期将聚类功能向个性化、智能化方向推进,更好地满足用户检索需求。 展开更多
关键词 聚类检索 数据库 搜索引擎 开发利用 个性化用户 智能化
原文传递
基于聚类技术的学科信息检索服务
5
作者 李洁 陈围 谭立地 《江西科学》 2012年第3期396-399,共4页
学科信息检索是高等院校、科研院所图书馆信息资源服务保障的重点,关系到学科发展的基础。从学科信息检索服务的需求特点出发,分析了常用检索技术和方法在学科信息服务方面的不足,研究论述了专题数据聚类检索在学科服务中的应用价值、... 学科信息检索是高等院校、科研院所图书馆信息资源服务保障的重点,关系到学科发展的基础。从学科信息检索服务的需求特点出发,分析了常用检索技术和方法在学科信息服务方面的不足,研究论述了专题数据聚类检索在学科服务中的应用价值、实现方法、系统构成以及发展方向。 展开更多
关键词 学科服务 聚类检索 信息检索 信息服务
下载PDF
基于聚类的模型数据集可视化与检索 被引量:5
6
作者 石源 莫蓉 +2 位作者 常智勇 张欣 汪伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第11期1918-1924,共7页
为解决模型数据集可视化的问题,提出一种基于聚类结果的簇代表模型可视化方案.首先以等距特征映射算法作为模型特征数据的降维方法,将高维特征数据降至三维,并以该三维数据作为簇代表模型的空间位置坐标;然后采用粒子群优化算法得到模... 为解决模型数据集可视化的问题,提出一种基于聚类结果的簇代表模型可视化方案.首先以等距特征映射算法作为模型特征数据的降维方法,将高维特征数据降至三维,并以该三维数据作为簇代表模型的空间位置坐标;然后采用粒子群优化算法得到模型簇的几何中值点,以距几何中值点最近的模型作为该模型簇的代表模型;最后结合模型的对齐方法来确定簇代表模型的姿态,从而实现模型数据集的可视化.另外,根据查询模型与簇代表模型之间的相似性,提出一个基于聚类结果的模型检索流程.该检索流程首先寻找与查询模型最相似的簇代表模型,然后将查询范围限制在这些簇代表模型对应的模型簇中,从而减少备选模型的数量.检索实验结果表明,在合适的参数组合下,该检索流程可以在保证检索精度的同时大幅提高检索效率. 展开更多
关键词 模型数据集可视化 等距特征映射 基于检索
下载PDF
基于ontology抽取优化初始选择的检索结果聚类 被引量:8
7
作者 陈毅恒 秦兵 +2 位作者 宋凡 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期166-170,156,共6页
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结... 本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高. 展开更多
关键词 检索结果 ONTOLOGY 标签
下载PDF
一种层次化的检索结果聚类方法 被引量:15
8
作者 张刚 刘悦 +1 位作者 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别... 检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高. 展开更多
关键词 信息检索 检索结果 层次化 文本
下载PDF
面向信息检索的快速聚类算法 被引量:12
9
作者 刘铭 刘秉权 刘远超 《计算机研究与发展》 EI CSCD 北大核心 2013年第7期1452-1463,共12页
随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别... 随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确;同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理. 展开更多
关键词 信息检索技术 权值调整 极大极小理论 快速 自组织映射
下载PDF
基于主题模型的检索结果聚类应用研究 被引量:14
10
作者 阮光册 夏磊 《情报杂志》 CSSCI 北大核心 2017年第3期179-184,共6页
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语... [目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。 展开更多
关键词 LDA 检索结果 标签 概率分布 语义挖掘 K-MEANS
下载PDF
基于潜在语义索引和自组织映射网的检索结果聚类方法 被引量:4
11
作者 陈毅恒 秦兵 +2 位作者 刘挺 王平 李生 《计算机研究与发展》 EI CSCD 北大核心 2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检... 随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高. 展开更多
关键词 检索结果 潜在语义索引 自组织映射网 标签 边界划分
下载PDF
基于XML的检索结果聚类方法 被引量:5
12
作者 余宏 万常选 《计算机工程》 CAS CSCD 北大核心 2010年第1期85-86,90,共3页
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传... 针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传统方法。 展开更多
关键词 XML检索结果 结构语义相似度 内容相似度 算法
下载PDF
基于检索结果聚类的XML伪相关文档查找 被引量:1
13
作者 钟敏娟 万常选 +1 位作者 刘德喜 廖述梅 《计算机科学》 CSCD 北大核心 2013年第10期172-177,共6页
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML... 传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。 展开更多
关键词 信息检索 XML伪相关反馈 XML检索结果 簇标签 排序模型
下载PDF
改进后缀树的中文检索结果聚类研究 被引量:1
14
作者 袁津生 荣元媛 《计算机工程与应用》 CSCD 2014年第21期143-146,共4页
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、... 检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、词长、词性和位置几项约束条件计算各节点词语得分;合并基类取得分高的节点词作标签。实验结果显示该方法的聚类簇纯度较高,提取的标签准确且区分性较强,方便用户使用。 展开更多
关键词 检索结果 后缀树 标签 中文检索
下载PDF
基于模糊聚类的多元异构网络数据快速检索方法 被引量:1
15
作者 石碧瑶 《信息与电脑》 2022年第13期68-70,共3页
多元异构网络数据具有复杂性高、异构性强以及多样性的特点,使得其在海量多元异构网络数据中很难实现目标数据的快速检索,因此提出了一种基于模糊聚类的多元异构网络数据快速检索方法。通过设计模糊聚类函数模型确定聚类中心,求解模糊... 多元异构网络数据具有复杂性高、异构性强以及多样性的特点,使得其在海量多元异构网络数据中很难实现目标数据的快速检索,因此提出了一种基于模糊聚类的多元异构网络数据快速检索方法。通过设计模糊聚类函数模型确定聚类中心,求解模糊聚类的最优解,避免算法陷入局部最优,实现多元异构网络数据的聚类检索,以期为多元异构网络数据检索提供参考与借鉴。 展开更多
关键词 模糊 多元异构数据 聚类检索 快速检索
下载PDF
聚类检索和分类检索的关系
16
作者 姜希强 《情报资料工作》 CSSCI 北大核心 1989年第4期35-36,34,共3页
关键词 聚类检索 检索 检索
原文传递
网络检索结果聚类研究综述 被引量:2
17
作者 柏晗 成颖 柯青 《情报理论与实践》 CSSCI 北大核心 2015年第10期138-144,共7页
网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优... 网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优化聚类数K以及生成重叠聚类等;后者的改进主要有优化类计分运算、优化类合并运算、数据结构优化、候选标签选择以及基于语义的优化等。在对相关研究进行综述的基础上探讨了检索结果聚类面临的问题和未来的发展方向。 展开更多
关键词 检索结果 检索算法 优化 综述
下载PDF
基于后缀树的Web检索结果聚类标签生成方法 被引量:9
18
作者 骆雄武 万小军 +1 位作者 杨建武 吴於茜 《中文信息学报》 CSCD 北大核心 2009年第2期83-88,共6页
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之... 对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。 展开更多
关键词 计算机应用 中文信息处理 检索结果 标签生成 后缀树
下载PDF
QLA-Means:检索结果聚类方法 被引量:1
19
作者 邓茹仁 伍应环 《计算机工程与设计》 北大核心 2017年第4期1067-1070,1080,共5页
针对搜索引擎检索大规模数据时结果聚类的性能有限问题,提出一种查询日志辅助的改进K-Means算法。将传统的K-Means聚类扩展为多层次聚类的形式,实现检索对象与检索结果之间的聚类;通过引入检索日志,辅助提升聚类的效果,实现检索结果推... 针对搜索引擎检索大规模数据时结果聚类的性能有限问题,提出一种查询日志辅助的改进K-Means算法。将传统的K-Means聚类扩展为多层次聚类的形式,实现检索对象与检索结果之间的聚类;通过引入检索日志,辅助提升聚类的效果,实现检索结果推送的高相关性。实现结果表明,基于该算法的检索结果聚类,有着较高的准确率,检索过程的时间开销较低,综合效率与准确率而言,该算法是一种理想的检索结果聚类方法。 展开更多
关键词 K均值 检索结果 查询日志 多层 标签契合度
下载PDF
一种快速网页检索结果聚类策略 被引量:1
20
作者 高镔 《计算机工程与应用》 CSCD 北大核心 2011年第12期110-112,121,共4页
在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始... 在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用K-means算法聚类标题和摘要取得比较合理的聚类结果。由于标题一般都比较短,可以大大减少HAC算法的运行时间。这样既满足网络检索对时间的要求又可以得到较好的聚类结果。 展开更多
关键词 网页检索结果 层次 两阶段
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部