期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
31
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
集成概念空间与潜在语义索引的文本聚类检索研究
被引量:
2
1
作者
韩毅
张克菊
金碧辉
《情报理论与实践》
CSSCI
北大核心
2009年第6期102-105,共4页
信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方...
信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方法、同义词近义词处理方法及基准向量的生成方法,分析了网络条件下基于概念空间的文本分类、聚类检索基本机制,最后给出了完善概念空间的自学习机制。
展开更多
关键词
概念空间
潜在语义索引
文本
检索
聚类检索
下载PDF
职称材料
实现分类主题一体化的自动聚类检索系统
2
作者
苏丽珍
《情报理论与实践》
CSSCI
北大核心
1990年第4期26-28,共3页
运用文献自动聚类的原理,阐述了实现分类主题一体化的方法、步骤;论证了在文献自动聚类检索系统中,分类体系和主题体系能够和谐地融为一体;并提出了优化该检索体系的有关措施。
关键词
分
类
主题
一体化
聚类检索
下载PDF
职称材料
基于模糊聚类分析的数据检索的应用
被引量:
11
3
作者
潘玉奇
周劲
+1 位作者
杨秀丽
袁宁
《微电子学与计算机》
CSCD
北大核心
2005年第6期167-169,172,共4页
为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类...
为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类中心和查询数据的相似程度来进行聚类检索。
展开更多
关键词
模糊
聚
类
分析
相似度
聚
类
中心
聚类检索
下载PDF
职称材料
聚类检索述评
被引量:
4
4
作者
马丽萍
《图书情报工作》
CSSCI
北大核心
2006年第7期122-124,共3页
介绍聚类和聚类检索的概念以及聚类检索在数据库与Web上的应用现状,对聚类检索目前存在的问题,如聚类效果不突出、用户无法参与聚类过程等进行分析,认为将聚类检索作为数据库或搜索引擎的一种检索功能,是对信息的一种增值性开发利用,会...
介绍聚类和聚类检索的概念以及聚类检索在数据库与Web上的应用现状,对聚类检索目前存在的问题,如聚类效果不突出、用户无法参与聚类过程等进行分析,认为将聚类检索作为数据库或搜索引擎的一种检索功能,是对信息的一种增值性开发利用,会更加完善检索系统;提出聚类检索应基于个性化用户模式来发展,要将聚类结果可视化,设置允许用户参与操作的检索界面等建议,以期将聚类功能向个性化、智能化方向推进,更好地满足用户检索需求。
展开更多
关键词
聚类检索
数据库
搜索引擎
开发利用
个性化用户
智能化
原文传递
基于聚类技术的学科信息检索服务
5
作者
李洁
陈围
谭立地
《江西科学》
2012年第3期396-399,共4页
学科信息检索是高等院校、科研院所图书馆信息资源服务保障的重点,关系到学科发展的基础。从学科信息检索服务的需求特点出发,分析了常用检索技术和方法在学科信息服务方面的不足,研究论述了专题数据聚类检索在学科服务中的应用价值、...
学科信息检索是高等院校、科研院所图书馆信息资源服务保障的重点,关系到学科发展的基础。从学科信息检索服务的需求特点出发,分析了常用检索技术和方法在学科信息服务方面的不足,研究论述了专题数据聚类检索在学科服务中的应用价值、实现方法、系统构成以及发展方向。
展开更多
关键词
学科服务
聚类检索
信息
检索
信息服务
下载PDF
职称材料
基于聚类的模型数据集可视化与检索
被引量:
5
6
作者
石源
莫蓉
+2 位作者
常智勇
张欣
汪伟
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2010年第11期1918-1924,共7页
为解决模型数据集可视化的问题,提出一种基于聚类结果的簇代表模型可视化方案.首先以等距特征映射算法作为模型特征数据的降维方法,将高维特征数据降至三维,并以该三维数据作为簇代表模型的空间位置坐标;然后采用粒子群优化算法得到模...
为解决模型数据集可视化的问题,提出一种基于聚类结果的簇代表模型可视化方案.首先以等距特征映射算法作为模型特征数据的降维方法,将高维特征数据降至三维,并以该三维数据作为簇代表模型的空间位置坐标;然后采用粒子群优化算法得到模型簇的几何中值点,以距几何中值点最近的模型作为该模型簇的代表模型;最后结合模型的对齐方法来确定簇代表模型的姿态,从而实现模型数据集的可视化.另外,根据查询模型与簇代表模型之间的相似性,提出一个基于聚类结果的模型检索流程.该检索流程首先寻找与查询模型最相似的簇代表模型,然后将查询范围限制在这些簇代表模型对应的模型簇中,从而减少备选模型的数量.检索实验结果表明,在合适的参数组合下,该检索流程可以在保证检索精度的同时大幅提高检索效率.
展开更多
关键词
模型数据集可视化
等距特征映射
基于
聚
类
的
检索
下载PDF
职称材料
基于ontology抽取优化初始选择的检索结果聚类
被引量:
8
7
作者
陈毅恒
秦兵
+2 位作者
宋凡
刘挺
李生
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期166-170,156,共6页
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结...
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高.
展开更多
关键词
检索
结果
聚
类
ONTOLOGY
标签
下载PDF
职称材料
一种层次化的检索结果聚类方法
被引量:
15
8
作者
张刚
刘悦
+1 位作者
郭嘉丰
程学旗
《计算机研究与发展》
EI
CSCD
北大核心
2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别...
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高.
展开更多
关键词
信息
检索
检索
结果
聚
类
层次化
聚
类
文本
聚
类
聚
类
下载PDF
职称材料
面向信息检索的快速聚类算法
被引量:
12
9
作者
刘铭
刘秉权
刘远超
《计算机研究与发展》
EI
CSCD
北大核心
2013年第7期1452-1463,共12页
随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别...
随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确;同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理.
展开更多
关键词
信息
检索
聚
类
技术
权值调整
极大极小理论
快速
聚
类
自组织映射
下载PDF
职称材料
基于主题模型的检索结果聚类应用研究
被引量:
14
10
作者
阮光册
夏磊
《情报杂志》
CSSCI
北大核心
2017年第3期179-184,共6页
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语...
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。
展开更多
关键词
LDA
检索
结果
聚
类
聚
类
标签
概率分布
语义挖掘
K-MEANS
下载PDF
职称材料
基于潜在语义索引和自组织映射网的检索结果聚类方法
被引量:
4
11
作者
陈毅恒
秦兵
+2 位作者
刘挺
王平
李生
《计算机研究与发展》
EI
CSCD
北大核心
2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检...
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
展开更多
关键词
检索
结果
聚
类
潜在语义索引
自组织映射网
标签
边界划分
下载PDF
职称材料
基于XML的检索结果聚类方法
被引量:
5
12
作者
余宏
万常选
《计算机工程》
CAS
CSCD
北大核心
2010年第1期85-86,90,共3页
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传...
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传统方法。
展开更多
关键词
XML
检索
结果
聚
类
结构语义相似度
内容相似度
聚
类
算法
下载PDF
职称材料
基于检索结果聚类的XML伪相关文档查找
被引量:
1
13
作者
钟敏娟
万常选
+1 位作者
刘德喜
廖述梅
《计算机科学》
CSCD
北大核心
2013年第10期172-177,共6页
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML...
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。
展开更多
关键词
信息
检索
XML伪相关反馈
XML
检索
结果
聚
类
簇标签
排序模型
下载PDF
职称材料
改进后缀树的中文检索结果聚类研究
被引量:
1
14
作者
袁津生
荣元媛
《计算机工程与应用》
CSCD
2014年第21期143-146,共4页
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、...
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、词长、词性和位置几项约束条件计算各节点词语得分;合并基类取得分高的节点词作标签。实验结果显示该方法的聚类簇纯度较高,提取的标签准确且区分性较强,方便用户使用。
展开更多
关键词
检索
结果
聚
类
后缀树
聚
类
标签
中文
检索
聚
类
下载PDF
职称材料
基于模糊聚类的多元异构网络数据快速检索方法
被引量:
1
15
作者
石碧瑶
《信息与电脑》
2022年第13期68-70,共3页
多元异构网络数据具有复杂性高、异构性强以及多样性的特点,使得其在海量多元异构网络数据中很难实现目标数据的快速检索,因此提出了一种基于模糊聚类的多元异构网络数据快速检索方法。通过设计模糊聚类函数模型确定聚类中心,求解模糊...
多元异构网络数据具有复杂性高、异构性强以及多样性的特点,使得其在海量多元异构网络数据中很难实现目标数据的快速检索,因此提出了一种基于模糊聚类的多元异构网络数据快速检索方法。通过设计模糊聚类函数模型确定聚类中心,求解模糊聚类的最优解,避免算法陷入局部最优,实现多元异构网络数据的聚类检索,以期为多元异构网络数据检索提供参考与借鉴。
展开更多
关键词
模糊
聚
类
多元异构数据
聚类检索
快速
检索
下载PDF
职称材料
聚类检索和分类检索的关系
16
作者
姜希强
《情报资料工作》
CSSCI
北大核心
1989年第4期35-36,34,共3页
关键词
聚类检索
分
类
检索
检索
原文传递
网络检索结果聚类研究综述
被引量:
2
17
作者
柏晗
成颖
柯青
《情报理论与实践》
CSSCI
北大核心
2015年第10期138-144,共7页
网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优...
网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优化聚类数K以及生成重叠聚类等;后者的改进主要有优化类计分运算、优化类合并运算、数据结构优化、候选标签选择以及基于语义的优化等。在对相关研究进行综述的基础上探讨了检索结果聚类面临的问题和未来的发展方向。
展开更多
关键词
检索
结果
聚
类
检索
算法
优化
综述
下载PDF
职称材料
基于后缀树的Web检索结果聚类标签生成方法
被引量:
9
18
作者
骆雄武
万小军
+1 位作者
杨建武
吴於茜
《中文信息学报》
CSCD
北大核心
2009年第2期83-88,共6页
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。
展开更多
关键词
计算机应用
中文信息处理
检索
结果
聚
类
聚
类
标签生成
后缀树
下载PDF
职称材料
QLA-Means:检索结果聚类方法
被引量:
1
19
作者
邓茹仁
伍应环
《计算机工程与设计》
北大核心
2017年第4期1067-1070,1080,共5页
针对搜索引擎检索大规模数据时结果聚类的性能有限问题,提出一种查询日志辅助的改进K-Means算法。将传统的K-Means聚类扩展为多层次聚类的形式,实现检索对象与检索结果之间的聚类;通过引入检索日志,辅助提升聚类的效果,实现检索结果推...
针对搜索引擎检索大规模数据时结果聚类的性能有限问题,提出一种查询日志辅助的改进K-Means算法。将传统的K-Means聚类扩展为多层次聚类的形式,实现检索对象与检索结果之间的聚类;通过引入检索日志,辅助提升聚类的效果,实现检索结果推送的高相关性。实现结果表明,基于该算法的检索结果聚类,有着较高的准确率,检索过程的时间开销较低,综合效率与准确率而言,该算法是一种理想的检索结果聚类方法。
展开更多
关键词
K均值
检索
结果
聚
类
查询日志
多层
标签契合度
下载PDF
职称材料
一种快速网页检索结果聚类策略
被引量:
1
20
作者
高镔
《计算机工程与应用》
CSCD
北大核心
2011年第12期110-112,121,共4页
在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始...
在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用K-means算法聚类标题和摘要取得比较合理的聚类结果。由于标题一般都比较短,可以大大减少HAC算法的运行时间。这样既满足网络检索对时间的要求又可以得到较好的聚类结果。
展开更多
关键词
网页
检索
结果
聚
类
层次
聚
类
两阶段
聚
类
下载PDF
职称材料
题名
集成概念空间与潜在语义索引的文本聚类检索研究
被引量:
2
1
作者
韩毅
张克菊
金碧辉
机构
中国科学院国家科学图书馆
中国科学院研究生院
西南大学计算机与信息科学学院
出处
《情报理论与实践》
CSSCI
北大核心
2009年第6期102-105,共4页
文摘
信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方法、同义词近义词处理方法及基准向量的生成方法,分析了网络条件下基于概念空间的文本分类、聚类检索基本机制,最后给出了完善概念空间的自学习机制。
关键词
概念空间
潜在语义索引
文本
检索
聚类检索
Keywords
concept space
latent semantic index
text retrieval
clustering retrieval
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
实现分类主题一体化的自动聚类检索系统
2
作者
苏丽珍
机构
重庆建筑工程学院
出处
《情报理论与实践》
CSSCI
北大核心
1990年第4期26-28,共3页
文摘
运用文献自动聚类的原理,阐述了实现分类主题一体化的方法、步骤;论证了在文献自动聚类检索系统中,分类体系和主题体系能够和谐地融为一体;并提出了优化该检索体系的有关措施。
关键词
分
类
主题
一体化
聚类检索
分类号
G254.0 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于模糊聚类分析的数据检索的应用
被引量:
11
3
作者
潘玉奇
周劲
杨秀丽
袁宁
机构
山东大学计算机科学与技术学院
济南大学信息科学与工程学院
山东理工大学计算机教学部
出处
《微电子学与计算机》
CSCD
北大核心
2005年第6期167-169,172,共4页
基金
国家"863"计划资助项目(2002AA4Z3240)
文摘
为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量--相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类中心和查询数据的相似程度来进行聚类检索。
关键词
模糊
聚
类
分析
相似度
聚
类
中心
聚类检索
Keywords
Fuzzy cluster analysis, Similar-degree, Cluster center, Cluster search
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
聚类检索述评
被引量:
4
4
作者
马丽萍
机构
甘肃农业大学图书馆
出处
《图书情报工作》
CSSCI
北大核心
2006年第7期122-124,共3页
文摘
介绍聚类和聚类检索的概念以及聚类检索在数据库与Web上的应用现状,对聚类检索目前存在的问题,如聚类效果不突出、用户无法参与聚类过程等进行分析,认为将聚类检索作为数据库或搜索引擎的一种检索功能,是对信息的一种增值性开发利用,会更加完善检索系统;提出聚类检索应基于个性化用户模式来发展,要将聚类结果可视化,设置允许用户参与操作的检索界面等建议,以期将聚类功能向个性化、智能化方向推进,更好地满足用户检索需求。
关键词
聚类检索
数据库
搜索引擎
开发利用
个性化用户
智能化
Keywords
clustering retrieval application database search engine
分类号
G354.2 [文化科学—情报学]
G252.7 [文化科学—图书馆学]
原文传递
题名
基于聚类技术的学科信息检索服务
5
作者
李洁
陈围
谭立地
机构
南京陆军指挥学院
江西省科学院
出处
《江西科学》
2012年第3期396-399,共4页
文摘
学科信息检索是高等院校、科研院所图书馆信息资源服务保障的重点,关系到学科发展的基础。从学科信息检索服务的需求特点出发,分析了常用检索技术和方法在学科信息服务方面的不足,研究论述了专题数据聚类检索在学科服务中的应用价值、实现方法、系统构成以及发展方向。
关键词
学科服务
聚类检索
信息
检索
信息服务
Keywords
Discipline service, Clustering retrieval, Information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G252 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于聚类的模型数据集可视化与检索
被引量:
5
6
作者
石源
莫蓉
常智勇
张欣
汪伟
机构
西北工业大学现代设计与集成制造技术教育部重点实验室
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2010年第11期1918-1924,共7页
基金
国家自然科学基金(50805122)
国家"八六三"高技术研究发展计划(2007AA04Z184)
西北工业大学研究生创业种子基金(Z200927)
文摘
为解决模型数据集可视化的问题,提出一种基于聚类结果的簇代表模型可视化方案.首先以等距特征映射算法作为模型特征数据的降维方法,将高维特征数据降至三维,并以该三维数据作为簇代表模型的空间位置坐标;然后采用粒子群优化算法得到模型簇的几何中值点,以距几何中值点最近的模型作为该模型簇的代表模型;最后结合模型的对齐方法来确定簇代表模型的姿态,从而实现模型数据集的可视化.另外,根据查询模型与簇代表模型之间的相似性,提出一个基于聚类结果的模型检索流程.该检索流程首先寻找与查询模型最相似的簇代表模型,然后将查询范围限制在这些簇代表模型对应的模型簇中,从而减少备选模型的数量.检索实验结果表明,在合适的参数组合下,该检索流程可以在保证检索精度的同时大幅提高检索效率.
关键词
模型数据集可视化
等距特征映射
基于
聚
类
的
检索
Keywords
model dataset visualization
isometric feature mapping
clustering-based model retrieval
分类号
TP391.71 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于ontology抽取优化初始选择的检索结果聚类
被引量:
8
7
作者
陈毅恒
秦兵
宋凡
刘挺
李生
机构
哈尔滨工业大学计算机科学与技术学院信息检索研究室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期166-170,156,共6页
基金
国家自然科学基金重点项目(No.60435020)
国家自然科学基金面上项目(No.60503072)
文摘
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高.
关键词
检索
结果
聚
类
ONTOLOGY
标签
Keywords
search results clustering
ontology
label
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种层次化的检索结果聚类方法
被引量:
15
8
作者
张刚
刘悦
郭嘉丰
程学旗
机构
中国科学院计算技术研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2008年第3期542-547,共6页
基金
国家"九七三"重点基础研究发展规划基金项目(2004CB318109
2007CB311100)
文摘
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高.
关键词
信息
检索
检索
结果
聚
类
层次化
聚
类
文本
聚
类
聚
类
Keywords
information retrieval
search result clustering
hierarchical clustering
text clustering
clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向信息检索的快速聚类算法
被引量:
12
9
作者
刘铭
刘秉权
刘远超
机构
哈尔滨工业大学计算机科学与技术学院
语言语音教育部-微软重点实验室(哈尔滨工业大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第7期1452-1463,共12页
基金
国家自然科学基金面上项目(61073127)
中央高校基本科研业务费专项基金项目(HIT.NSRIF.2013066)
+1 种基金
中国博士后科学基金面上项目(2013M530156)
教育部-微软语言语音重点实验室开放基金项目
文摘
随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确;同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理.
关键词
信息
检索
聚
类
技术
权值调整
极大极小理论
快速
聚
类
自组织映射
Keywords
clustering technique for information retrieval
weight adjustment
maximum-minimum principle
fast clustering self-organizing-mapping (SOM)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于主题模型的检索结果聚类应用研究
被引量:
14
10
作者
阮光册
夏磊
机构
华东师范大学经济与管理学部信息管理系
上海图书馆会展中心
出处
《情报杂志》
CSSCI
北大核心
2017年第3期179-184,共6页
基金
上海哲学社会科学一般项目"基于主题模型的学科交叉知识发现研究"(编号:2016BTQ002)的研究成果之一
文摘
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。
关键词
LDA
检索
结果
聚
类
聚
类
标签
概率分布
语义挖掘
K-MEANS
Keywords
LDA retrieval results clustering cluster label probability distribution semantic mining K-means
分类号
G353 [文化科学—情报学]
下载PDF
职称材料
题名
基于潜在语义索引和自组织映射网的检索结果聚类方法
被引量:
4
11
作者
陈毅恒
秦兵
刘挺
王平
李生
机构
哈尔滨工业大学计算机学院信息检索研究室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第7期1176-1183,共8页
基金
国家自然科学基金项目(60675034)
国家"八六三"高技术研究发展计划基金项目(2008AA01Z144)~~
文摘
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
关键词
检索
结果
聚
类
潜在语义索引
自组织映射网
标签
边界划分
Keywords
search result clustering
LSI
SOM
label
boundary detection
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于XML的检索结果聚类方法
被引量:
5
12
作者
余宏
万常选
机构
南昌师范高等专科学校信息中心
江西财经大学信息管理学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第1期85-86,90,共3页
基金
国家自然科学基金资助项目(60763001)
国家社会科学基金资助项目(07BTQ025)
文摘
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传统方法。
关键词
XML
检索
结果
聚
类
结构语义相似度
内容相似度
聚
类
算法
Keywords
XML retrieval result clustering
structure semantic similarity
content similarity
clustering algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于检索结果聚类的XML伪相关文档查找
被引量:
1
13
作者
钟敏娟
万常选
刘德喜
廖述梅
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
出处
《计算机科学》
CSCD
北大核心
2013年第10期172-177,共6页
基金
国家自然基金项目(61173146
61262035
+1 种基金
60763001)
国家社会科学基金(12CTQ042)资助
文摘
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。
关键词
信息
检索
XML伪相关反馈
XML
检索
结果
聚
类
簇标签
排序模型
Keywords
Information retrieval, XML pseudo-relevance feedback, XML search results clustering, Cluster label, Ran-king model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
改进后缀树的中文检索结果聚类研究
被引量:
1
14
作者
袁津生
荣元媛
机构
北京林业大学信息学院
出处
《计算机工程与应用》
CSCD
2014年第21期143-146,共4页
文摘
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、词长、词性和位置几项约束条件计算各节点词语得分;合并基类取得分高的节点词作标签。实验结果显示该方法的聚类簇纯度较高,提取的标签准确且区分性较强,方便用户使用。
关键词
检索
结果
聚
类
后缀树
聚
类
标签
中文
检索
聚
类
Keywords
search results clustering
suffix tree
cluster label
Chinese search
clustering
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于模糊聚类的多元异构网络数据快速检索方法
被引量:
1
15
作者
石碧瑶
机构
西安交通工程学院
出处
《信息与电脑》
2022年第13期68-70,共3页
文摘
多元异构网络数据具有复杂性高、异构性强以及多样性的特点,使得其在海量多元异构网络数据中很难实现目标数据的快速检索,因此提出了一种基于模糊聚类的多元异构网络数据快速检索方法。通过设计模糊聚类函数模型确定聚类中心,求解模糊聚类的最优解,避免算法陷入局部最优,实现多元异构网络数据的聚类检索,以期为多元异构网络数据检索提供参考与借鉴。
关键词
模糊
聚
类
多元异构数据
聚类检索
快速
检索
Keywords
fuzzy clustering
multivariate heterogeneous data
clustering retrieval
rapid retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
聚类检索和分类检索的关系
16
作者
姜希强
出处
《情报资料工作》
CSSCI
北大核心
1989年第4期35-36,34,共3页
关键词
聚类检索
分
类
检索
检索
分类号
G354 [文化科学—情报学]
原文传递
题名
网络检索结果聚类研究综述
被引量:
2
17
作者
柏晗
成颖
柯青
机构
南京大学信息管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2015年第10期138-144,共7页
基金
国家社会科学基金重大招标项目"面向学科领域的网络信息资源深度聚合与服务研究"(项目编号:12&ZD221)
中国科学技术信息研究所"大数据环境下的人机交互研究"课题的资助
文摘
网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优化聚类数K以及生成重叠聚类等;后者的改进主要有优化类计分运算、优化类合并运算、数据结构优化、候选标签选择以及基于语义的优化等。在对相关研究进行综述的基础上探讨了检索结果聚类面临的问题和未来的发展方向。
关键词
检索
结果
聚
类
检索
算法
优化
综述
Keywords
search results clustering
retrieval algorithm
optimization
survey
分类号
G252.7 [文化科学—图书馆学]
G353.1 [文化科学—情报学]
下载PDF
职称材料
题名
基于后缀树的Web检索结果聚类标签生成方法
被引量:
9
18
作者
骆雄武
万小军
杨建武
吴於茜
机构
北京大学计算机科学技术研究所
出处
《中文信息学报》
CSCD
北大核心
2009年第2期83-88,共6页
基金
国家十一五资助项目(2006BAH02A10)
国家863计划资助项目(2008AA01Z421)
文摘
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。
关键词
计算机应用
中文信息处理
检索
结果
聚
类
聚
类
标签生成
后缀树
Keywords
computer application
Chinese information processing
search results clustering
cluster label generation
suffix tree
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
QLA-Means:检索结果聚类方法
被引量:
1
19
作者
邓茹仁
伍应环
机构
江西科技师范大学党委组织部
南昌理工学院经济管理学院
出处
《计算机工程与设计》
北大核心
2017年第4期1067-1070,1080,共5页
文摘
针对搜索引擎检索大规模数据时结果聚类的性能有限问题,提出一种查询日志辅助的改进K-Means算法。将传统的K-Means聚类扩展为多层次聚类的形式,实现检索对象与检索结果之间的聚类;通过引入检索日志,辅助提升聚类的效果,实现检索结果推送的高相关性。实现结果表明,基于该算法的检索结果聚类,有着较高的准确率,检索过程的时间开销较低,综合效率与准确率而言,该算法是一种理想的检索结果聚类方法。
关键词
K均值
检索
结果
聚
类
查询日志
多层
标签契合度
Keywords
K-Means
search result clustering
query log
multi-layer
label fit
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种快速网页检索结果聚类策略
被引量:
1
20
作者
高镔
机构
黑龙江大学信息科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第12期110-112,121,共4页
基金
国家自然科学基金No.60773069
No.60873169
黑龙江大学校青年自然科学基金~~
文摘
在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用K-means算法聚类标题和摘要取得比较合理的聚类结果。由于标题一般都比较短,可以大大减少HAC算法的运行时间。这样既满足网络检索对时间的要求又可以得到较好的聚类结果。
关键词
网页
检索
结果
聚
类
层次
聚
类
两阶段
聚
类
Keywords
web search result clustering
hierarchical clustering
two-stage clustering method
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
集成概念空间与潜在语义索引的文本聚类检索研究
韩毅
张克菊
金碧辉
《情报理论与实践》
CSSCI
北大核心
2009
2
下载PDF
职称材料
2
实现分类主题一体化的自动聚类检索系统
苏丽珍
《情报理论与实践》
CSSCI
北大核心
1990
0
下载PDF
职称材料
3
基于模糊聚类分析的数据检索的应用
潘玉奇
周劲
杨秀丽
袁宁
《微电子学与计算机》
CSCD
北大核心
2005
11
下载PDF
职称材料
4
聚类检索述评
马丽萍
《图书情报工作》
CSSCI
北大核心
2006
4
原文传递
5
基于聚类技术的学科信息检索服务
李洁
陈围
谭立地
《江西科学》
2012
0
下载PDF
职称材料
6
基于聚类的模型数据集可视化与检索
石源
莫蓉
常智勇
张欣
汪伟
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2010
5
下载PDF
职称材料
7
基于ontology抽取优化初始选择的检索结果聚类
陈毅恒
秦兵
宋凡
刘挺
李生
《电子学报》
EI
CAS
CSCD
北大核心
2008
8
下载PDF
职称材料
8
一种层次化的检索结果聚类方法
张刚
刘悦
郭嘉丰
程学旗
《计算机研究与发展》
EI
CSCD
北大核心
2008
15
下载PDF
职称材料
9
面向信息检索的快速聚类算法
刘铭
刘秉权
刘远超
《计算机研究与发展》
EI
CSCD
北大核心
2013
12
下载PDF
职称材料
10
基于主题模型的检索结果聚类应用研究
阮光册
夏磊
《情报杂志》
CSSCI
北大核心
2017
14
下载PDF
职称材料
11
基于潜在语义索引和自组织映射网的检索结果聚类方法
陈毅恒
秦兵
刘挺
王平
李生
《计算机研究与发展》
EI
CSCD
北大核心
2009
4
下载PDF
职称材料
12
基于XML的检索结果聚类方法
余宏
万常选
《计算机工程》
CAS
CSCD
北大核心
2010
5
下载PDF
职称材料
13
基于检索结果聚类的XML伪相关文档查找
钟敏娟
万常选
刘德喜
廖述梅
《计算机科学》
CSCD
北大核心
2013
1
下载PDF
职称材料
14
改进后缀树的中文检索结果聚类研究
袁津生
荣元媛
《计算机工程与应用》
CSCD
2014
1
下载PDF
职称材料
15
基于模糊聚类的多元异构网络数据快速检索方法
石碧瑶
《信息与电脑》
2022
1
下载PDF
职称材料
16
聚类检索和分类检索的关系
姜希强
《情报资料工作》
CSSCI
北大核心
1989
0
原文传递
17
网络检索结果聚类研究综述
柏晗
成颖
柯青
《情报理论与实践》
CSSCI
北大核心
2015
2
下载PDF
职称材料
18
基于后缀树的Web检索结果聚类标签生成方法
骆雄武
万小军
杨建武
吴於茜
《中文信息学报》
CSCD
北大核心
2009
9
下载PDF
职称材料
19
QLA-Means:检索结果聚类方法
邓茹仁
伍应环
《计算机工程与设计》
北大核心
2017
1
下载PDF
职称材料
20
一种快速网页检索结果聚类策略
高镔
《计算机工程与应用》
CSCD
北大核心
2011
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部