期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
Document Clustering Using Semantic Cliques Aggregation
1
作者 Ajit Kumar I-Jen Chiang 《Journal of Computer and Communications》 2015年第12期28-40,共13页
The search engines are indispensable tools to find information amidst massive web pages and documents. A good search engine needs to retrieve information not only in a shorter time, but also relevant to the users’ qu... The search engines are indispensable tools to find information amidst massive web pages and documents. A good search engine needs to retrieve information not only in a shorter time, but also relevant to the users’ queries. Most search engines provide short time retrieval to user queries;however, they provide a little guarantee of precision even to the highly detailed users’ queries. In such cases, documents clustering centered on the subject and contents might improve search results. This paper presents a novel method of document clustering, which uses semantic clique. First, we extracted the Features from the documents. Later, the associations between frequently co-occurring terms were defined, which were called as semantic cliques. Each connected component in the semantic clique represented a theme. The documents clustered based on the theme, for which we designed an aggregation algorithm. We evaluated the aggregation algorithm effectiveness using four kinds of datasets. The result showed that the semantic clique based document clustering algorithm performed significantly better than traditional clustering algorithms such as Principal Direction Divisive Partitioning (PDDP), k-means, Auto-Class, and Hierarchical Clustering (HAC). We found that the Semantic Clique Aggregation is a potential model to represent association rules in text and could be immensely useful for automatic document clustering. 展开更多
关键词 Document clustering SEMANTIC clique ASSOCIATION AGGREGATION THEME
下载PDF
基于网格和密度的CLIQUE聚类算法的研究与实现 被引量:8
2
作者 邓庚盛 刘承启 熊艳 《计算机与现代化》 2008年第12期8-11,共4页
考虑到基于距离的传统聚类算法在实际应用中存在多方面的不足,本文研究了一种能弥补传统聚类算法不足的基于网格和密度的CLIQUE聚类算法,并给出该算法实现的具体过程和主要代码。最后总结了该算法的特点和应用前景。
关键词 聚类 聚类高维空间 密度 网格
下载PDF
基于CLIQUE的聚类算法研究 被引量:12
3
作者 付淇 李正凡 《华东交通大学学报》 2006年第5期79-82,共4页
聚类分析是数据挖掘研究领域中一个非常活跃的研究课题.本文重点分析了高维度数据的自动子空间聚类算法(CLIQUE)及其各类改进算法,并对其未来发展方向进行了简要展望.
关键词 数据挖掘 聚类 clique 子空间
下载PDF
基于多重文本关系图中clique子团聚类的主题识别方法研究 被引量:4
4
作者 郭红梅 孔贝贝 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第5期433-442,共10页
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈... 在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。 展开更多
关键词 clique子团 多重文本关系 文本主题识别
下载PDF
基于相对熵和子空间二次过滤的CLIQUE改进算法 被引量:1
5
作者 郭景峰 易莉桦 《燕山大学学报》 CAS 2011年第4期359-365,共7页
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚... 提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。 展开更多
关键词 子空间聚类 相对熵 联合基尼值 维关联度 clique
下载PDF
CLIQUE聚类算法的分析研究 被引量:7
6
作者 项响琴 李红 陈圣兵 《合肥学院学报(自然科学版)》 2011年第1期54-58,66,共6页
CLIQUE算法是基于密度和网格的一种聚类分析算法,对于大型高维空间数据的聚类分析具有很高的效率,能得到优质的聚类结果.通过分析CLIQUE算法的特点、聚类过程中的关键问题及算法步骤,运用实验数据对算法进行了测试,对聚类结果进行分析讨... CLIQUE算法是基于密度和网格的一种聚类分析算法,对于大型高维空间数据的聚类分析具有很高的效率,能得到优质的聚类结果.通过分析CLIQUE算法的特点、聚类过程中的关键问题及算法步骤,运用实验数据对算法进行了测试,对聚类结果进行分析讨论,发现算法的不足,说明了改进的思路,为以后研究工作指明了方向. 展开更多
关键词 聚类分析 高维空间数据 clique算法 优化分析
下载PDF
基于Clique聚类的精神分裂症多文档自动摘要研究 被引量:1
7
作者 张晗 赵玉虹 《中华医学图书情报杂志》 CAS 2016年第3期18-24,共7页
利用SemRep将精神分裂文献集处理为语义述谓项集,建立语义述谓网络,从节点、边及网络凝聚性三个层次提取文献集的核心内容,生成的图形摘要由具有高凝聚性的clique组成,探索利用网络属性结合语义信息的生物医学多文档自动摘要方法。通过c... 利用SemRep将精神分裂文献集处理为语义述谓项集,建立语义述谓网络,从节点、边及网络凝聚性三个层次提取文献集的核心内容,生成的图形摘要由具有高凝聚性的clique组成,探索利用网络属性结合语义信息的生物医学多文档自动摘要方法。通过clique共节点矩阵对其聚类获取摘要的子主题,采用人工标准对摘要内容的覆盖面进行评价,结果显示摘要的准确率为0.93,召回率为0.68,F值为0.79。该方法能有效识别文献集中的核心内容,网络图中所富含的语义信息能较完整地表达摘要内容。 展开更多
关键词 clique聚类 语义分析 多文档自动摘要 网络分析 知识图谱 知识挖掘
下载PDF
CLIQUE算法在信用卡审批模型中的应用研究 被引量:2
8
作者 项响琴 汪萍 李健 《安徽建筑工业学院学报(自然科学版)》 2011年第1期89-93,共5页
聚类分析是数据挖掘的最主要功能之一,其中CLIQUE算法是综合了基于密度和基于网格的聚类方法,对于大型数据库中的高维数据的聚类非常有效,解决了现有多种聚类算法只能处理低维空间数据的缺陷。通过分析研究聚类中的CLIQUE算法,将其应用... 聚类分析是数据挖掘的最主要功能之一,其中CLIQUE算法是综合了基于密度和基于网格的聚类方法,对于大型数据库中的高维数据的聚类非常有效,解决了现有多种聚类算法只能处理低维空间数据的缺陷。通过分析研究聚类中的CLIQUE算法,将其应用于信用卡的审批模型中,能进行高效、智能的判断,为发卡银行提供有效的决策支持。 展开更多
关键词 数据挖掘 聚类分析 clique算法 信用卡审批
下载PDF
改进的CLIQUE优化算法 被引量:4
9
作者 高亚鲁 宋余庆 朱玉全 《计算机工程与设计》 CSCD 北大核心 2009年第16期3801-3804,共4页
为了解决子空间聚类算法时间复杂度偏高和网格划分不太合理的问题,通过对数据空间进行网格划分并寻找稀疏区域来发现簇的边界,对算法的时间复杂度进行优化,达到对子空间聚类算法CLIQUE进行了优化和改进目的。优化算法采用了自适应的网... 为了解决子空间聚类算法时间复杂度偏高和网格划分不太合理的问题,通过对数据空间进行网格划分并寻找稀疏区域来发现簇的边界,对算法的时间复杂度进行优化,达到对子空间聚类算法CLIQUE进行了优化和改进目的。优化算法采用了自适应的网格划分方法,提高了发现高维子空间的可能性。优化算法通过对剪枝方式的优化,有效地控制了算法的复杂度。实验结果表明,该算法在精度、时间复杂性等方面的性能良好。 展开更多
关键词 数据挖掘 子空间聚类 网格划分 密度聚类 clique
下载PDF
基于高斯过程的CLIQUE改进算法 被引量:7
10
作者 向柳明 周渭博 钟勇 《计算机应用》 CSCD 北大核心 2015年第A02期85-87,92,共4页
CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLI... CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLIQUE改进算法GP-CLIQUE。该算法识别密集网格后,先在密集网格空间的每一维上进行高斯随机采样快速找到密度局部最大的密集网格;再分别从这些密度局部最大的密集网格进行深度优先遍历生成聚类簇;最后确定每个聚类簇的最小覆盖。实验结果表明,在数据集小且无噪声时,该算法在性能上与CLIQUE相当,当数据集大噪声较多时,其性能较CLIQUE能提高6%~24%。 展开更多
关键词 clique 高斯过程 聚类簇 密集网格 深度优先遍历 局部最大密度 高斯随机采样
下载PDF
一种基于CLIQUE聚类的全球地震目录分析方法 被引量:1
11
作者 杨振凯 江南 杨飞 《测绘科学技术学报》 CSCD 北大核心 2018年第1期105-110,共6页
CLIQUE是一种重要的数据挖掘算法,广泛应用于大型数据库中的高维数据聚类。分析了CLIQUE算法的主要思想以及聚类算法在地震目录分析中的研究现状,提出了利用CLIQUE算法对全球地震目录进行聚类处理的流程。根据时空数据的多维特征,首先... CLIQUE是一种重要的数据挖掘算法,广泛应用于大型数据库中的高维数据聚类。分析了CLIQUE算法的主要思想以及聚类算法在地震目录分析中的研究现状,提出了利用CLIQUE算法对全球地震目录进行聚类处理的流程。根据时空数据的多维特征,首先划分子空间计算密集单元,再将其连接聚簇并投影至各个维度进行可视分析。以近40 a(1977-2016年)的全球地震目录为数据源进行CLIQUE聚类实验,结果表明CLIQUE能有效发现地震现象在不同维度下呈现的聚集模式,且相对于其他聚类算法具有较高的效率。本文方法具有一定的可靠性与实用性,能够为地震事件的评估和防范提供决策依据。 展开更多
关键词 clique算法 地震目录 时空数据 聚类 密集单元
下载PDF
Research on Some Bus Transport Networks with Random Overlapping Clique Structure 被引量:8
12
作者 YANG Xu-Hua WANG Bo +1 位作者 WANG Wan-Liang SUN You-Xian 《Communications in Theoretical Physics》 SCIE CAS CSCD 2008年第11期1249-1254,共6页
On the basis of investigating the statistical data of bus transport networks of three big cities in China,wepropose that each bus route is a clique(maximal complete subgraph)and a bus transport network(BTN)consists of... On the basis of investigating the statistical data of bus transport networks of three big cities in China,wepropose that each bus route is a clique(maximal complete subgraph)and a bus transport network(BTN)consists of alot of cliques,which intensively connect and overlap with each other.We study the network properties,which includethe degree distribution,multiple edges' overlapping time distribution,distribution of the overlap size between any twooverlapping cliques,distribution of the number of cliques that a node belongs to.Naturally,the cliques also constitute anetwork,with the overlapping nodes being their multiple links.We also research its network properties such as degreedistribution,clustering,average path length,and so on.We propose that a BTN has the properties of random cliqueincrement and random overlapping clique,at the same time,a BTN is a small-world network with highly clique-clusteredand highly clique-overlapped.Finally,we introduce a BTN evolution model,whose simulation results agree well withthe statistical laws that emerge in real BTNs. 展开更多
关键词 random clique increment random overlapping clique clique clustered bus transport network
下载PDF
聚类分析算法CLIQUE的研究及改进 被引量:1
13
作者 陈朝华 王伟平 《科技广场》 2007年第5期9-11,共3页
CLIQUE是一种基于密度和基于网格的混合聚类方法。在高维空间中,它能够有效地进行聚类,并且能够发现嵌套在高维数据空间子空间中的聚类。但是,CLIQUE算法存在着很多的局限性,主要有以下两点:首先是子空间的剪枝;其次是CLIQUE算法追求方... CLIQUE是一种基于密度和基于网格的混合聚类方法。在高维空间中,它能够有效地进行聚类,并且能够发现嵌套在高维数据空间子空间中的聚类。但是,CLIQUE算法存在着很多的局限性,主要有以下两点:首先是子空间的剪枝;其次是CLIQUE算法追求方法简单化。针对CLIQUE算法的局限性,采用基于约束条件的聚类技术、自适应网格技术和边界调整技术来对CLIQUE算法进行改进,提出了基于约束条件和自适应网格的CAG-CLIQUE算法。 展开更多
关键词 数据挖掘 聚类分析 clique算法 CAG-clique算法
下载PDF
An Energy-Efficient Clique-Based Geocast Algorithm for Dense Sensor Networks
14
作者 Alain Bertrand Bomgni Jean Frédéric Myoupo 《Communications and Network》 2010年第2期125-133,共9页
This paper proposes an energy-efficient geocast algorithm for wireless sensor networks with guaranteed de-livery of packets from the sink to all nodes located in several geocast regions. Our approach is different from... This paper proposes an energy-efficient geocast algorithm for wireless sensor networks with guaranteed de-livery of packets from the sink to all nodes located in several geocast regions. Our approach is different from those existing in the literature. We first propose a hybrid clustering scheme: in the first phase we partition the network in cliques using an existing energy-efficient clustering protocol. Next the set of clusterheads of cliques are in their turn partitioned using an energy-efficient hierarchical clustering. Our approach to con-sume less energy falls into the category of energy-efficient clustering algorithm in which the clusterhead is located in the central area of the cluster. Since each cluster is a clique, each sensor is at one hop to the cluster head. This contributes to use less energy for transmission to and from the clusterhead, comparatively to multi hop clustering. Moreover we use the strategy of asleep-awake to minimize energy consumption during extra clique broadcasts. 展开更多
关键词 Geocast Wireless Sensor Networks clustering clique Energy CONSUMPTION
下载PDF
基于网格空间团的多级同位模式挖掘方法 被引量:1
15
作者 刘宇情 王丽珍 +1 位作者 杨培忠 朴丽莎 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第5期918-930,共13页
针对传统的多级同位模式挖掘方法未考虑到实际数据分布的网格特性,且从全局到区域的多级模式挖掘框架会导致算法效率低下的问题,提出逆向挖掘多级同位模式的新框架.先挖掘区域同位模式,再由区域同位模式推导出全局同位模式,提出有效的... 针对传统的多级同位模式挖掘方法未考虑到实际数据分布的网格特性,且从全局到区域的多级模式挖掘框架会导致算法效率低下的问题,提出逆向挖掘多级同位模式的新框架.先挖掘区域同位模式,再由区域同位模式推导出全局同位模式,提出有效的剪枝策略提高挖掘效率.考虑真实数据集中数据分布的网格特性,定义实例间的网格邻近关系,提出网格空间团及计算网格空间团的新颖方法.在区域划分阶段,提出基于自适应网格密度峰值聚类的区域划分方法,基于2阶网格空间团的网格相似性来分配簇.在合成和实际数据集上进行大量的实验,验证了提出方法的有效性、高效性和可扩展性,在真实数据集上的剪枝率可以达到78%. 展开更多
关键词 空间数据挖掘 多级同位模式 网格空间团 密度峰值聚类(DPC)
下载PDF
高维数据的高密度子空间聚类算法 被引量:7
16
作者 万静 郑龙君 +1 位作者 何云斌 李松 《哈尔滨理工大学学报》 CAS 北大核心 2020年第4期84-94,共11页
高维数据具有稀疏性与易受维度灾难影响的特点,这使高维数据聚类的精度与的效率一直难以得到保证,因此采用子空间聚类的方式减小稀疏性与维度灾难对聚类结果的影响。首先采用随机抽样的方式从高维数据中挑选出适合聚类的维度生成子空间... 高维数据具有稀疏性与易受维度灾难影响的特点,这使高维数据聚类的精度与的效率一直难以得到保证,因此采用子空间聚类的方式减小稀疏性与维度灾难对聚类结果的影响。首先采用随机抽样的方式从高维数据中挑选出适合聚类的维度生成子空间,并结合hoeffding界保证抽样结果的有效性。其次利用网格的邻接性,在子空间内生成混合网格,即可以保证数据的完整性也可以提高子空间密度。最后根据子空间的相似度与相异度,对维度剪枝,再次提高子空间密度。算法在加州大学欧文分校数据集(University of California-Irvine,UCI)上能够取得较好的结果,而且算法在的伸缩性以及抗噪声能力上有较好的表现。 展开更多
关键词 子空间 高维 clustering in quest(clique) 样本分析 网格
下载PDF
层次聚类社区发现算法的研究 被引量:21
17
作者 龚尚福 陈婉璐 贾澎涛 《计算机应用研究》 CSCD 北大核心 2013年第11期3216-3220,3227,共6页
概述了社区发现算法的研究现状;介绍了因分析对象的不同而产生的四类社区发现方法:矩阵谱分析方法、层次聚类方法、基于边图思想的方法和基于极大团思想的方法。对其中性能最优的层次聚类方法进行了详细的综述,并对其典型算法进行了分... 概述了社区发现算法的研究现状;介绍了因分析对象的不同而产生的四类社区发现方法:矩阵谱分析方法、层次聚类方法、基于边图思想的方法和基于极大团思想的方法。对其中性能最优的层次聚类方法进行了详细的综述,并对其典型算法进行了分析比较。最后,提出了社区发现算法可能的研究方向,为今后的研究提供参考。 展开更多
关键词 社区发现 复杂网络 矩阵谱分析 层次聚类 边图思想 极大团方法
下载PDF
一种有效的并行高维聚类算法 被引量:6
18
作者 冯永 吴开贵 +1 位作者 熊忠阳 吴中福 《计算机科学》 CSCD 北大核心 2005年第3期216-218,共3页
针对CLQUE算法聚类结果精确性不高的缺点,提出利用小波变换来生成自适应网格的方法对CLIQUE算法进行改进,将改进算法并行化以增强聚类维数升高时算法的可伸缩性,并将其应用于药品的销售预测。实验表明本算法聚类结果的精确性高,可伸缩性... 针对CLQUE算法聚类结果精确性不高的缺点,提出利用小波变换来生成自适应网格的方法对CLIQUE算法进行改进,将改进算法并行化以增强聚类维数升高时算法的可伸缩性,并将其应用于药品的销售预测。实验表明本算法聚类结果的精确性高,可伸缩性好,并且有效地降低了计算复杂度。 展开更多
关键词 并行 高维聚类算法 clique算法 小波变换 自适应网络
下载PDF
多维加权社会网络中的个性化推荐算法 被引量:8
19
作者 张华青 王红 +1 位作者 滕兆明 马晓慧 《计算机应用》 CSCD 北大核心 2011年第9期2408-2411,2428,共5页
个性化推荐是解决Internet中信息过载的重要工具,在研究有关个性化推荐的技术和相关动态的基础上,以用户实际应用为驱动,提出一种多维加权社会网络中的个性化推荐算法。首先,该算法构建了用户之间的多维加权网络;然后利用复杂网络的聚... 个性化推荐是解决Internet中信息过载的重要工具,在研究有关个性化推荐的技术和相关动态的基础上,以用户实际应用为驱动,提出一种多维加权社会网络中的个性化推荐算法。首先,该算法构建了用户之间的多维加权网络;然后利用复杂网络的聚类方法——CPM算法寻找邻居用户;最后基于用户之间的相似性做出推荐。实验结果表明,应用该算法的多维网络的推荐系统与基于内容推荐系统和协同过滤推荐系统相比,有较高的查全率和准确率,个性化推荐质量有了一定程度的提高。 展开更多
关键词 个性化推荐 社会网络 权重 复杂网络 CPM聚类
下载PDF
基于子空间聚类算法的时空轨迹聚类 被引量:9
20
作者 马林兵 李鹏 《地理与地理信息科学》 CSCD 北大核心 2014年第4期7-11,F0003,共6页
已有的时空轨迹聚类方法一般以整条轨迹作为聚类单元,聚类效果较低且不能识别轨迹局部特征;另一种轨迹聚类方法是以划分后轨迹段为聚类单元,算法效率较低且不能很好地支持多属性聚类。该文提出基于子空间聚类算法的时空轨迹聚类。首先... 已有的时空轨迹聚类方法一般以整条轨迹作为聚类单元,聚类效果较低且不能识别轨迹局部特征;另一种轨迹聚类方法是以划分后轨迹段为聚类单元,算法效率较低且不能很好地支持多属性聚类。该文提出基于子空间聚类算法的时空轨迹聚类。首先引入数据归约的思想,将轨迹进行离散化处理,再运用CLIQUE算法对离散化后的轨迹段进行聚类。实验结果表明,此轨迹聚类方法具有较高的伸缩性,能有效地处理多维轨迹数据并识别轨迹的局部聚类特征,能揭示时空轨迹在不同子空间的运动规律。 展开更多
关键词 轨迹聚类 子空间 clique算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部