期刊文献+
共找到117篇文章
< 1 2 6 >
每页显示 20 50 100
基于语义聚类的遗传规划算法比较
1
作者 王菁 徐赐文 吕林旺 《计算机工程与设计》 北大核心 2024年第4期1056-1061,共6页
针对遗传规划算法容易陷入局部最优解与局部搜索过慢的问题,提出一种基于语义聚类的遗传规划算法(genetic programming algorithm based on semantic clustering,SCGP),比较不同聚类算法对SCGP表现的影响。同时提出一种基于子种群规模... 针对遗传规划算法容易陷入局部最优解与局部搜索过慢的问题,提出一种基于语义聚类的遗传规划算法(genetic programming algorithm based on semantic clustering,SCGP),比较不同聚类算法对SCGP表现的影响。同时提出一种基于子种群规模的自适应适应度函数,提高局部搜索能力。在多个基准问题上对比标准遗传规划、几何语义遗传规划、K均值聚类遗传规划与SCGP,实验结果表明,SCGP算法在拟合能力和泛化能力上都有较大改善。在诸多聚类方法中,层次聚类嵌入的SCGP算法在基准问题上的泛化能力最优,与标准遗传规划、几何语义遗传规划、K均值聚类遗传规划相比,分别提高了32.36%、61.29%、20.53%。 展开更多
关键词 遗传规划 算法 进化算法 语义 自适应 子种群 算法比较
下载PDF
结合语义改进的K-means短文本聚类算法 被引量:14
2
作者 邱云飞 赵彬 +1 位作者 林明明 王伟 《计算机工程与应用》 CSCD 北大核心 2016年第19期78-83,共6页
针对短文本聚类存在的三个主要挑战,特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性,提出了一种结合语义改进的K-means短文本聚类算法。该算法通过词语集合表示短文本,缓解了短文本特征关键词的稀疏性问题;通过挖掘短文本集... 针对短文本聚类存在的三个主要挑战,特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性,提出了一种结合语义改进的K-means短文本聚类算法。该算法通过词语集合表示短文本,缓解了短文本特征关键词的稀疏性问题;通过挖掘短文本集的最大频繁词集获取初始聚类中心,有效克服了K-means聚类算法对初始聚类中心敏感的缺点,解决了簇的理解性问题;通过结合TF-IDF值的语义相似度计算文档之间的相似度,避免了高维空间的运算。实验结果表明,从语义角度出发实现的短文本聚类算法优于传统的短文本聚类算法。 展开更多
关键词 文本挖掘 短文本 K-MEANS算法 最大频繁词集 知网 语义相似度
下载PDF
区间值数据模糊c-均值聚类新算法 被引量:12
3
作者 高新波 范九伦 谢维信 《西安电子科技大学学报》 EI CAS CSCD 北大核心 1999年第5期604-609,共6页
针对范九伦等提出的两种模糊c-均值聚类算法进行了改进,提出了更一般的区间值数据模糊c-均值聚类算法.证明了当加权系数λ为1时,新算法等效于老算法Ⅰ;当λ趋于0 时,新算法趋近于老算法Ⅱ.新算法以老算法Ⅰ和Ⅱ为其特例,... 针对范九伦等提出的两种模糊c-均值聚类算法进行了改进,提出了更一般的区间值数据模糊c-均值聚类算法.证明了当加权系数λ为1时,新算法等效于老算法Ⅰ;当λ趋于0 时,新算法趋近于老算法Ⅱ.新算法以老算法Ⅰ和Ⅱ为其特例,并可用现有的模糊c-均值工具箱直接实现. 展开更多
关键词 区间值数据 模糊集 模糊数学 FCM算法
下载PDF
基于语义距离的高效文本聚类算法 被引量:15
4
作者 冯少荣 肖文俊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第5期30-37,共8页
针对现有文本聚类算法忽略了词之间的语义信息,导致文本的相似度计算不够精确的问题,提出了一种基于语义进行文本聚类的新方法.该方法从语义上具体分析文本,利用文本的具体语义来计算文本间的相似度.聚类采用最近邻聚类算法,并提出第二... 针对现有文本聚类算法忽略了词之间的语义信息,导致文本的相似度计算不够精确的问题,提出了一种基于语义进行文本聚类的新方法.该方法从语义上具体分析文本,利用文本的具体语义来计算文本间的相似度.聚类采用最近邻聚类算法,并提出第二次聚类算法来改进最近邻算法对输入次序敏感的问题.根据相似度权重优胜劣汰类特征词,使得最后类特征词越来越逼近类的主题.实验结果表明,文中所提出的算法在聚类精度和召回率上均优于基于向量空间模型的k-Means聚类算法. 展开更多
关键词 文本 语义距离 相似度 最近邻 算法
下载PDF
一种基于语义相似度的文本聚类算法 被引量:18
5
作者 孙爽 章勇 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第6期712-716,共5页
文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用。现有的聚类算法大多数都是基于向量空间模型,文档集合中出现的单词词频作为特征项。这些算法都存在数据维数过高、聚簇难以描述的问题,而且忽略了单词间的语义联系。本文提出... 文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用。现有的聚类算法大多数都是基于向量空间模型,文档集合中出现的单词词频作为特征项。这些算法都存在数据维数过高、聚簇难以描述的问题,而且忽略了单词间的语义联系。本文提出了一种基于语义相似度的文本聚类算法——TCU SS(Text clustering usingsem an ticsim ilarity)算法。TCU SS算法将文档表示成概念列表,有效地解决了数据维数高和聚簇描述难的问题,并给出如何利用概念列表进行聚簇描述的方法。TCU SS算法利用两个概念列表中单词间的语义相似度作为文档间相近程度的度量,并以图为基础进行聚类分析,避免有些聚类算法对聚簇形状的限制。实验证明,TCU SS算法提高了聚类质量。 展开更多
关键词 文本 语义相似度 文本表示 语义相似度的文本算法
下载PDF
一种结合上下文语义的短文本聚类算法 被引量:11
6
作者 张群 王红军 王伦文 《计算机科学》 CSCD 北大核心 2016年第S2期443-446,450,共5页
短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的... 短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的特征词权重计算方法,在此基础上构建词条-文本矩阵;然后对该矩阵进行奇异值分解,进一步将原始特征词空间映射到低维的潜在语义空间;最后通过改进的K-means聚类算法在低维潜在语义空间完成短文本聚类。实验结果表明,与传统的基于词频及逆向文档频权重的文本聚类算法相比,该算法能有效改善短文本特征不足及高维稀疏性,提高了短文的本聚类效果。 展开更多
关键词 短文本 上下文语义 奇异值分解 K均值算法
下载PDF
基于自组织聚类的结构化P2P语义路由改进算法 被引量:17
7
作者 刘业 杨鹏 《软件学报》 EI CSCD 北大核心 2006年第2期339-348,共10页
结构化P2P网络是构建于物理网络拓扑之上的一层Overlay网络,两层之间的唯一联系是Hash散列函数,这种Hash关系使得节点的逻辑ID号与物理位置之间不存在任何联系.从分析Hash散列函数的性质入手,归纳出目的节点、传统(chord)语义路由中继... 结构化P2P网络是构建于物理网络拓扑之上的一层Overlay网络,两层之间的唯一联系是Hash散列函数,这种Hash关系使得节点的逻辑ID号与物理位置之间不存在任何联系.从分析Hash散列函数的性质入手,归纳出目的节点、传统(chord)语义路由中继节点序列、聚类邻居节点集三者之间的逻辑关联特性,并将其应用于所提出的基于自组织聚类的语义路由改进算法SCSRAA(self-organizingclusteringsemanticroutingadvancedalgorithm)中,从而达到提高语义路由效率的研究目的.针对自组织模式下聚类节点仅存在局部视图的特性,详细讨论了聚类算法及节点获取其他节点物理位置信息的各种规则,给出了SCSRAA路由算法详尽的描述及理论分析.仿真实验表明,该算法具有较强的语义路由效率提升能力. 展开更多
关键词 P2P 语义路由算法 物理拓扑 自组织
下载PDF
一种基于区间数多指标信息的FCM聚类算法 被引量:13
8
作者 于春海 樊治平 《系统工程学报》 CSCD 2004年第4期387-393,共7页
针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzyc_means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划... 针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzyc_means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理.然后根据提出的两个定理,进一步给出了基于区间数信息的FCM聚类算法的迭代步骤.最后,通过一个算例说明了给出的聚类算法. 展开更多
关键词 分析 区间 FCM算法 模糊集
下载PDF
区间数据的并行模糊聚类算法 被引量:9
9
作者 陆建江 徐宝文 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期406-409,共4页
研究了对区间数据进行聚类的模糊聚类算法 ;介绍和分析了模糊c 均值算法的基本思想及实现步骤 ;定义了区间数据的距离和四则运算 ,并推广模糊c 均值算法对区间数据进行聚类 .在此基础上 ,讨论了对区间数据进行聚类的并行模糊c 均值算法 ... 研究了对区间数据进行聚类的模糊聚类算法 ;介绍和分析了模糊c 均值算法的基本思想及实现步骤 ;定义了区间数据的距离和四则运算 ,并推广模糊c 均值算法对区间数据进行聚类 .在此基础上 ,讨论了对区间数据进行聚类的并行模糊c 均值算法 .在分布式互连的PC/工作站环境下进行性能分析 ,结果表明并行的模糊c 均值算法具有好的可扩展性。 展开更多
关键词 区间数据 模糊 并行模糊c-均值算法 四则运算
下载PDF
基于语义相似度的Web文档聚类算法 被引量:3
10
作者 李毅 王浩 杨静 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第12期1846-1850,共5页
文章提出基于语义相似度的Web文档聚类算法——WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阈值,并对最小树中进行切割,同时对较小的子类进行划分合并。实验表明,WDCSS不仅能为具有各种不同聚类... 文章提出基于语义相似度的Web文档聚类算法——WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阈值,并对最小树中进行切割,同时对较小的子类进行划分合并。实验表明,WDCSS不仅能为具有各种不同聚类形状的数据集准确地分析出数据中存在的合理聚类和例外样本,而且避免了用户参数选择所造成聚类质量降低问题。 展开更多
关键词 WEB文档 语义相似度 算法 最小树
下载PDF
基于二元语义信息处理的最大树聚类方法 被引量:7
11
作者 于春海 樊治平 《系统工程与电子技术》 EI CSCD 北大核心 2006年第10期1519-1522,共4页
针对解决具有语言评价信息的多指标聚类分析问题,提出了一种基于二元语义信息处理的最大树聚类方法。该方法依据传统的最大树聚类分析方法的基本思想,采用二元语义概念对语言评价信息进行处理和运算,并对聚类对象进行分类,具有概念清晰... 针对解决具有语言评价信息的多指标聚类分析问题,提出了一种基于二元语义信息处理的最大树聚类方法。该方法依据传统的最大树聚类分析方法的基本思想,采用二元语义概念对语言评价信息进行处理和运算,并对聚类对象进行分类,具有概念清晰、计算简单、信息处理较为精确的特点。最后,通过一个算例说明了所给出的聚类方法。 展开更多
关键词 模糊分析 二元语义 语言评价信息 最大树
下载PDF
一种基于区间数多指标信息的FCM聚类算法 被引量:6
12
作者 于春海 樊治平 《运筹与管理》 CSCD 2004年第4期12-16,共5页
针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。文章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和... 针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。文章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后给出了基于区间数多指标信息的FCM聚类算法的计算步骤。该算法的特点是聚类中心的表现形式为精确的数值,给出的两个定理说明了该聚类算法的收敛性。最后,通过给出一个算例说明了本文给出的聚类算法。 展开更多
关键词 分析 区间 FCM算法 模糊划分 模糊集
下载PDF
IFCM:改进的区间值数据的模糊C-均值聚类算法 被引量:2
13
作者 张忠平 陈丽萍 王爱杰 《计算机工程与设计》 CSCD 北大核心 2008年第24期6320-6322,共3页
对基于区间值数据的模糊聚类算法进行了研究,介绍了具有控制区间大小对聚类结果影响的加权因子的模糊C-均值聚类新算法。针对区间值数据模糊C-均值聚类新算法提出了一个适应距离的弹性系数,使算法得到改进,既能利用传统的FCM算法,又考... 对基于区间值数据的模糊聚类算法进行了研究,介绍了具有控制区间大小对聚类结果影响的加权因子的模糊C-均值聚类新算法。针对区间值数据模糊C-均值聚类新算法提出了一个适应距离的弹性系数,使算法得到改进,既能利用传统的FCM算法,又考虑了区间大小对聚类结果的影响,同时也能发现不规则的聚类子集,使聚类结果更加准确。 展开更多
关键词 区间值数据 模糊C-均值 IFCM算法 自适应系数 原型
下载PDF
二元数据子空间聚类算法的初始化研究 被引量:2
14
作者 夏英 鲁宁 丰江帆 《计算机应用研究》 CSCD 北大核心 2009年第1期47-49,共3页
针对二元数据空间高维稀疏性的特点而提出的有限混合伯努利模型,能够快速寻找映射簇的模型框架;EM算法是数学模型进行参数迭代的重要方法,其算法的优劣很大程度上取决于其初始参数。对于运用EM算法来实现有限混合伯努利模型聚类算法已... 针对二元数据空间高维稀疏性的特点而提出的有限混合伯努利模型,能够快速寻找映射簇的模型框架;EM算法是数学模型进行参数迭代的重要方法,其算法的优劣很大程度上取决于其初始参数。对于运用EM算法来实现有限混合伯努利模型聚类算法已有许多研究,EM算法中参数的选取直接影响聚类算法的性能。引入Binning法和改变数据之间相似度测量方式、中心点的选取方式来进行初始化,从而大大减少聚类结果对初始参数的依赖,实验证明该算法是高效的、正确的。 展开更多
关键词 子空间 二元数据 有限混合伯努利模型 EM算法
下载PDF
区间值模糊软集的信息测度及其聚类算法 被引量:4
15
作者 彭新东 杨勇 《计算机应用》 CSCD 北大核心 2015年第8期2350-2354,2359,共6页
针对区间值模糊软集信息测度难以精确定义的问题,提出了区间值模糊软集的距离测度、相似度、熵、包含度、子集度的公理化定义,给出了区间值模糊软集的信息测度公式,并讨论了它们的转换关系。然后提出了一个基于相似度的聚类算法,该算法... 针对区间值模糊软集信息测度难以精确定义的问题,提出了区间值模糊软集的距离测度、相似度、熵、包含度、子集度的公理化定义,给出了区间值模糊软集的信息测度公式,并讨论了它们的转换关系。然后提出了一个基于相似度的聚类算法,该算法结合区间值模糊软集的特性,着重对给出评价对象的具有相似知识水平的专家进行聚类,同时讨论了算法的计算复杂度。最后通过实例说明该算法能有效地处理专家聚类问题。 展开更多
关键词 区间值模糊软集 信息测度 相似度 算法 计算复杂度
下载PDF
一种基于区间数的扩展FCM聚类算法 被引量:4
16
作者 薛联凤 李为相 《化工自动化及仪表》 CAS 北大核心 2010年第8期26-29,共4页
在区间值数据的聚类算法中,区间数之间的距离大多仅考虑两区间数的上下界值,其最大缺陷在于所定义的距离不满足视觉合理性。因此,区间值数据的聚类很难用传统的FCM方法。为了解决这个问题,本文引入了一种新的区间数的距离测度,扩展了一... 在区间值数据的聚类算法中,区间数之间的距离大多仅考虑两区间数的上下界值,其最大缺陷在于所定义的距离不满足视觉合理性。因此,区间值数据的聚类很难用传统的FCM方法。为了解决这个问题,本文引入了一种新的区间数的距离测度,扩展了一种可直接处理特征空间为区间数的聚类问题的FCM聚类算法。通过对比分析表明,该算法更具合理性及有效性。 展开更多
关键词 区间 算法 距离测度 FCM
下载PDF
基于语义准则函数的中文评论性文本极性聚类算法研究 被引量:1
17
作者 徐斌 张玉峰 《情报学报》 CSSCI 北大核心 2011年第5期451-455,共5页
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类... 通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类任务。经典的K-means均值聚类算法是聚类分析中使用最为广泛的算法之一,其具有诸多的优良特性和不足。针对上述情况,本文将语义引入经典K-means均值聚类算法中,构造了专门针对中文评论文本极性判断的极性词语义词典,提出了一种基于语义准则函数的K-means均值聚类算法。这项研究是运用基于语义的聚类方法对汉语主观性文本处理的一次探索。实验结果显示总平均召回率达到了80.70%,总平均精确率达到了67.75%,说明该算法是可行和有效的。 展开更多
关键词 准则函数 极性词语义词典 文本 评论 算法
下载PDF
基于遗传算法的区间数核模糊聚类方法 被引量:1
18
作者 任世锦 吕俊怀 《系统工程学报》 CSCD 北大核心 2008年第5期611-616,共6页
针对现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题,本文提出了一种基于核方法的区间数模糊聚类算法.该方法通过设计合适的核函数,有效地对非对称数据以及混合模式原型的数据结构进行聚类,同时避免了直接在高维... 针对现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题,本文提出了一种基于核方法的区间数模糊聚类算法.该方法通过设计合适的核函数,有效地对非对称数据以及混合模式原型的数据结构进行聚类,同时避免了直接在高维特征空间求解聚类问题.本文采用区间数遗传算法来求取高度非凸聚类优化问题得到聚类问题的全局最优解.仿真实例说明了本文算法的有效性. 展开更多
关键词 分析 区间 核方法 遗传算法 模糊方法
下载PDF
基于改进模糊聚类算法的大数据随机挖掘仿真 被引量:1
19
作者 李萍 刘金金 《计算机仿真》 2024年第2期496-499,521,共5页
大数据挖掘是从大量有噪声的、随机模糊的大数据中提取有价值信息的过程,由于海量大数据具有多维性、稀疏性以及动态性等特点,准确获取其分布特征的难度较大,随机挖掘难以直接实现。为此提出基于改进模糊聚类算法的大数据随机挖掘方法... 大数据挖掘是从大量有噪声的、随机模糊的大数据中提取有价值信息的过程,由于海量大数据具有多维性、稀疏性以及动态性等特点,准确获取其分布特征的难度较大,随机挖掘难以直接实现。为此提出基于改进模糊聚类算法的大数据随机挖掘方法。利用建立的语义概念树模型获取大数据的特征分布关系,并根据模糊语义分析法得出大数据的语义相似性、关联性条件,提取大数据特征。优先确定最佳聚类数,采用改进模糊聚类算法对其聚类,实现基于改进模糊算法的大数据随机挖掘。实验结果表明,上述方法的大数据模糊聚类效果较好,随机挖掘准确率可达到95%以上,实验所得结果验证了上述方法较强的应用有效性。 展开更多
关键词 改进模糊算法 大数据随机挖掘 语义概念树 特征提取 特征
下载PDF
运用区间二型模糊集的半监督模糊聚类算法 被引量:1
20
作者 杨昔阳 陈豪 张诗晴 《泉州师范学院学报》 2023年第2期1-8,共8页
将区间二型模糊集引入半监督聚类,提出一种运用区间二型模糊集的半监督聚类算法.该算法以区间二型模糊集为隶属度,将已标识样本的类别标签融入目标函数,使得聚类算法可以在已标识样本类别信息的引导下,得到合理的隶属度.实验表明,相比... 将区间二型模糊集引入半监督聚类,提出一种运用区间二型模糊集的半监督聚类算法.该算法以区间二型模糊集为隶属度,将已标识样本的类别标签融入目标函数,使得聚类算法可以在已标识样本类别信息的引导下,得到合理的隶属度.实验表明,相比其他聚类模型,结合半监督机制和区间二型模糊集的聚类算法具有更好的聚类性能. 展开更多
关键词 半监督算法 区间二型模糊集 模糊 半监督机制
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部