期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于凝聚式层次聚类算法的标签聚类研究 被引量:40
1
作者 曹高辉 焦玉英 成全 《现代图书情报技术》 CSSCI 北大核心 2008年第4期23-28,共6页
对标签、标注、大众分类等概念进行界定,指出现有标签标注系统中存在着标签描述信息的精确度不高、标签检索结果相关度低、标签缺乏有效组织等问题,提出采用凝聚式聚类算法对标签聚类,从而实现对标签的重新组织,为用户提供更好的标签导... 对标签、标注、大众分类等概念进行界定,指出现有标签标注系统中存在着标签描述信息的精确度不高、标签检索结果相关度低、标签缺乏有效组织等问题,提出采用凝聚式聚类算法对标签聚类,从而实现对标签的重新组织,为用户提供更好的标签导航、浏览机制。最后通过实验对标签聚类方法进行验证。 展开更多
关键词 标签 标签 层次
下载PDF
面向凝聚式层次聚类算法实现的矩阵存储数据结构研究 被引量:5
2
作者 张振亚 程红梅 +1 位作者 王进 王煦法 《计算机科学》 CSCD 北大核心 2006年第1期14-17,共4页
快速查找、扩张、收缩是凝聚式层次聚类算法快速实现对相似度/距离矩阵存储的基本要求。本文提出了基于十字链表和平衡二叉树的复合数据结构 CrossAVL 用于矩阵的存储,给出了查找、扩张,收缩操作的实现并对其时间复杂度进行了分析。实... 快速查找、扩张、收缩是凝聚式层次聚类算法快速实现对相似度/距离矩阵存储的基本要求。本文提出了基于十字链表和平衡二叉树的复合数据结构 CrossAVL 用于矩阵的存储,给出了查找、扩张,收缩操作的实现并对其时间复杂度进行了分析。实验结果表明,CrossAVL 对快速要求能够较好地满足。 展开更多
关键词 层次 矩阵 十字链表 平衡二叉树 存储数据 距离矩阵 结构研究 算法实现 层次
下载PDF
犹豫模糊语言凝聚式层次聚类算法与应用 被引量:7
3
作者 张振宇 林杰 苗润生 《统计与决策》 CSSCI 北大核心 2019年第21期71-74,共4页
聚类算法作为一种重要的处理数据信息的工具被广泛运用。文章基于犹豫模糊语言集的定义、距离测度函数、集成函数等,结合凝聚式层次聚类算法,提出一种犹豫模糊语言凝聚式聚类算法。通过汽车口碑聚类为例,基于汽车之家论坛在线评论信息,... 聚类算法作为一种重要的处理数据信息的工具被广泛运用。文章基于犹豫模糊语言集的定义、距离测度函数、集成函数等,结合凝聚式层次聚类算法,提出一种犹豫模糊语言凝聚式聚类算法。通过汽车口碑聚类为例,基于汽车之家论坛在线评论信息,对汽车口碑进行聚类,验证了该算法的可行性。 展开更多
关键词 犹豫模糊语言集 距离测度函数 集成函数 层次
下载PDF
基于网络性能的计算网格主机聚类 被引量:7
4
作者 张伟哲 胡铭曾 刘凯鹏 《计算机研究与发展》 EI CSCD 北大核心 2004年第12期2135-2140,共6页
网络主机聚类是随着网格任务调度技术发展而产生的一个新技术 ,基于网络性能的主机聚类算法的时间效率和结果准确性有待于进一步提高 为解决这一问题 ,提出了实用且高效的基于密度的计算网格主机聚类启发式算法 对该算法性能进行多角... 网络主机聚类是随着网格任务调度技术发展而产生的一个新技术 ,基于网络性能的主机聚类算法的时间效率和结果准确性有待于进一步提高 为解决这一问题 ,提出了实用且高效的基于密度的计算网格主机聚类启发式算法 对该算法性能进行多角度分析和大规模仿真实验 ,有力地证明了该算法不仅具有较优的时间效率 ,而且在有效结果簇。 展开更多
关键词 网格计算 网格调度 主机 层次式聚类 K-均值 基于密度
下载PDF
基于特征的机载导弹阵地抢修性聚类评估方法
5
作者 陈希林 肖明清 王学奇 《系统工程与电子技术》 EI CSCD 北大核心 2008年第6期1093-1097,共5页
结合机载导弹阵地战场抢修决策平台的开发,建立了机载导弹阵地装备抢修性评价体系,同时为了合理引入抢修性评价过程中的专家分歧,提出了基于特征的聚类评估方法。该方法首先将评估矩阵进行奇异值分解,提取对矩阵特征贡献率大的奇异值进... 结合机载导弹阵地战场抢修决策平台的开发,建立了机载导弹阵地装备抢修性评价体系,同时为了合理引入抢修性评价过程中的专家分歧,提出了基于特征的聚类评估方法。该方法首先将评估矩阵进行奇异值分解,提取对矩阵特征贡献率大的奇异值进行分解逆运算,然后选取欧氏距离和离差平方和作为层次式聚类方法的分类指标,对数据进行聚类分析。文末应用上述评价体系和评估方法对某型机载导弹阵地典型装备进行了抢修性评估。应用表明:适当引入专家分歧使得聚类分析结果趋向合理化。所提评估方法对群决策问题适用。 展开更多
关键词 战场抢修 抢修性 奇异值分解 层次式聚类方法 导弹装备
下载PDF
企业生命周期视角下的政府补助与中小企业价值创造关系研究——基于凝聚式层次聚类和粗糙集的规律挖掘 被引量:4
6
作者 朱卫东 田雨绯 +2 位作者 张福伟 胡雪 戴潇雅 《中国管理科学》 CSSCI CSCD 北大核心 2023年第8期80-89,共10页
政府通过多种类型的补助支持企业可持续发展,不同类型的政府补助支持企业解决特定发展问题,如何发挥补助资源的价值提升效应是政府补助研究的重要问题。本文将政府补助按资助目的划分为创新补助、企业发展补助和社会责任补助三种类型,... 政府通过多种类型的补助支持企业可持续发展,不同类型的政府补助支持企业解决特定发展问题,如何发挥补助资源的价值提升效应是政府补助研究的重要问题。本文将政府补助按资助目的划分为创新补助、企业发展补助和社会责任补助三种类型,研究不同类型的政府补助与处于不同生命周期阶段的中小企业价值创造效率的关联关系。采用了凝聚式层次聚类与粗糙集规律挖掘模型。在分析企业价值创造影响因素的基础上,建立政府补助对企业价值创造的影响机制,运用凝聚式层次聚类解决粗糙集模型中的数据离散问题,构造政府补助、价值创造影响因素与中小企业不同发展阶段价值创造规律挖掘模型。以2009—2018年中小企业板上市公司为样本,采用国泰安数据库的数据和在该数据库基础上挖掘分类的政府补助数据。实证结果表明,高效率的企业价值创造与不同类型政府补助和影响因素之间存在非线性组态结构关系,不同类型政府补助与企业生命周期、影响价值创造因素的特征共同决定了企业高效率的价值创造。开拓了用数据挖掘方法在政府补助与企业价值创造关联关系的研究,为探索两者之间的非线性组态结构关系提供了理论基础与应用的经验。研究结论对提升政府补助的资助效率具有借鉴意义。 展开更多
关键词 政府补助 价值创造 企业生命周期 粗糙集 层次
原文传递
基于PLSI的标签聚类研究 被引量:4
7
作者 吴志媛 钱雪忠 《计算机应用研究》 CSCD 北大核心 2013年第5期1316-1319,共4页
针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜... 针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜在语义下的条件概率,生成概率向量;在此基础上,提出凝聚式层次k中心点(hierarchical agglomerative K-mediods,HAK-mediods)聚类算法对概率向量进行聚类,并进行了相关对比实验。实验结果表明,HAK-mediods算法的聚类效果要好于传统的聚类算法,从而验证了该算法的可行性和有效性。 展开更多
关键词 大众分 概率潜在语义索引 语义标签 回火期望最大化算法 层次k中心点
下载PDF
面向私有二进制协议的报文聚类方法 被引量:1
8
作者 徐旭东 张志祥 张献 《计算机科学与探索》 CSCD 北大核心 2020年第6期958-965,共8页
报文聚类是协议逆向工程的主要步骤之一。针对私有二进制协议报文,目前的报文聚类方法存在报文向量化特征冗余的问题,而且传统聚类方法存在聚类中心和聚类簇数难以确定的问题。根据n-gram序列化的思想,构造报文的序列项-位置矩阵,从中... 报文聚类是协议逆向工程的主要步骤之一。针对私有二进制协议报文,目前的报文聚类方法存在报文向量化特征冗余的问题,而且传统聚类方法存在聚类中心和聚类簇数难以确定的问题。根据n-gram序列化的思想,构造报文的序列项-位置矩阵,从中挖掘频繁项,构造报文特征向量,有效去除了报文向量化中的序列噪声;采用轮廓系数指导分拆式层次聚类,避免了初始聚类簇数和聚类中心的选择,以实现无监督条件下的私有二进制协议报文的聚类。在AIS、DNS、ICMP、ARP四种协议共七类报文的数据集上测试,通过t-SNE可视化界面观察报文分布情况,特征向量化的方法具有很好的分布和特征表达效果;相较于传统的聚类方法,基于轮廓系数的分拆式层次聚类在纯净度和F1值上具有明显提升。 展开更多
关键词 二进制协议 报文 特征向量生成 分拆层次 频繁项挖掘
下载PDF
一种基于软边界球分的分裂式层次聚类算法 被引量:2
9
作者 谢振平 王士同 王晓明 《模式识别与人工智能》 EI CSCD 北大核心 2008年第4期559-568,共10页
层次聚类是一种常用的聚类方法,但传统的层次聚类面临着计算复杂度较大、抗噪音和例外点干扰能力较弱的问题.本文以可能性聚类方法为基础,首先提出软边界球分算法,可实现对数据集合理分裂.随后将这一策略与分裂式层次聚类过程相结合,构... 层次聚类是一种常用的聚类方法,但传统的层次聚类面临着计算复杂度较大、抗噪音和例外点干扰能力较弱的问题.本文以可能性聚类方法为基础,首先提出软边界球分算法,可实现对数据集合理分裂.随后将这一策略与分裂式层次聚类过程相结合,构造一种基于软边界球分的分裂式层次聚类算法(SHPDHC).SHPDHC 具有较低的计算复杂度.与此同时,它能较好地发现自然数据类,确定出合理的聚类数目,并能自适应划分出例外数据点.理论分析与对人工数据集的聚类实验结果证明了上述几点.最后我们将 SHPDHC 应用于一类阴影图像的分割中,同样取得良好效果. 展开更多
关键词 软边界球分(SHP) 分裂层次 图像分割 例外
原文传递
基于突发主题词和凝聚式层次聚类的微博突发事件检测研究 被引量:7
10
作者 丁晟春 龚思兰 李红梅 《现代图书情报技术》 CSSCI 2016年第7期12-20,共9页
【目的】实时、准确、高效地检测出海量微博中的突发事件,为舆情应急管理提供重要的决策信息支持。【方法】引入参照时间窗机制,设计词频、文档频率、话题标签(Hashtag)、词频增长率4类特征的选择与计算方法,基于动态阈值实现对突发主... 【目的】实时、准确、高效地检测出海量微博中的突发事件,为舆情应急管理提供重要的决策信息支持。【方法】引入参照时间窗机制,设计词频、文档频率、话题标签(Hashtag)、词频增长率4类特征的选择与计算方法,基于动态阈值实现对突发主题词的抽取。在此基础上,将微博文本表示为突发主题词的特征向量,使用凝聚式层次聚类算法实现了突发事件的检测。【结果】将实验结果结合实例进行分析,突发事件检测达到80%的准确率,验证该方法的可行性和有效性。【局限】由于语料数据和研究范围的限制,还未实现对所检测突发事件的自动描述,对网民情感、事件间语义关系等要素的分析及考量也存在一定欠缺。【结论】本研究突破以往相关研究中文本内容质量、文本形式、突发特征抽取结果的局限,提升微博突发事件检测的效率。 展开更多
关键词 突发事件检测 突发主题词 层次 网络舆情 微博
原文传递
考虑不同故障穿越模式的双馈风电场短路电流计算等值建模 被引量:6
11
作者 令狐桐雯 韩民晓 +1 位作者 霍启迪 唐晓俊 《南方电网技术》 CSCD 北大核心 2022年第10期28-37,共10页
合理的风电场故障暂态等值建模是风电并网运行分析的基础。双馈风电场中各机组在故障时的运行点和故障穿越模式不尽相同,单机倍乘无法准确表征整个风电场暂态特性。以风电场输出短路电流一致为目标,理论推导不同故障穿越模式下单机输出... 合理的风电场故障暂态等值建模是风电并网运行分析的基础。双馈风电场中各机组在故障时的运行点和故障穿越模式不尽相同,单机倍乘无法准确表征整个风电场暂态特性。以风电场输出短路电流一致为目标,理论推导不同故障穿越模式下单机输出短路电流解析式,以表征外界故障的电压跌落和表征风机自身运行点的转速作为分群指标,在故障不同阶段采用不同指标权重,建立风机相似度距离矩阵。基于层次聚类算法对风电场进行划分,按照输出短路电流不变的原则对同群风机参数进行等值。对比在PSCAD中搭建的风电场详细和等值模型,结果表明,所建立的等值模型可以全面描述风电场出口短路电流特性,等值方法合理有效。 展开更多
关键词 故障穿越 双馈风电场 分群指标 层次 短路电流 等值建模
下载PDF
一种利用代表点的有效聚类算法设计与实现 被引量:10
12
作者 陈恩红 王上飞 +1 位作者 宁岩 王煦法 《模式识别与人工智能》 EI CSCD 北大核心 2001年第4期417-422,共6页
本文针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,设计了一种有效的聚类算法。该方法首先从聚类簇中选取充分分散的若干数据点,然后将它们向聚类簇的重心收缩,依此得到... 本文针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,设计了一种有效的聚类算法。该方法首先从聚类簇中选取充分分散的若干数据点,然后将它们向聚类簇的重心收缩,依此得到的多个数据点作为聚类簇的代表。通过选取多个代表点,本算法可以捕捉到不同形状的聚类簇的几何特征,且受离群数据的影响较小,实验结果表明,该算法处理复杂数据是有效的。 展开更多
关键词 层次式聚类 代表点 有效算法 数据挖掘 识别
原文传递
基于社会性标注的本体学习方法 被引量:14
13
作者 刘凯鹏 方滨兴 《计算机学报》 EI CSCD 北大核心 2010年第10期1823-1834,共12页
由相互协作的用户在社会性标注系统中产生的大量的标注数据可以作为各种语义网应用的数据源.文中提出一种基于社会性标注的本体学习方法来挖掘蕴涵在社会性标注中的语义信息,提出一种隐含包容层次结构来刻画标签空间中潜在的结构,并基... 由相互协作的用户在社会性标注系统中产生的大量的标注数据可以作为各种语义网应用的数据源.文中提出一种基于社会性标注的本体学习方法来挖掘蕴涵在社会性标注中的语义信息,提出一种隐含包容层次结构来刻画标签空间中潜在的结构,并基于此模型推导出本体学习算法.首先利用集合论的方法确定标签之间的包容关系,并将其表示为标签包容关系图.在将此图转化为层次关系时,为解决包容关系的不一致性,提出一种基于随机游走的标签普遍性排序方法.最后提出一种自顶向下的凝聚式层次聚类算法来生成概念层次结构.在实际社会性标注系统中采集的数据集上进行的实验表明,与目前的代表性方法相比,文中提出的方法在性能上有明显的提高. 展开更多
关键词 社会性标注 本体学习 包容关系 随机游走 层次
下载PDF
基于多种词特征的微博突发事件检测方法 被引量:5
14
作者 张仰森 段宇翔 +1 位作者 王建 吴云芳 《电子学报》 EI CAS CSCD 北大核心 2019年第9期1919-1928,共10页
近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件... 近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件给社会带来的危害.首先根据时间信息对微博数据进行时间切片,对每一个时间窗口内的数据分别计算各个词语的词频特征、话题标签特征和词频增长率特征;然后基于D-S证据理论和层次分析法,确定词的各个特征权重,并进行加权融合得到词的突发特征值,将突发特征值大的词挑选出来构成突发特征词集,构建基于共现度和结合紧密度的突发事件特征词集的耦合度矩阵;最后将该耦合度矩阵作为凝聚式层次聚类算法的输入,生成一棵由突发词为叶子节点的二叉树,并采用内部相似度的二叉树剪枝算法对聚类结果进行划分,即可实现对相应时间窗口突发事件的检测.实验结果表明,基于突发词的事件检测模型在簇内部相似度阈值等于1.1时效果最好,正确率达到0.8462、召回率达到0.8684、F值为0.8571,表明了本文所提方法的有效性. 展开更多
关键词 微博 突发事件 突发特征词 D-S证据理论 层次
下载PDF
基于标题的BBS热点话题挖掘——以南京大学小百合BBS为例 被引量:9
15
作者 刘骅 朱庆华 《现代情报》 CSSCI 2013年第1期162-165,共4页
目的:在使用数据挖掘发现BBS热点话题的过程中,标题的重要性经常被忽略。本文旨在论证和凸显标题在BBS热点话题挖掘中的重要作用,同时区别在BBS热点话题挖掘时标题和文本内容作用的不同。方法:以南京大学小百合BBS的每日10大热门话题帖... 目的:在使用数据挖掘发现BBS热点话题的过程中,标题的重要性经常被忽略。本文旨在论证和凸显标题在BBS热点话题挖掘中的重要作用,同时区别在BBS热点话题挖掘时标题和文本内容作用的不同。方法:以南京大学小百合BBS的每日10大热门话题帖子的标题为数据样本,采用凝聚式层次聚类法进行数据的聚类。结果:将270条样本数据聚为单类,选取其中有代表性的前五组进行讨论。结论:仅凭标题内容就能够有效挖掘出在一段时间内BBS上的热点主题,证明了标题在BBS热点话题挖掘中的重要性。 展开更多
关键词 BBS 热点话题 数据挖掘 层次
下载PDF
一种用于专利实体的实体消歧方法 被引量:3
16
作者 王琰炎 王裴岩 蔡东风 《沈阳航空航天大学学报》 2015年第1期77-83,共7页
将实体搜索技术应用于中文专利摘要文本,并在实体搜索过程中使用了实体消歧技术,得到用户最关注的实体相关信息。在充分分析了专利摘要文本的特点的基础上,提出一种面向专利实体的消歧方法。使用基于IPC和向量空间模型的词向量表示法,... 将实体搜索技术应用于中文专利摘要文本,并在实体搜索过程中使用了实体消歧技术,得到用户最关注的实体相关信息。在充分分析了专利摘要文本的特点的基础上,提出一种面向专利实体的消歧方法。使用基于IPC和向量空间模型的词向量表示法,结合凝聚式层次聚类算法,得到专利实体消歧结果。根据对比实验的结果能够得出结论,本方法能够实现准确的实体消歧,评测结果高达78.9%。 展开更多
关键词 专利实体 实体搜索 实体消歧 IPC 层次
下载PDF
基于AHC-GP混合模型的火电机组报警数据过滤方法
17
作者 吴铮 张悦 +1 位作者 董泽 封官斌 《热能动力工程》 CAS CSCD 北大核心 2023年第3期174-182,共9页
针对火电机组设备工况复杂、报警系统效率低下及“报警泛滥”现象频发等问题,提出了基于AHC-GP混合模型的火电机组报警数据过滤方法,消除冗余性报警。首先,采用近邻传播算法(AP)结合类间类内划分指标(BWP)确定最佳聚类数目,再使用凝聚... 针对火电机组设备工况复杂、报警系统效率低下及“报警泛滥”现象频发等问题,提出了基于AHC-GP混合模型的火电机组报警数据过滤方法,消除冗余性报警。首先,采用近邻传播算法(AP)结合类间类内划分指标(BWP)确定最佳聚类数目,再使用凝聚式层次聚类算法(AHC)进行聚类,区分各类复杂工况。其次,利用高斯过程模型(GP)结合后验报警概率估计值实现机组冗余性报警数据的准确过滤。最后,采用某电厂1 000 MW机组在3种典型故障下的实际主蒸汽温度、主蒸汽压力等报警数据作为实验数据集,验证所提方法有效性。结果表明:AHC-GP混合模型相较于单一高斯过程模型,冗余性报警数据的过滤准确率提高了10.7%,误判率降低了50.1%,证明了模型的有效性;与支持向量机和梯度提升决策树等成熟算法相比,漏检率、误判率均较低,具有良好的报警数据过滤性能,可准确定位冗余性报警数据,减少“报警泛滥”问题的发生。 展开更多
关键词 高斯过程 层次 近邻传播算法 报警泛滥 火电机组
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部