期刊文献+
共找到44,948篇文章
< 1 2 250 >
每页显示 20 50 100
星形细胞瘤的基因表达谱和Hierarchical聚类研究 被引量:2
1
作者 陈菊祥 卢亦成 +6 位作者 楼美清 胡国汉 骆纯 袁国良 蔡茹钰 应康 谢毅 《中国临床神经外科杂志》 2004年第2期97-101,共5页
目的探讨人脑星形细胞瘤发生发展中相关基因及分类特征基因的表达。方法用含13939种人基因的BioStarH140S芯片,以正常脑及18例胶质瘤组织总RNA制备的探针杂交芯片,ScanArray4000扫描信号,提取脑及不同级别星形细胞瘤的差异基因并行生物... 目的探讨人脑星形细胞瘤发生发展中相关基因及分类特征基因的表达。方法用含13939种人基因的BioStarH140S芯片,以正常脑及18例胶质瘤组织总RNA制备的探针杂交芯片,ScanArray4000扫描信号,提取脑及不同级别星形细胞瘤的差异基因并行生物信息分析,Hierarchical聚类提取差异基因的特征。结果星形细胞瘤中筛选出438条(3.14%)差异表达基因;信息分析与细胞信号、细胞骨架和运动、癌基因及抑癌基因等多类基因密切相关;与分类相关的特征基因有MAP7、DBCCR1、PCDHA5、KCNAB1、NAP1L2等。表达谱将星形细胞瘤分成两类,与临床组织病理分类基本一致。结论芯片是基因分析和筛选肿瘤标志性基因的有效手段,可客观分析星形细胞瘤发展及预后;分类特征基因为星形细胞瘤侵袭性和预后判断提供依据,有助于临床诊治。 展开更多
关键词 星形细胞瘤 基因芯片 表达谱 hierarchical聚类
下载PDF
基于马尔可夫聚类的隐私高维数据发布方法
2
作者 刘卓群 龙士工 +1 位作者 张珺铭 刘光源 《计算机工程与设计》 北大核心 2025年第1期117-123,共7页
针对现有差分隐私的方法在处理高维数据发布时面临计算成本高、数据精度低和中心服务器不可信任的问题,提出一种基于马尔可夫聚类的隐私高维数据发布方法MCL-LDP。基于在用户本地实现对用户数据的隐私保护,中心服务器接收到用户本地化... 针对现有差分隐私的方法在处理高维数据发布时面临计算成本高、数据精度低和中心服务器不可信任的问题,提出一种基于马尔可夫聚类的隐私高维数据发布方法MCL-LDP。基于在用户本地实现对用户数据的隐私保护,中心服务器接收到用户本地化差分隐私保护的数据后,构建无向依赖图矩阵表示高维数据的复杂的属性关联性,基于马尔可夫聚类将高维数据属性集分割成多个低维属性簇,利用EM算法计算低维属性簇和重叠属性簇的边缘分布、估计原始数据的联合分布,通过采样合成新的数据集进行发布。实验结果表明,所提出方法在发布高维数据集上有较好的精度、较少的迭代次数和较高的计算效率。 展开更多
关键词 高维数据 本地化差分隐私 马尔可夫 数据发布 联合分布估计 属性关联性 数据合成
下载PDF
基于k-center聚类和最近邻中心的公平数据汇总
3
作者 何艳 黄巧玲 郑伯川 《西华师范大学学报(自然科学版)》 2025年第1期95-103,共9页
公平数据汇总是指从每种数据类别中选择有代表性的子集,且满足公平性要求。在大数据时代,每种类别的数据都是海量的,因此公平数据汇总研究具有非常重要的现实意义。为了使公平数据汇总的数据点更具有代表性,提出了基于k-center聚类和最... 公平数据汇总是指从每种数据类别中选择有代表性的子集,且满足公平性要求。在大数据时代,每种类别的数据都是海量的,因此公平数据汇总研究具有非常重要的现实意义。为了使公平数据汇总的数据点更具有代表性,提出了基于k-center聚类和最近邻中心的公平数据汇总算法。算法主要包括2个基本步骤:(1)通过k-center聚类,将k个簇中心作为当前汇总结果;(2)选择满足公平约束的原簇中心的最近邻点作为新簇中心。由于更新簇中心时选择的是原簇中心的最近邻点,因此相对随机选择的数据点,最近邻点更具有代表性,是除原始簇中心外的次优代表点。同时,寻找最近邻点作为新的簇中心能最大限度减少公平代价。在2个模拟数据集和6个UCI真实数据集上的对比实验结果表明,所提出的算法在近似因子和公平代价方面都优于对比算法,说明所提出的算法获得的数据汇总更具有代表性。 展开更多
关键词 最近邻点 k-center 数据汇总 公平约束
下载PDF
路径掩码自编码器引导无监督属性图节点聚类
4
作者 丁新宇 孔兵 +2 位作者 陈红梅 包崇明 周丽华 《计算机科学》 北大核心 2025年第1期160-169,共10页
图聚类的目的在于发现网络的社区结构。针对目前聚类方法无法很好地获取网络深层潜在社区信息,且不能对特征进行合适的信息整合导致节点社区语义不清晰的问题,提出了一种路径掩码自编码器引导无监督属性图节点聚类模型(Path-Masked Auto... 图聚类的目的在于发现网络的社区结构。针对目前聚类方法无法很好地获取网络深层潜在社区信息,且不能对特征进行合适的信息整合导致节点社区语义不清晰的问题,提出了一种路径掩码自编码器引导无监督属性图节点聚类模型(Path-Masked Autoencoder Guiding Unsupervised Attribute Graph Node Clustering, PAUGC)。该模型通过对网络进行随机路径掩码后使用自编码器来深度挖掘网络拓扑结构,从而获得良好的全局结构语义信息,利用规范性方法来对特征进行信息整合,使节点特征能够更好地表征特征的类别信息。此外,模型结合模块最大化来抓取整个图中的底层社区群落信息,目的在于更合理地将其融合到低维度节点特征中。最后通过自训练聚类来不断迭代优化更新聚类表示以获得最终的节点特征。通过在8个基准数据集上与11种经典方法进行大量实验对比,证明了PAUGC的有效性。 展开更多
关键词 深度图 无监督学习 特征信息整合 模块最大化 自训练
下载PDF
基于聚类的压水堆栅元均匀化参数压缩方法研究
5
作者 李天涯 罗琦 +6 位作者 姚栋 何彩云 蔡云 王丹 段永强 廖鸿宽 肖鹏 《原子能科学技术》 北大核心 2025年第1期110-117,共8页
为了降低反应堆物理高保真数值计算中栅元均匀化参数的数量及存储规模,提升高保真数值计算方法的实用性,本研究基于聚类的方法,通过对压水堆典型组件聚类数目和聚类特征的研究,确定了以快热通量比为聚类特征和5为聚类数目的先分类后聚... 为了降低反应堆物理高保真数值计算中栅元均匀化参数的数量及存储规模,提升高保真数值计算方法的实用性,本研究基于聚类的方法,通过对压水堆典型组件聚类数目和聚类特征的研究,确定了以快热通量比为聚类特征和5为聚类数目的先分类后聚类多层次聚类方法;推导了聚类栅元超级均匀化方法,建立了基于聚类的压水堆栅元均匀化参数压缩方法,并在华龙一号堆芯问题上验证了此方法的聚类效果。研究结果表明,对于华龙一号堆芯问题,该方法能保证较高的精度,并大幅降低栅元均匀化参数规模。因此,本研究建立的栅元均匀化参数压缩方法能用于压水堆栅元均匀化参数的压缩,降低其存储规模。 展开更多
关键词 栅元均匀化参数 参数压缩
下载PDF
基于聚类算法的路径频散曲线拾取方法
6
作者 何建 张建中 黄忠来 《中国海洋大学学报(自然科学版)》 CAS 北大核心 2025年第1期149-157,共9页
多道地震资料面波分析方法是目前确定近地表横波速度的有效工具,但由于反演的一维横波速度模型仅反映了检波器排列中点垂直方向上的横波速度变化,因此其横向分辨率较差。与面波分析方法相比,面波层析反演方法具有更大的潜力来提高近地... 多道地震资料面波分析方法是目前确定近地表横波速度的有效工具,但由于反演的一维横波速度模型仅反映了检波器排列中点垂直方向上的横波速度变化,因此其横向分辨率较差。与面波分析方法相比,面波层析反演方法具有更大的潜力来提高近地表特征的横向分辨率。但是面波层析反演方法需要从大量检波器对之间(路径)的平均频散能量谱中拾取频散曲线,人工拾取将耗费大量的时间成本。针对这个问题,本文进行了聚类算法自动从路径平均频散能量谱中拾取相速度频散曲线的研究。理论模型正演数据以及实际资料面波数据的实验结果都验证了本文方法的正确性。 展开更多
关键词 算法 频散曲线 面波层析反演 横波速度
下载PDF
基于加权锚点的自适应多视图互补聚类算法
7
作者 区卓越 邓秀勤 陈磊 《计算机应用》 北大核心 2025年第1期115-126,共12页
在多视图聚类问题中,充分挖掘各视图间的关联信息,并降低冗余信息对聚类效果的影响是当前亟须解决的问题,但现有算法会忽略各视图间的互补性及差异性,或没有考虑冗余信息带来的干扰,从而导致聚类效果不佳。针对这些局限性,提出一种基于... 在多视图聚类问题中,充分挖掘各视图间的关联信息,并降低冗余信息对聚类效果的影响是当前亟须解决的问题,但现有算法会忽略各视图间的互补性及差异性,或没有考虑冗余信息带来的干扰,从而导致聚类效果不佳。针对这些局限性,提出一种基于加权锚点的自适应多视图互补聚类算法(SMCWA)。在应对高维多视图数据的挑战时,首先,将特征直连迁移至锚点机制,从而融合各锚图来利用视图间的互补性信息;其次,在迭代过程中,使用加权矩阵动态确定各锚点的权重,从而弱化冗余信息的表达;最后,使用自动权重机制为各视图自适应地分配适当的权重,以利用视图间的差异性。将上述优化步骤整合至同一算法中,使视图互补性、冗余信息的弱化以及视图差异性在多步迭代中相互促进、相互学习,进而提高聚类效果。实验结果表明,在BDGP(Berkeley Drosophila Genome Project)数据集上,SMCWA在马修斯相关系数(MCC)上较谱聚类算法SC-Concat提升了41.75%;在CCV(Columbia Consumer Video)数据集上,SMCWA在MCC上较大规模线性时间多视图子空间聚类(LMVSC)算法提升了11.83%;在Caltech101-all数据集上,SMCWA在MCC上较谱聚类算法SC-Best提升了19.57%,说明该算法可充分考虑视图间的互补性信息、视图间的差异和冗余信息来提高聚类效果。 展开更多
关键词 自动权重机制 互补性 锚点机制 子空间 多视图
下载PDF
基于加权聚类和DNN的KR法脱硫剂加入量预报模型
8
作者 李威 熊凌 +3 位作者 罗钟邱 吴经纬 万诗斐 但斌斌 《炼钢》 北大核心 2025年第1期12-18,44,共8页
为了准确预测铁水KR脱硫工序中的脱硫剂加入量,提出了一种基于密度的聚类方法(DBSCAN)和深度神经网络(DNN)相结合的建模方法。首先计算Spearman相关系数筛选出与脱硫剂加入量相关性较强的6个输入特征;基于筛选后的特征,利用DNN对数据集... 为了准确预测铁水KR脱硫工序中的脱硫剂加入量,提出了一种基于密度的聚类方法(DBSCAN)和深度神经网络(DNN)相结合的建模方法。首先计算Spearman相关系数筛选出与脱硫剂加入量相关性较强的6个输入特征;基于筛选后的特征,利用DNN对数据集建立脱硫剂加入量预测模型;通过SHapley Additive exPlanations(SHAP)方法解释DNN模型,计算出各个特征对模型输出的贡献程度,根据得到的权重代入DBSCAN聚类算法中对某炼钢厂的脱硫实际生产数据进行聚类,保留清洗后的数据集;最后,通过五折交叉验证的方法对比了数据清洗前后的支持向量回归(SVR)、随机森林(RF)、极限梯度提升(XGBoost)、BP神经网络、深度神经网络(DNN)的预测模型性能。试验结果表明,使用清洗后的数据集建立的脱硫剂加入量预测模型的均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、决定系数(R^(2))较原数据集平均提高了33.6%、15.5%、12.9%、6.9%。 展开更多
关键词 KR脱硫 SHAP DBSCAN DNN 预测模型
下载PDF
基于反向最近邻的密度估计聚类算法
9
作者 许梅梅 侯新民 《计算机工程与应用》 北大核心 2025年第1期165-173,共9页
基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类... 基于相互最近邻的密度峰聚类算法(DenMune)通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪声点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其他经典算法,该算法具有更好的聚类效果。 展开更多
关键词 反向最近邻 局部密度 密度算法 子簇融合
下载PDF
基于层次近邻传播聚类的用户低电压越限模式挖掘方法
10
作者 沈枢昊 钟庆 +3 位作者 许中 王钢 李海锋 汪隆君 《电力工程技术》 北大核心 2025年第1期30-38,共9页
开展用户低电压越限模式挖掘工作可以为用户低电压问题的治理提供指导。针对目前台区低电压用户电压复杂多变、低电压越限模式未知的问题,文中提出基于层次近邻传播(hierarchical affinity propagation, HAP)聚类的用户低电压越限模式... 开展用户低电压越限模式挖掘工作可以为用户低电压问题的治理提供指导。针对目前台区低电压用户电压复杂多变、低电压越限模式未知的问题,文中提出基于层次近邻传播(hierarchical affinity propagation, HAP)聚类的用户低电压越限模式挖掘方法。首先,通过HAP聚类算法对大规模低电压用户电压数据集进行聚类分析,获得若干聚类簇。然后,将不同的聚类簇视作不同的低电压越限模式,并从越限时长和越限电压幅值两方面定义低电压越限模式的4项基本特征指标,通过计算各聚类簇的基本特征指标,反映其所对应低电压越限模式的特征。最后,将该方法运用到某地区低电压用户的电压数据集中,有效挖掘出该地区低电压用户的4种低电压越限模式,从而根据不同低电压越限模式的特征,有针对性地开展低电压用户的监管、分析工作,并制定用户低电压问题治理的优先级。 展开更多
关键词 低电压用户 层次近邻传播(HAP) 低电压越限模式 越限时长 越限电压幅值 治理优先级
下载PDF
基于本地边差分隐私的有向图聚类算法
11
作者 付楠 倪巍伟 +3 位作者 姜泽鹏 侯立贺 张东月 张如玉 《计算机研究与发展》 北大核心 2025年第1期256-268,共13页
基于本地差分隐私的图聚类工作成为近年来的一个研究热点.已有工作主要针对的是无向图,且大多利用位向量技术通过模块化聚合实现.由于噪声量与向量维度成线性关系,使得聚类质量和隐私性难以很好地兼顾.此外,针对无向图中边的有/无设计的... 基于本地差分隐私的图聚类工作成为近年来的一个研究热点.已有工作主要针对的是无向图,且大多利用位向量技术通过模块化聚合实现.由于噪声量与向量维度成线性关系,使得聚类质量和隐私性难以很好地兼顾.此外,针对无向图中边的有/无设计的2元扰动机制在面对有向图时,因无法对边的方向性进行处理而无法适用.针对上述问题,提出一种基于本地边差分隐私(edge local differential privacy,Edge-LDP)的有向图聚类算法DGC-LDP(directed graph clustering under LDP).具体来说,为了降低噪音量同时适用于有向图,基于直接编码方式设计了一种适用于有向星型图的动态扰动机制,通过自适应添加噪声来平衡隐私性和统计效用.在此基础上,在终端和收集者之间构建迭代机制.收集者依据终端上传的噪声数据提取节点间的相似性信息,并设计基于轮廓系数测量模型的节点聚合算法,通过迭代机制不断地优化节点聚合形式形成高质量簇.理论分析和实验结果表明,所提算法在满足Edge-LDP的同时能够有效兼顾聚类精度. 展开更多
关键词 隐私保护 本地差分隐私 随机响应 相似度
下载PDF
基于粗集与聚类投票机制的光谱双星特征分析
12
作者 王琦 杨海峰 蔡江辉 《光谱学与光谱分析》 北大核心 2025年第2期463-468,共6页
光谱双星通常是指光谱中呈现双主导成分特征,由于该双成分复杂多样,其成因也多种多样,同时光谱信噪比相对比较低,现有许多分析方法将双成分系统光谱分离成两条光谱进行分析,而分离方法无法保证光谱的准确性,现有聚类方法的单次聚类可靠... 光谱双星通常是指光谱中呈现双主导成分特征,由于该双成分复杂多样,其成因也多种多样,同时光谱信噪比相对比较低,现有许多分析方法将双成分系统光谱分离成两条光谱进行分析,而分离方法无法保证光谱的准确性,现有聚类方法的单次聚类可靠性比较低。提出一种基于粗集与聚类投票机制的光谱双星分析与评估方法,采用多次聚类和投票思想,给出每条光谱属于相应类别的梯度可靠性。该方法包含两个部分:(1)采用不同思想的聚类算法,将光谱双星数据集进行重构,将每种聚类算法标签采用匈牙利算法将聚类标签对齐作为光谱属性,从而重构数据集。(2)利用投票机制,得票数反映聚类结果的一致程度,获得每条光谱的类别,定义粗集示踪每类光谱特征,采用上/下近似集给出每条光谱所归类别的可靠性。选择郭守敬望远镜(LAMOST)DR10发布光谱双星集作为分析对象,采用基于划分的K-means、基于模型的GMM(Gaussian mixture model)、谱聚类(spectral clustering)和层次聚类(agglomerative clustering)四种聚类算法重构光谱数据集,选择得票数下界μ为2,通过投票得到1、0.75、0.5为可靠性梯度的聚类结果。其中大约1/3的样本可靠性为1,说明这批样本的四种聚类结果完全一致;对每类光谱和投票数的信噪比进行统计分析,投票数低的样本的信噪比相对较低,是它们被不同的聚类算法划分到不同类别的原因之一;对可靠性为1的6类光谱样本进行了物理成因的分析,其中以双星、河内星云+目标恒星两种为主,聚类标签的差异可能由于两种成分流量差异或拼接、定标等数据处理所导致。也有可能由于光谱质量较低导致pipeline误判的因素,其天区位置分布与低质量数据分布特征的研究基本一致。 展开更多
关键词 光谱双星 光谱分析 算法 郭守敬望远镜(LAMOST)
下载PDF
结合多尺度注意力和动态构建的非均匀超图聚类模型
13
作者 朱峰冉 王慧颖 +2 位作者 林晓丽 李全鑫 庞俊 《计算机工程与应用》 北大核心 2025年第2期200-207,共8页
单个较大非均匀超图聚类旨在将非均匀超图包含的节点划分为多个簇,使得同一簇内的节点更相似,而不同簇中的节点更不相似,具有广泛的应用场景。目前,最优的基于超图神经网络的非均匀超图聚类方法CIAH(co-cluster the interactions via at... 单个较大非均匀超图聚类旨在将非均匀超图包含的节点划分为多个簇,使得同一簇内的节点更相似,而不同簇中的节点更不相似,具有广泛的应用场景。目前,最优的基于超图神经网络的非均匀超图聚类方法CIAH(co-cluster the interactions via attentive hypergraph neural network)虽然较好地学习了非均匀超图的关系信息,但仍存在两点不足:(1)对于局部关系信息的挖掘不足;(2)忽略了隐藏的高阶关系。因此,提出一种基于多尺度注意力和动态超图构建的非均匀超图聚类模型MADC(non-uniform hypergraph clustering combining multi-scale attention and dynamic construction)。一方面,使用多尺度注意力充分学习了超边中节点与节点之间的局部关系信息;另一方面,采用动态构建挖掘隐藏的高阶关系,进一步丰富了超图特征嵌入。真实数据集上的大量实验结果验证了MADC模型在非均匀超图聚类上的聚类准确率(accuracy,ACC)、标准互信息(normalized mutual information,NMI)和调整兰德指数(adjusted Rand index,ARI)均优于CIAH等所有Baseline方法。 展开更多
关键词 非均匀超图 超图 超图神经网络 多尺度注意力
下载PDF
基于k-means聚类的无线传感器网络低功耗路由算法
14
作者 袁晔 肖剑 +2 位作者 何志成 张赞 程鸿亮 《物联网技术》 2025年第2期85-89,共5页
为提高无线传感器网络(WSN)中传感器节点的能量利用率以延长传感器网络的生命周期,提出基于k-means聚类的WSN低功耗路由算法。先按照距离乘积最大规则选取聚类初始簇中心,并在k-means算法迭代过程中引入能耗因子来优化k-means的分簇效果... 为提高无线传感器网络(WSN)中传感器节点的能量利用率以延长传感器网络的生命周期,提出基于k-means聚类的WSN低功耗路由算法。先按照距离乘积最大规则选取聚类初始簇中心,并在k-means算法迭代过程中引入能耗因子来优化k-means的分簇效果,降低基站附近节点的能耗和簇内的数据传输能耗;再使用Dijkstra算法搜寻簇首和基站间的最低功耗传输路径,以降低簇首能耗。仿真结果表明,该算法提高了网络的能量利用率,有效延长了网络的生命周期,使首个死亡节点延后出现,对WSN实现了更好的优化。 展开更多
关键词 WSN k-means均值算法 低功耗路由 最低功耗传输路径 DIJKSTRA算法 能耗均衡
下载PDF
IIoT环境下基于聚类的工作流多雾协同调度算法
15
作者 吴宏伟 江凌云 陈海峰 《计算机工程与设计》 北大核心 2025年第1期52-59,共8页
为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中... 为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中的任务进行聚类,基于聚类结果,在多个雾服务器之间使用改进的免疫粒子群优化算法进行任务调度。实验结果表明,该算法相比其它一些传统的调度算法在完工时间、成本、负载均衡方面都有一定提升。 展开更多
关键词 工业物联网 工作流 二分K均值算法 多雾 免疫粒子群优化算法 调度算法
下载PDF
大型社交网络下聚类滚雪球抽样算法的性质
16
作者 邵思琪 赵胜利 《曲阜师范大学学报(自然科学版)》 2025年第1期25-30,共6页
通过最大化模块度将原始网络进行社区划分,完善了滚雪球抽样,弥补了现有社交网络抽样算法容易陷入局部最优、抽样依赖其他样本等缺陷.利用随机节点抽样做基准,选取常见的非概率抽样方法,从平均度、平均路径长度和直径等指标出发比较各... 通过最大化模块度将原始网络进行社区划分,完善了滚雪球抽样,弥补了现有社交网络抽样算法容易陷入局部最优、抽样依赖其他样本等缺陷.利用随机节点抽样做基准,选取常见的非概率抽样方法,从平均度、平均路径长度和直径等指标出发比较各类抽样算法的估计效果.模拟实验和实证分析验证了聚类滚雪球抽样具有较好的抽样性质和估计特征,得出了其适用场景. 展开更多
关键词 社交网络抽样 模块度 滚雪球
下载PDF
结合改进相似度的MFDBSCAN算法的船舶轨迹聚类
17
作者 王梓昊 冯姣 李鹏 《信息技术》 2025年第1期1-7,14,共8页
由于基于基础相似度的轨迹聚类算法存在抗噪能力弱、运行时间慢等缺点,文中提出了基于MFDBSCAN算法的船舶轨迹聚类模型,该模型将改进的动态时间规整距离和改进具有噪声的基于密度的空间聚类算法(Density-Based Spatial Clustering of Ap... 由于基于基础相似度的轨迹聚类算法存在抗噪能力弱、运行时间慢等缺点,文中提出了基于MFDBSCAN算法的船舶轨迹聚类模型,该模型将改进的动态时间规整距离和改进具有噪声的基于密度的空间聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)相结合。选取中国香港的船舶自动识别系统(Automatic Identification System,AIS)数据进行实验,结果表明,与现有其他算法相比,MFDBSCAN算法能够有效提高抗噪能力,加快了运行速度,能更好更快速地获取船舶轨迹重要信息。该方法在有效监督和指导船舶等方面具有重要价值。 展开更多
关键词 动态时间规整 DBSCAN 轨迹 船舶自动识别系统(AIS)
下载PDF
MSHC:一种多阶段超图聚类算法
18
作者 张春英 王静 +2 位作者 刘璐 兰思武 张庆达 《深圳大学学报(理工版)》 北大核心 2025年第1期68-76,共9页
超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hyper... 超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hypergraph clustering,MSHC)算法,该算法将超图聚类过程分为超图约简、超图初始聚类以及优化迁移3个阶段.在超图约简阶段,提出一种不改变超图结构的快速约简方法,降低了后续算法的复杂度;提出基于集对分析理论的超图节点间相似性度量方法,并采用层次聚类方法对超图进行初始聚类,采用4种不同的类簇合并计算方法,增加聚类方案的多样性;将遗传算法应用于优化超图聚类方案的研究中,以此获得最优超图聚类方案.在3个不同规模的数据集上与4个经典的超图聚类方法进行对比实验,结果表明,MSHC算法在Songs_genres数据集和Papers_keywords数据集上超图模块度指数分别提高了0.0797和0.0777,在Movies_genres数据集上仅降低0.0060. 展开更多
关键词 数据处理 超图 遗传算法 集对分析理论 超图约简 多阶段 超图模块度
下载PDF
考虑模糊聚类特性的电网运营风险自动预警系统
19
作者 孙红燕 王少华 《电子设计工程》 2025年第1期70-73,79,共5页
当前风险自动预警系统通常采用基于经验值的人工方法设置自动预警阈值,给出的是统一阈值,导致系统虚警率较高。因此,提出基于模糊聚类特性的电网运营风险自动预警系统。设计信息采集器和显示器,应用决策级融合原理和神经网络模型,整合... 当前风险自动预警系统通常采用基于经验值的人工方法设置自动预警阈值,给出的是统一阈值,导致系统虚警率较高。因此,提出基于模糊聚类特性的电网运营风险自动预警系统。设计信息采集器和显示器,应用决策级融合原理和神经网络模型,整合实时采集的电网运营多源异构数据。从购电维度、输配电维度和售电维度入手,确定电网运营风险度量指标,得到风险度量结果。依托模糊聚类特性建立动态聚类图,对风险预警对象进行分类,分析电网运营风险的内容,作为自动预警阈值。根据预警阈值定义风险自动预警线,对比风险度量结果生成包含预警等级的自动预警信息。实验结果表明,所提系统的虚警率为2.67%,满足了电网运营风险自动预警要求。 展开更多
关键词 模糊特性 电网运营 风险度量 自动预警
下载PDF
融合学习者行为特征的群体聚类与知识共享差异研究——以知乎编程话题为例
20
作者 陶金虎 董伟 田依林 《成人教育》 北大核心 2025年第3期10-17,共8页
理解学习者行为特征及其知识共享规律是加强虚拟学习社区服务的重要前提。在抽取知乎3个编程话题区域数据基础上,通过PCA、Mini-batch Kmeans以及多元统计方法进行深入分析,结果显示,学习者类型差异直接影响了知识共享行为的意愿和效果... 理解学习者行为特征及其知识共享规律是加强虚拟学习社区服务的重要前提。在抽取知乎3个编程话题区域数据基础上,通过PCA、Mini-batch Kmeans以及多元统计方法进行深入分析,结果显示,学习者类型差异直接影响了知识共享行为的意愿和效果。学习者可被分为综合型、成就型、关注型以及普通型,其知识共享总量依次递减。普通型学习者知识共享总量虽超过关注型,但受认可程度相对较低,这两类学习者知识共享总量不足综合型或成就型的一半。四类学习者信息表露越多,知识共享总量越大。主体知识共享程度越高,在性别、地区、教育类型、会员身份等变量上的显著性愈多,特征分布规律愈一致。未来应该对不同类型学习者进行精细化管理,构建多样化激励与“同行评审”机制,加强学习者画像功能建设。 展开更多
关键词 虚拟学习社区 学习者 知识共享 差异分析
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部