期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于密度可达的多密度聚类算法 被引量:7
1
作者 薛丽香 邱保志 《计算机工程》 CAS CSCD 北大核心 2009年第17期66-68,共3页
为对多密度数据集聚类,提出一种基于密度可达的多密度聚类算法。使用网格划分技术来提高计算每个点密度值的效率,每次聚类都是从最高密度点开始,根据密度可达的概念和广度优先的策略逐步向外扩展进行聚类。实验表明,该算法能够有效地对... 为对多密度数据集聚类,提出一种基于密度可达的多密度聚类算法。使用网格划分技术来提高计算每个点密度值的效率,每次聚类都是从最高密度点开始,根据密度可达的概念和广度优先的策略逐步向外扩展进行聚类。实验表明,该算法能够有效地对任意形状、大小的均匀数据集和多密度数据集进行聚类,并能较好地识别出孤立点和噪声,其精度和效率优于SNN算法。 展开更多
关键词 聚类算法 邻域网格 密度可达 广度优先 密度
下载PDF
基于密度可达的聚类隐私保护模型
2
作者 贺玉芝 倪巍伟 张勇 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第5期825-831,共7页
针对面向聚类的数据隐私发布问题,基于密度可达邻域的概念,提出一种面向聚类的隐私保护模型PPC(r,ε,h).该模型通过要求隐藏后所有数据记录在ε内密度可达(r相关)的近邻数不小于h,以避免可能出现的近邻攻击.进一步提出密度可达安全邻域... 针对面向聚类的数据隐私发布问题,基于密度可达邻域的概念,提出一种面向聚类的隐私保护模型PPC(r,ε,h).该模型通过要求隐藏后所有数据记录在ε内密度可达(r相关)的近邻数不小于h,以避免可能出现的近邻攻击.进一步提出密度可达安全邻域概念,对不满足模型要求的邻域,采用平移近邻的数据隐藏方法进行处理,保证发布后数据集满足模型约束.并利用邻域价值和邻域相似性的概念,对平移过程进行优化.理论分析和实验结果表明,基于PPC(r,ε,h)隐私模型设计的数据隐藏方法,能有效维持原数据集中数据点在各聚簇中的分布,且兼顾了发布后数据的聚类可用性和数据安全性. 展开更多
关键词 隐私保护模型 聚类分析 数据干扰 数据平移 密度可达
下载PDF
基于密度可达的密度峰值聚类算法 被引量:2
3
作者 刘美 王全民 《计算机仿真》 北大核心 2022年第11期371-375,共5页
针对密度峰值聚类(density peaks clustering,DPC)算法由于分配策略导致其在非凸集上聚类效果不佳的问题,提出一种基于密度可达的优化密度峰值(density up to DPC,DTDPC)算法。算法根据簇中心权值趋势自动选择聚类中心,设计了基于密度... 针对密度峰值聚类(density peaks clustering,DPC)算法由于分配策略导致其在非凸集上聚类效果不佳的问题,提出一种基于密度可达的优化密度峰值(density up to DPC,DTDPC)算法。算法根据簇中心权值趋势自动选择聚类中心,设计了基于密度可达的两步分配策略,对核心点与边界点进行划分。实验结果表明,DTDPC算法在凸数据与非凸数据集上均表现良好,与K-means、DBSCAN、DPC聚类算法的性能相比,DTDPC算法更加稳定。 展开更多
关键词 密度峰值聚类 密度可达 非凸数据 核心点 光晕点
下载PDF
基于密度聚类的复杂装备健康监测方法
4
作者 余彦 蔡霖 +1 位作者 张冲 冀弘帅 《指挥控制与仿真》 2024年第2期69-77,共9页
针对复杂装备历史数据往往存在非球形的特征,提出了一种基于密度聚类的复杂装备健康监测模型。从历史数据中估计各个样本的局部密度和类间距离,并综合考虑两者的统计特性以确定数据的聚类中心,对于新采集的复杂装备健康状态监测数据,如... 针对复杂装备历史数据往往存在非球形的特征,提出了一种基于密度聚类的复杂装备健康监测模型。从历史数据中估计各个样本的局部密度和类间距离,并综合考虑两者的统计特性以确定数据的聚类中心,对于新采集的复杂装备健康状态监测数据,如果它与聚类中心密度可达,就认为该复杂装备处于健康状态,否则就处于非健康状态。通过数值仿真技术分析了一个实际的复杂装备数据集,以及利用散点图、盒图和平行坐标系等可视化技术来验证计算结果的可靠性,仿真结果表明提出的方法能够有效监测复杂装备的健康状态。 展开更多
关键词 密度聚类 健康监测 局部密度 类间距离 平行坐标系 密度可达
下载PDF
基于关联规则提取的外语翻译信息密度检测
5
作者 孙瑞 吕灏楠 《信息技术》 2024年第4期83-86,92,共5页
为了提高外语翻译信息密度检测的有效性,提出基于关联规则提取的外语翻译信息密度检测方法。构建语料特征信息挖掘的二元模型,并采用关联规则提取方法计算关联规则分布特征参数,完成语料特征的提取。根据语料特征提取结果,计算信息密度... 为了提高外语翻译信息密度检测的有效性,提出基于关联规则提取的外语翻译信息密度检测方法。构建语料特征信息挖掘的二元模型,并采用关联规则提取方法计算关联规则分布特征参数,完成语料特征的提取。根据语料特征提取结果,计算信息密度检测中心点与信息增量特征的多维尺度信息。计算信息的平均可达密度,将其作为密度检测结果进行输出。实验结果表明,相较于传统对比方法,所提方法可以提高外语翻译信息密度检测精度,检测精度在97%左右。 展开更多
关键词 关联规则提取 外语翻译 信息密度检测 信息增量特征 平均可达密度
下载PDF
自适应阈值约束的密度簇主干聚类算法 被引量:2
6
作者 张锦宏 陈梅 张弛 《计算机科学与探索》 CSCD 北大核心 2023年第12期2880-2895,共16页
针对现有聚类算法识别任意簇时精度不足、对簇内数据点密度变化敏感、对异常点敏感以及阈值取值难以确定等问题,提出了自适应阈值约束的密度簇主干聚类算法(DCBAT)。该算法首先结合偏度系数和数据点密度均值定义了数据点密度可达自适应... 针对现有聚类算法识别任意簇时精度不足、对簇内数据点密度变化敏感、对异常点敏感以及阈值取值难以确定等问题,提出了自适应阈值约束的密度簇主干聚类算法(DCBAT)。该算法首先结合偏度系数和数据点密度均值定义了数据点密度可达自适应阈值,在该阈值的约束下将具有较高局部密度和较高相对距离的核心点按密度可达性分组,进而得到初始簇主干。接着将非核心数据点归并到其密度较大的最近邻所在簇中,得到初始簇。最后结合簇内密度差均值和比例系数定义了密度差自适应阈值,在该阈值的约束下于簇内点密度变化剧烈处拆分初始簇,得到最终簇。DCBAT在充分考虑数据分布特点和内部结构特点的情况下进行聚类,从而提高了聚类性能。与五个优秀算法k-means、DBSCAN、OPTICS、CFDP和MulSim在八个不同维度、不同类型的数据集上的实验结果表明,DCBAT算法具有识别任意簇效果佳、对簇内点密度变化不敏感、对异常点不敏感、聚类结果精确且稳定等特点,综合性能优于对比算法。 展开更多
关键词 聚类 簇主干 密度可达自适应阈值 密度差自适应阈值 任意簇
下载PDF
基于密度复杂簇聚类算法研究与实现 被引量:16
7
作者 宋宇辰 宋飞燕 孟海东 《计算机工程与应用》 CSCD 北大核心 2007年第35期162-165,共4页
聚类算法在模式识别、数据分析、图像处理、以及市场研究的应用中,需要解决的关键技术是如何有效地聚类各种复杂的数据对象簇。在分析与研究现有聚类算法的基础上,提出了一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够... 聚类算法在模式识别、数据分析、图像处理、以及市场研究的应用中,需要解决的关键技术是如何有效地聚类各种复杂的数据对象簇。在分析与研究现有聚类算法的基础上,提出了一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够有效聚类任意分布形状、不同密度、不同尺度的簇;同时,算法的计算复杂度与传统基于密度的聚类算法相比有明显的降低。 展开更多
关键词 聚类算法 复杂簇 基于密度 自适应密度可达
下载PDF
基于密度与划分方法的聚类算法设计与实现 被引量:4
8
作者 孟海东 宋飞燕 郝永宽 《计算机工程与应用》 CSCD 北大核心 2007年第27期171-174,共4页
在分析常用聚类算法的特点和适应性基础上提出一种基于密度与划分方法的聚类算法。该算法根据数据对象密度分布状态来自动确定聚类簇密度吸引中心点和聚类簇的初始划分;然后利用划分的方法,根据密度可达定义来寻找密度可达数据对象簇,... 在分析常用聚类算法的特点和适应性基础上提出一种基于密度与划分方法的聚类算法。该算法根据数据对象密度分布状态来自动确定聚类簇密度吸引中心点和聚类簇的初始划分;然后利用划分的方法,根据密度可达定义来寻找密度可达数据对象簇,从而完成数据对象簇的最终聚类。实验证明该算法能够很好地处理具有任意形状和大小的簇,能够有效地屏蔽噪声和离群点的影响和发现孤立点;同时也减小了输入参数对领域知识的依赖性。 展开更多
关键词 数据挖掘 聚类 密度函数 密度可达 划分方法
下载PDF
电力基坑有害气体风险评估方法设计
9
作者 文宗山 景国明 樊彦国 《自动化仪表》 CAS 2024年第2期122-126,共5页
为了提升风险评估准确率,设计了一种电力基坑有害气体风险评估方法。创新性地利用密度和加权方法改进聚类算法,实施电力基坑有害气体传感数据的挖掘。使用改进阈值函数去噪方法对传感器数据实施去噪处理。基于静态响应和动态响应构建传... 为了提升风险评估准确率,设计了一种电力基坑有害气体风险评估方法。创新性地利用密度和加权方法改进聚类算法,实施电力基坑有害气体传感数据的挖掘。使用改进阈值函数去噪方法对传感器数据实施去噪处理。基于静态响应和动态响应构建传感器响应灵敏度控制模型,提高数据质量。基于机器学习中的图神经网络构建电力基坑有害气体风险评估模型,实现有害气体风险等级评估。测试结果表明,该方法能够实现风险等级评估,并将风险评估结果的准确率均值提升到95%以上。评估结果显示:工程中基坑4、基坑5、基坑6的风险评估等级为低等级;基坑2为中低等级;基坑1、基坑3、基坑8为中等级;基坑7为中高等级。该方法的评估结果可用于对电力基坑施工安全进行控制,具有实际工程应用价值。 展开更多
关键词 机器学习 电力基坑 改进聚类算法 图神经网络 有害气体风险评估 传感器控制 气体浓度 密度可达
下载PDF
基于密度K中心方法的核酸序列聚类
10
作者 赵友杰 曹永忠 +1 位作者 张剑峰 陆王红 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期280-282,共3页
针对传统K中心聚类算法存在的初始化敏感、聚类结果多样化等问题,提出一种基于密度的K中心聚类方案,并与序列比对、动态规划等方法有机地融合在一起,实现了对核酸序列的聚类分析。实验表明,该方案与传统K中心聚类算法相比较,初始化较理... 针对传统K中心聚类算法存在的初始化敏感、聚类结果多样化等问题,提出一种基于密度的K中心聚类方案,并与序列比对、动态规划等方法有机地融合在一起,实现了对核酸序列的聚类分析。实验表明,该方案与传统K中心聚类算法相比较,初始化较理想,迭代次数较少,聚类效果更优。 展开更多
关键词 K中心聚类 直接密度可达 序列比对 动态规划 生物信息学
下载PDF
自适应聚合策略优化的密度峰值聚类算法 被引量:11
11
作者 钱雪忠 金辉 《计算机科学与探索》 CSCD 北大核心 2020年第4期712-720,共9页
针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰... 针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰值的聚类算法。该算法首先根据K近邻的思想来确定数据点的局部密度,然后提出一种新的自适应聚合策略,即首先通过算法给出阈值判断初始类簇中心,然后依据离初始类簇中心最近分配剩余点,最后通过类簇间密度可达来合并相似类簇。在实验中,该算法在合成和实际数据集中的表现比DPC、DBSCAN、KNNDPC和K-means算法要好,能有效提高聚类准确率和质量。 展开更多
关键词 密度 K近邻(KNN) 局部密度 合并策略 类簇间密度可达
下载PDF
DBSCAN算法中参数自适应确定方法的研究 被引量:42
12
作者 周红芳 王鹏 《西安理工大学学报》 CAS 北大核心 2012年第3期289-292,共4页
在DBSCAN算法中需要人工输入Eps和MinPts两个参数,因而聚类过程需要用户的干预才能进行,导致聚类结果的准确度直接取决于用户对参数的选择。鉴于此,本研究提出了一种新的Eps和MinPts参数的确定方法,避免了聚类过程中的人工干预,实现了... 在DBSCAN算法中需要人工输入Eps和MinPts两个参数,因而聚类过程需要用户的干预才能进行,导致聚类结果的准确度直接取决于用户对参数的选择。鉴于此,本研究提出了一种新的Eps和MinPts参数的确定方法,避免了聚类过程中的人工干预,实现了聚类过程的全自动化。理论分析和实验结果表明,该方法能够选择合理的Eps和MinPts参数并得到较高准确度的聚类结果。 展开更多
关键词 密度聚类 Eps邻域 密度可达 噪声
下载PDF
动态增量聚类的设计与实现 被引量:7
13
作者 孟海东 王淑玲 郝永宽 《计算机工程与应用》 CSCD 北大核心 2009年第24期130-132,共3页
传统聚类算法往往只适用于静态数据集的聚类。对于动态数据集,新增数据后,前期的聚类结果不再可靠,运用此类算法则需要重新聚类,这样会造成效率低下和计算资源浪费。在基于密度和自适应密度可达聚类算法的基础上,提出了一种新的增量聚... 传统聚类算法往往只适用于静态数据集的聚类。对于动态数据集,新增数据后,前期的聚类结果不再可靠,运用此类算法则需要重新聚类,这样会造成效率低下和计算资源浪费。在基于密度和自适应密度可达聚类算法的基础上,提出了一种新的增量聚类算法。理论分析和实验结果证明该算法能够有效地处理动态数据集,提高聚类效率和资源的利用率。 展开更多
关键词 动态数据集 密度可达 增量聚类
下载PDF
面向复杂簇的聚类算法研究与实现 被引量:4
14
作者 孟海东 宋飞燕 宋宇辰 《计算机应用与软件》 CSCD 北大核心 2008年第10期32-34,81,共4页
有效聚类各种复杂的数据对象簇是聚类算法应用于事务对象划分、图像分割、机器学习等方面需要解决的关键技术。在分析与研究现有聚类算法的基础上,提出一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够有效聚类任意分布形... 有效聚类各种复杂的数据对象簇是聚类算法应用于事务对象划分、图像分割、机器学习等方面需要解决的关键技术。在分析与研究现有聚类算法的基础上,提出一种基于密度和自适应密度可达的改进算法。实验证明,该算法能够有效聚类任意分布形状、不同密度、不同尺度的簇;同时,算法的计算复杂度与传统基于密度的聚类算法相比有明显的降低。 展开更多
关键词 聚类算法 复杂簇 基于密度 自适应密度可达
下载PDF
IncLOF:动态环境下局部异常的增量挖掘算法 被引量:33
15
作者 杨风召 朱扬勇 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2004年第3期477-484,共8页
异常检测是数据挖掘领域研究的最基本的问题之一 ,它在欺诈甄别、贷款审批、气象预报、客户分类等方面有广泛的应用 以前的异常检测算法只适应于静态环境 ,在数据更新时需要进行重新计算 在基于密度的局部异常检测算法LOF的基础上 ,提... 异常检测是数据挖掘领域研究的最基本的问题之一 ,它在欺诈甄别、贷款审批、气象预报、客户分类等方面有广泛的应用 以前的异常检测算法只适应于静态环境 ,在数据更新时需要进行重新计算 在基于密度的局部异常检测算法LOF的基础上 ,提出一种在动态环境下局部异常挖掘的增量算法IncLOF ,当数据库中的数据更新时 ,只对受到影响的点进行重新计算 ,这样可以大大提高异常的挖掘速度 实验表明 ,在动态环境下IncLOF的运行时间远远小于LOF的运行时间 ,并且用户定义的邻域中的最小对象个数与记录数之比越小 。 展开更多
关键词 数据挖掘 异常检测 局部异常因子 局部可达密度 增量挖掘算法
下载PDF
ded-kNN算法在甲状腺疾病预测中的研究 被引量:2
16
作者 陈彬嫣 唐德玉 《计算机时代》 2020年第7期80-82,85,共4页
由于传统kNN算法在不平衡数据中的分类误差较大,故结合DBSCAN算法、熵权法以及密度可达的思想,生成动态k值来改进kNN算法(ded-kNN)。以甲状腺疾病为例用MATLAB编程验证其在疾病预测中的应用,结果表明,改进的算法分类性能得到很大提高。
关键词 甲状腺疾病 KNN算法 密度可达 疾病预测
下载PDF
基于数据场的改进LOF算法 被引量:4
17
作者 孟海东 孙新军 宋宇辰 《计算机工程与应用》 CSCD 北大核心 2019年第3期154-158,共5页
LOF(Local Outlier Factor)是一种经典基于密度的局部离群点检测算法,为提高算法的精确度,以便更精准挖掘出局部离群点,在LOF算法的基础上,提出了一种基于数据场的改进LOF离群点检测算法。通过对数据集每一维的属性值应用数据场理论,计... LOF(Local Outlier Factor)是一种经典基于密度的局部离群点检测算法,为提高算法的精确度,以便更精准挖掘出局部离群点,在LOF算法的基础上,提出了一种基于数据场的改进LOF离群点检测算法。通过对数据集每一维的属性值应用数据场理论,计算势值,进而引入平均势差的概念,针对每一维度中大于平均势差的任意两点在计算距离时加入一个权值,从而提高离群点检测的精确度,实验结果表明该算法是可行的,并且拥有更高的精确度。 展开更多
关键词 数据挖掘 局部可达密度 数据场 平均势差 局部离群因子
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部