期刊文献+
共找到202篇文章
< 1 2 11 >
每页显示 20 50 100
Percentile-based Neighborhood Precipitation Verification and Its Application to a Landfalling Tropical Storm Case with Radar Data Assimilation 被引量:3
1
作者 ZHU Kefeng YANG Yi Ming XUE 《Advances in Atmospheric Sciences》 SCIE CAS CSCD 2015年第11期1449-1459,共11页
The traditional threat score based on fixed thresholds for precipitation verification is sensitive to intensity forecast bias. In this study, the neighborhood precipitation threat score is modified by defining the thr... The traditional threat score based on fixed thresholds for precipitation verification is sensitive to intensity forecast bias. In this study, the neighborhood precipitation threat score is modified by defining the thresholds in terms of the percentiles of overall precipitation instead of fixed threshold values. The impact of intensity forecast bias on the calculated threat score is reduced. The method is tested with the forecasts of a tropical storm that re-intensified after making landfall and caused heavy flooding. The forecasts are produced with and without radar data assimilation. The forecast with assimilation of both radial velocity and reflectivity produce precipitation patterns that better match observations but have large positive intensity bias. When using fixed thresholds, the neighborhood threat scores fail to yield high scores for forecasts that have good pattern match with observations, due to large intensity bias. In contrast, the percentile-based neighborhood method yields the highest score for the forecast with the best pattern match and the smallest position error. The percentile-based method also yields scores that are more consistent with object-based verifications, which are less sensitive to intensity bias, demonstrating the potential value of percentile-based verification. 展开更多
关键词 neighborhood precipitation threat score percentile-based verification radar data assimilation
下载PDF
基于邻域优势粗糙集的区分度动态属性约简算法
2
作者 张海玉 贾润亮 《计算机工程与设计》 北大核心 2024年第8期2320-2328,共9页
为解决动态环境下数值型偏序关系数据的属性约简问题,利用优势粗糙集的区分度提出一种增量式属性约简算法。在数值型信息系统环境下,定义邻域优势区分度度量,通过邻域优势区分度设出一种非增量式属性约简算法;研究和分析对象变化场景下... 为解决动态环境下数值型偏序关系数据的属性约简问题,利用优势粗糙集的区分度提出一种增量式属性约简算法。在数值型信息系统环境下,定义邻域优势区分度度量,通过邻域优势区分度设出一种非增量式属性约简算法;研究和分析对象变化场景下邻域优势区分度进行增量式更新的原理;分别提出数据对象增加和减少情形下数据集属性约简的增量式更新算法。在多个UCI数据集上进行实验验证,实验结果表明,该增量式算法能够有效完成动态数据的属性约简任务。 展开更多
关键词 数值型 偏序关系数据 属性约简 优势粗糙集 邻域关系 区分度 增量式学习
下载PDF
基于多邻域感知的石油数据资产图谱实体对齐
3
作者 王志宝 江树涛 +3 位作者 李菲 高俊涛 马强 杨彬 《计算机工程》 CSCD 北大核心 2024年第1期339-347,共9页
实体对齐在自动融合多源异构的石油领域数据资产知识图谱过程中起着至关重要的作用。目前主流基于图神经网络的实体对齐模型多关注实体和图结构的信息,忽略了实体之间的关系、属性与属性值等多邻域的语义信息,在命名规则差异性大、行业... 实体对齐在自动融合多源异构的石油领域数据资产知识图谱过程中起着至关重要的作用。目前主流基于图神经网络的实体对齐模型多关注实体和图结构的信息,忽略了实体之间的关系、属性与属性值等多邻域的语义信息,在命名规则差异性大、行业特殊、语义实体多的石油领域数据资产知识图谱融合过程中性能一般。提出一种基于图注意力网络改进的多邻域感知网络(MNAN)模型,用于实体对齐。使用基于BERT的多语言预训练模型得到实体及多邻域的初始特征,通过带有Highway Networks的图卷积神经网络聚合邻域实体与图结构特征,利用多邻域感知和实体增强注意力网络聚合实体的多邻域特征,使用最小化基于边际的损失函数训练模型。在石油领域数据资产知识图谱数据集中的2个知识图谱上进行实体对齐实验,实验结果表明,MNAN模型优于所有对比的基于图神经网络实体对齐模型,Hits@1值达86.7%,优于表现最好的对比模型约2.3个百分点。 展开更多
关键词 实体对齐 多邻域感知 图注意力网络 石油领域数据资产 知识图谱
下载PDF
基于邻域粗集神经网络的大数据特征分类系统
4
作者 朱磊 凌嘉敏 《电子设计工程》 2024年第7期97-100,105,共5页
为提升主机元件对大数据的分类准确性,尽可能地避免数据误传,提出基于邻域粗集神经网络的大数据特征分类系统。在邻域粗集神经网络中,完成对邻域系数的粒化处理,通过逼近运算的方式,使神经网络模型快速趋于稳定。选取大数据特征调制信息... 为提升主机元件对大数据的分类准确性,尽可能地避免数据误传,提出基于邻域粗集神经网络的大数据特征分类系统。在邻域粗集神经网络中,完成对邻域系数的粒化处理,通过逼近运算的方式,使神经网络模型快速趋于稳定。选取大数据特征调制信息,借助调制识别器元件控制大数据特征的导出方向,结合关联信道组织完成数据特征的多标合并处理。实验表明,利用该系统可将大数据的单位召回率提升至65%,能够促进主机元件对大数据的准确分类。 展开更多
关键词 邻域粗集 神经网络 大数据特征 粒化处理 调制识别器 多标合并
下载PDF
基于NMI-SC的糖尿病混合数据特征选择
5
作者 朱潘蕾 容芷君 +2 位作者 但斌斌 代超 吕生 《电子设计工程》 2024年第11期6-10,共5页
针对糖尿病预测精度受高维混合数据影响的问题,提出基于NMI-SC的糖尿病特征选择方法,通过邻域互信息(NMI)计算混合属性特征邻域半径内的联合概率密度,构建相似度矩阵,通过糖尿病特征之间的相似性构建无向图,基于谱聚类(SC)将糖尿病特征... 针对糖尿病预测精度受高维混合数据影响的问题,提出基于NMI-SC的糖尿病特征选择方法,通过邻域互信息(NMI)计算混合属性特征邻域半径内的联合概率密度,构建相似度矩阵,通过糖尿病特征之间的相似性构建无向图,基于谱聚类(SC)将糖尿病特征切分为多个特征相似组,实现非线性特征间的聚类,根据特征分类重要性选出相似组中的代表特征。并将其与原始特征集在支持向量机分类器上的准确率进行比较,该特征选择方法在删除46个冗余特征后,准确率提高了13.07%。实验结果表明,该方法能有效删除冗余特征,得到糖尿病分类性能优异的特征子集。 展开更多
关键词 特征选择 混合数据降维 邻域互信息 谱聚类
下载PDF
基于模糊邻域熵的离群点检测方法
6
作者 刘佳莉 陈锦坤 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期511-522,共12页
离群点检测(又称异常点检测)是数据挖掘领域中一个重要的研究方向,其目的是找出显著区别于其他数据的数据点.针对基于传统粗糙集理论的离群点检测方法存在忽略样本的模糊性和邻域关系等问题,利用模糊邻域粗糙集弥补经典粗糙集的不足,并... 离群点检测(又称异常点检测)是数据挖掘领域中一个重要的研究方向,其目的是找出显著区别于其他数据的数据点.针对基于传统粗糙集理论的离群点检测方法存在忽略样本的模糊性和邻域关系等问题,利用模糊邻域粗糙集弥补经典粗糙集的不足,并结合熵的不确定性,提出一种新的基于模糊邻域熵的离群点检测方法.首先,采用模糊邻域半径和混合模糊相似度构造模糊邻域近似空间;然后,定义一种特定的模糊邻域组合熵和相对模糊邻域组合熵来构建模糊邻域离群度,进而定义基于模糊邻域熵的离群因子实现离群点检测,并设计了基于模糊邻域熵的离群点检测算法(FNEOD).最后,将FNEOD算法与主要的离群点检测算法进行比较.实验结果表明,该方法具有较好的有效性和适应性. 展开更多
关键词 数据挖掘 离群点检测 模糊邻域组合熵 相对模糊邻域组合熵
下载PDF
基于逆向工程的航空发动机叶片三维重建模型构建
7
作者 孙同明 任俊 +1 位作者 张峰 廖春云 《计算机测量与控制》 2024年第9期249-255,共7页
为精准控制航空发动机叶片型面数据,设计出更符合实际应用需求的发动机叶片,针对基于逆向工程的航空发动机叶片三维重建模型构建方法展开研究;按照逆向工程原理,采集三维数据样本,并根据误差修正条件,定义发动机叶片三维数据的拓扑关系... 为精准控制航空发动机叶片型面数据,设计出更符合实际应用需求的发动机叶片,针对基于逆向工程的航空发动机叶片三维重建模型构建方法展开研究;按照逆向工程原理,采集三维数据样本,并根据误差修正条件,定义发动机叶片三维数据的拓扑关系,从而分析三维数据样点的邻域形式,实现航空发动机叶片三维数据的邻域构建;实施对三维数据的点云拼接处理,遵循三维拟合原则,提取完整的发动机叶片边界,再根据三维重建节点配置需求,确定重建四元数的取值范围,推导具体的重建模型表达式,完成基于逆向工程的航空发动机叶片三维重建模型的构建;实验结果表明,上述模型的应用可以保证建模时标志点、三维重建后标志点间的坐标误差不超过0.5 mm,符合精准构建航空发动机叶片的实际应用需求。 展开更多
关键词 逆向工程 发动机叶片 三维重建模型 误差修正 数据邻域 点云拼接 叶片边界 四元数
下载PDF
老旧住区更新计算性设计教学探索
8
作者 王洁琼 童滋雨 《世界建筑导报》 2024年第3期4-7,共4页
文章以南京大学建筑与城市规划学院计算性城市更新设计的教学过程为例,探索针对城市社区更新中出现的复杂性和变化性的计算性设计教学方法。在设计研究和计算性思维的驱动下,设计教学模式强调研究问题的准确定义、分析工具的适当选择和... 文章以南京大学建筑与城市规划学院计算性城市更新设计的教学过程为例,探索针对城市社区更新中出现的复杂性和变化性的计算性设计教学方法。在设计研究和计算性思维的驱动下,设计教学模式强调研究问题的准确定义、分析工具的适当选择和呈现方式的多样性;教学组织过程强调从研究到设计完整过程中的步骤逻辑清晰和推进环环相扣。通过对三组代表性教学成果的介绍,具体呈现计算性设计教学的特点和难点。 展开更多
关键词 城市设计 社区更新 计算性设计 数据 设计策略
下载PDF
基于卡诺模型和多源数据的城市街区步行适宜性评价与优化
9
作者 赵力伟 宣蔚 +2 位作者 姚宇超 肖佳琦 彭康 《科学技术与工程》 北大核心 2024年第11期4698-4710,共13页
科学评价与优化街区步行适宜性对提升城市活力、推动绿色发展具有重要意义。首先从居民实际需求出发,基于马斯洛需求理论(Maslow's demand theory)和卡诺模型(Kano model)构建包含五个维度共十五个指标的城市街区步行适宜性评价模型... 科学评价与优化街区步行适宜性对提升城市活力、推动绿色发展具有重要意义。首先从居民实际需求出发,基于马斯洛需求理论(Maslow's demand theory)和卡诺模型(Kano model)构建包含五个维度共十五个指标的城市街区步行适宜性评价模型,结合多源数据和改进的CRITIC(criteria importance though intercrieria correlation)-熵权赋权法以合肥市为例进行测度;随后结合热点分析识别各维度高、低值的空间聚类情况,并分析产生原因;最后引入街区活力,利用双变量莫兰指数探讨二者的空间匹配关系,进而提出步行适宜性优化方法。结果表明,基于马斯洛需求理论和卡诺模型可从通畅性、便捷性、安全性、丰富性和舒适性五个维度对步行适宜性展开评价;研究区内的步行适宜性具有显著的空间分异性和自相关性,且与街区活力存在较多不匹配区域。在此基础上提出街区步行适宜性优化策略,可为合肥市未来步行空间设计和改造提供参考。 展开更多
关键词 步行适宜性 卡诺模型 马斯洛需求理论 街区活力 多源数据 街区尺度 空间自相关
下载PDF
复杂地层结构三维地质建模空间插值方法研究
10
作者 郑杨 简季 《城市地质》 2024年第1期121-128,共8页
三维地质体对于自然资源勘探、环境保护、自然灾害风险评估等领域都具有重要意义。在建模过程中,地质体的模型精度与插值算法有着直接关系。为研究不同插值算法的适用情况,文章对云南陆良某污染场地进行浅层三维地质建模,分别选取反距... 三维地质体对于自然资源勘探、环境保护、自然灾害风险评估等领域都具有重要意义。在建模过程中,地质体的模型精度与插值算法有着直接关系。为研究不同插值算法的适用情况,文章对云南陆良某污染场地进行浅层三维地质建模,分别选取反距离权重法和自然邻域法,利用钻孔数据插值建模,并对模型结果进行目视检验和误差对比分析。研究结果表明:反距离权重法适用范围广,建模精度较高;相较于自然邻域法,反距离权重法更适用于地层结构复杂的三维地质建模,该方法对断层细节的描述更细致,模型更符合实际情况;而自然邻域法在断层明显的区域插值效果较差,不适用于地层结构复杂的情况。 展开更多
关键词 三维地质模型 钻孔数据 反距离权重法 自然邻域法 精度验证
下载PDF
基于聚类挖掘的科技数据价值动态监测方法
11
作者 吴浩 罗少辉 +1 位作者 李颖昕 肖巧洁 《自动化技术与应用》 2024年第2期81-84,106,共5页
由于传统的科技数据存在噪声较多,导致科技数据价值动态监测效果较差等问题,提出一种基于聚类挖掘的科技数据价值动态监测方法。预先采用聚类挖掘方法对数据挖掘与聚类,建立动态距离函数,在此基础上对数据自身属性的识别,使相邻之间的... 由于传统的科技数据存在噪声较多,导致科技数据价值动态监测效果较差等问题,提出一种基于聚类挖掘的科技数据价值动态监测方法。预先采用聚类挖掘方法对数据挖掘与聚类,建立动态距离函数,在此基础上对数据自身属性的识别,使相邻之间的数据进行特性交换与结合,并对数据噪声去除,实现基于聚类挖掘的科技数据价值动态监测。实验结果表明,所研究的监测方法在正常数据下和入侵数据下都能够在短时间内实现数据价值动态监测,并且在入侵数据下也能够实现准确监测,满足方法设计需求。 展开更多
关键词 聚类挖掘 科技数据价值 动态监测 邻域
下载PDF
一种改进LSOF的风电异常数据识别与清洗方法
12
作者 陈长青 卢钱杭 +2 位作者 徐韵怡 甘周旺 雷兵 《湖南城市学院学报(自然科学版)》 CAS 2024年第3期57-62,共6页
针对风速-功率历史运行数据的识别和处理存在识别准确度低、分析过程复杂和异常数据清洗效率低的问题,提出了一种改进无监督学习的聚类局部结构离群因子识别方法(LSOF)。首先,通过最近邻域树法对邻域进行测量,旨在解决传统局部离群因子... 针对风速-功率历史运行数据的识别和处理存在识别准确度低、分析过程复杂和异常数据清洗效率低的问题,提出了一种改进无监督学习的聚类局部结构离群因子识别方法(LSOF)。首先,通过最近邻域树法对邻域进行测量,旨在解决传统局部离群因子识别性能低,且对邻域大小敏感的问题;其次,利用改进无监督学习的聚类局部结构离群因子识别方法分别对每个局部结构进行计算评分,并将评分最高的局部结构报告为异常局部结构,在此基础上,利用最近邻域树特征区分异常值和异常值组;最后,通过某实际风电场数据进行验证。研究结果表明,该方法在邻域范围内对异常值识别具有较高的精度和鲁棒性。 展开更多
关键词 异常数据识别 局部离群因子 无监督学习 邻域树
下载PDF
福州苍霞街区空间特征分析及活力研究
13
作者 林丁丁 徐子涵 +2 位作者 陈冰滢 蔡镇群 郑玮锋 《山东林业科技》 2024年第3期28-35,共8页
街区是延续城市活力与城市记忆的物质承载体。本文以福州苍霞街区为例,采用空间形态演替的定性研究方法结合空间句法定量分析,从街区空间形态、人群活力热度、街区商业空间功能三方面探讨苍霞街区的空间形态特征及时空演变与下街区各空... 街区是延续城市活力与城市记忆的物质承载体。本文以福州苍霞街区为例,采用空间形态演替的定性研究方法结合空间句法定量分析,从街区空间形态、人群活力热度、街区商业空间功能三方面探讨苍霞街区的空间形态特征及时空演变与下街区各空间要素之间的关系。结果表明:苍霞街区缺乏人流量,空间可达性有待提升,空间感知度偏低导致街区活力分布不均。最后,针对问题,提出重组商业结构、改善交通通达性、增强街区整体感知与可识别性的规划策略。 展开更多
关键词 苍霞街区 街区活力 空间特征 空间句法 POI数据
下载PDF
基于密度峰值的数据流动态聚类算法研究
14
作者 张国一 刘三民 《长春理工大学学报(自然科学版)》 2024年第4期82-93,共12页
数据流中存在不确定性,如何识别数据流环境中任意形状的数据以及噪声影响问题引起了广泛关注。为解决上述问题,设计一种鲁棒的密度峰值数据流动态聚类算法,该聚类算法的框架包括在线和离线阶段,在线阶段旨在即时响应并处理连续到达的数... 数据流中存在不确定性,如何识别数据流环境中任意形状的数据以及噪声影响问题引起了广泛关注。为解决上述问题,设计一种鲁棒的密度峰值数据流动态聚类算法,该聚类算法的框架包括在线和离线阶段,在线阶段旨在即时响应并处理连续到达的数据,在线阶段通过设计微簇的不均匀衰减策略减少历史数据对聚类的影响,和根据样本到微簇距离动态地对样本加权。离线阶段在密度峰值聚类的基础上设计基于最近邻域自适应的局部密度计算方法,降低密度峰值算分配阶段的“多米诺效应”影响。该方法能够进行复杂的数据处理,不受有限内存影响,有较好的鲁棒性。对人工数据集和真实数据集进行对比实验,实验结果表明该算法优于其他算法。所提出的鲁棒的密度峰值数据流动态聚类算法能给出更好的聚类效果。 展开更多
关键词 数据流 聚类 不均匀衰减策略 最近邻域 密度峰值
下载PDF
基于大数据技术的无线传感网络异常节点深度挖掘方法
15
作者 曾霞 宋一鸣 康利娟 《信息与电脑》 2024年第5期178-180,共3页
由于无线传感网络节点分布不规则,难以有效控制对异常节点的定位误差,为此提出基于大数据技术的无线传感网络异常节点深度挖掘方法。在节点均分布在目标区域范围内的前提下,构建无线传感网络组网模型,设置异常节点与网络中心节点之间的... 由于无线传感网络节点分布不规则,难以有效控制对异常节点的定位误差,为此提出基于大数据技术的无线传感网络异常节点深度挖掘方法。在节点均分布在目标区域范围内的前提下,构建无线传感网络组网模型,设置异常节点与网络中心节点之间的关系函数,之后采用大数据技术中的邻域搜索算法,对具体的网络异常节点位置进行深度挖掘定位。实验结果显示,基于大数据技术的无线传感网络异常节点深度挖掘方法在不同噪声状态下的异常节点定位误差始终稳定在2.0以内。 展开更多
关键词 大数据技术 无线传感网络 异常节点 深度挖掘 邻域搜索算法
下载PDF
改进高斯混合模型的激光点云数据分类 被引量:3
16
作者 张忠琼 赵颖 钱淑渠 《激光杂志》 CAS 北大核心 2023年第6期215-219,共5页
激光点云数据的无序性会影响激光场景识别和三维重建,导致激光点云数据分类误差大,精度低等问题,为此提出基于改进高斯混合模型的激光点云数据分类方法。首先采集激光点云数据,利用邻域密度算法对数据中的噪声进行分析和去除,然后采用... 激光点云数据的无序性会影响激光场景识别和三维重建,导致激光点云数据分类误差大,精度低等问题,为此提出基于改进高斯混合模型的激光点云数据分类方法。首先采集激光点云数据,利用邻域密度算法对数据中的噪声进行分析和去除,然后采用改进高斯混合模型获取数据点间距,将点云数据分类相应类别中,实现激光点云数据分类。实验结果证明,本方法可以有效去除激光点云数据中的孤立点,提高了激光点云数据分类精度,激光点云数据分类结果可满足激光三维重建要求。 展开更多
关键词 高斯混合模型 激光点云 数据分类 邻域密度
下载PDF
基于邻域容差互信息和鲸鱼优化算法的非平衡数据特征选择 被引量:2
17
作者 孙林 黄金旭 徐久成 《计算机应用》 CSCD 北大核心 2023年第6期1842-1854,共13页
针对大多数特征选择算法未充分考虑数据的类不均匀分布、特征之间的相关性和不同参数对特征选择结果的影响等问题,提出一种基于邻域容差互信息和鲸鱼优化算法(WOA)的非平衡数据特征选择方法。首先,在不完备邻域决策系统中,针对二分类数... 针对大多数特征选择算法未充分考虑数据的类不均匀分布、特征之间的相关性和不同参数对特征选择结果的影响等问题,提出一种基于邻域容差互信息和鲸鱼优化算法(WOA)的非平衡数据特征选择方法。首先,在不完备邻域决策系统中,针对二分类数据集和多分类数据集,基于上、下边界域定义两种非平衡数据的特征重要度;然后,为充分反映特征的决策能力和特征之间的相关性,构建邻域容差互信息;最后,通过将非平衡数据特征重要度和邻域容差互信息相结合,提出基于邻域容差互信息的非平衡数据特征选择(FSIDN)算法,该算法采用WOA获取特征选择算法中的最优参数,并引入非线性收敛因子和自适应惯性权重来改进WOA,以解决WOA易陷入局部最优的问题。在8个基准函数上进行实验,结果表明改进的WOA具有较好的优化性能;在13个二分类和4个多分类的非平衡数据集上进行特征选择实验,实验结果表明,与其他相关算法相比,所提算法能够有效地选择出具有良好分类性能的特征子集。 展开更多
关键词 非平衡数据 特征选择 不完备邻域决策系统 互信息 鲸鱼优化算法
下载PDF
别人家的孩子:邻里效应对学生参与影子教育的影响研究——基于中国家庭追踪调查面板数据的分析
18
作者 薛海平 杨琳琳 徐丹诚 《教育与经济》 北大核心 2023年第6期21-30,共10页
基于中国家庭追踪调查(CFPS)面板数据构建固定效应Logit模型,探究学生参与影子教育是否存在邻里效应及邻里效应在不同家庭社会经济地位、学段和城乡学生间是否存在异质性。研究结果表明:(1)学生参与影子教育存在邻里效应,且邻里效应随... 基于中国家庭追踪调查(CFPS)面板数据构建固定效应Logit模型,探究学生参与影子教育是否存在邻里效应及邻里效应在不同家庭社会经济地位、学段和城乡学生间是否存在异质性。研究结果表明:(1)学生参与影子教育存在邻里效应,且邻里效应随时间推移逐渐减弱。(2)邻里效应强化了家庭社会经济地位较低、学段较高以及乡村的学生对影子教育的追求。因此,建议严控校外培训机构广告宣传,加大学科类隐形变异培训查处力度;提升弱势阶层家庭所在社区及乡村教育资源质量,引导家长理性选择影子教育,削弱影子教育的邻里效应,推动“双减”政策落地。 展开更多
关键词 “双减”政策 影子教育 邻里效应 面板数据
下载PDF
面向网络隐私数据融合的蚁群算法优化方法
19
作者 沈文旭 武航宇 毛重 《计算机仿真》 北大核心 2023年第7期414-417,490,共5页
针对目前方法对网络隐私数据进行融合时,由于未能在数据融合前对数据缺失值进行插补处理,导致该方法在进行数据融合时,存在网络生命周期短和网络延时高的问题,提出面向网络隐私数据融合的蚁群算法优化方法。首先对网络隐私数据缺失值进... 针对目前方法对网络隐私数据进行融合时,由于未能在数据融合前对数据缺失值进行插补处理,导致该方法在进行数据融合时,存在网络生命周期短和网络延时高的问题,提出面向网络隐私数据融合的蚁群算法优化方法。首先对网络隐私数据缺失值进行插补处理,并标准化插补数据生成网络隐私数据特征集;再依据邻域搜索算法优化蚁群算法,根据获取特征集生成网络连通图;最后使用优化后的蚁群算法搜索连通图,获取最佳数据融合值,实现网络隐私数据的融合。实验结果表明,运用上述方法进行数据融合时,网络生命周期长,网络延时低。 展开更多
关键词 网络隐私数据 蚁群优化算法 缺失值插补 邻域搜索算法 数据融合方法
下载PDF
采用离群点检测技术的混合型数据聚类初始化方法 被引量:3
20
作者 杨志勇 江峰 +1 位作者 于旭 杜军威 《智能系统学报》 CSCD 北大核心 2023年第1期56-65,共10页
近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检... 近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检测的策略来为K-prototype算法选择初始中心,并提出一种新的混合型数据聚类初始化算法(initialization of K-prototype clustering based on outlier detection and density,IKP-ODD)。给定一个候选对象,IKP-ODD通过计算其距离离群因子、加权密度以及与已有初始中心之间的加权距离来判断候选对象是否是一个初始中心。IKP-ODD通过采用距离离群因子和加权密度,防止选择离群点作为初始中心。在计算对象的加权密度以及对象之间的加权距离时,采用邻域粗糙集中的粒度邻域熵来计算每一个属性的重要性,并根据属性重要性的大小为不同属性赋予不同的权重,有效地反映不同属性之间的差异性。在多个UCI数据集上的实验表明,相对于现有的初始化方法,IKP-ODD能够更好地解决K-prototype聚类的初始化问题。 展开更多
关键词 聚类初始化 混合型数据 离群点检测 邻域粗糙集 粒度邻域熵 距离离群因子 加权密度 加权距离
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部