期刊文献+
共找到82,776篇文章
< 1 2 250 >
每页显示 20 50 100
基于K-prototypes的混合属性数据聚类算法改进
1
作者 倪丹 李泽文 《科技创新与应用》 2024年第28期31-34,38,共5页
属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或... 属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或者在计算时没有进行任何改变,很可能提高分类数据在聚类中的影响,并且分类型数据并未进一步地细分,不能满足不同要求的混合属性聚类。该文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进K-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。 展开更多
关键词 k-prototypes算法 混合属性 类型数据 相异度系数 加权属性
下载PDF
The Role and Place of Artificial Neural Network Architectures Structural Redundancy in the Input Data Prototypes and Generalization Development
2
作者 Conrad Onésime Oboulhas Tsahat Ngoulou-A-Ndzeli Béranger Destin Ossibi 《Journal of Computer and Communications》 2024年第7期1-11,共11页
Neural Networks (NN) are the functional unit of Deep Learning and are known to mimic the behavior of the human brain to solve complex data-driven problems. Whenever we train our own neural networks, we need to take ca... Neural Networks (NN) are the functional unit of Deep Learning and are known to mimic the behavior of the human brain to solve complex data-driven problems. Whenever we train our own neural networks, we need to take care of something called the generalization of the neural network. The performance of Artificial Neural Networks (ANN) mostly depends upon its generalization capability. In this paper, we propose an innovative approach to enhance the generalization capability of artificial neural networks (ANN) using structural redundancy. A novel perspective on handling input data prototypes and their impact on the development of generalization, which could improve to ANN architectures accuracy and reliability is described. 展开更多
关键词 Multilayer Neural Network Multidimensional Nonlinear Interpolation Generalization by Similarity Artificial Intelligence prototype Development
下载PDF
基于K-prototypes的混合属性数据聚类算法 被引量:16
3
作者 陈韡 王雷 蒋子云 《计算机应用》 CSCD 北大核心 2010年第8期2003-2005,2110,共4页
通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英... 通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英语借词数据的聚类分析中。实验结果表明,与K-prototypes算法相比,改进后的算法具有更好的稳定性和更高的精度。 展开更多
关键词 聚类 k-prototypes算法 混合属性数据 相异度
下载PDF
一种改进的加权K-prototypes算法 被引量:5
4
作者 刘强 邓磊 +1 位作者 贾振红 覃锡忠 《激光杂志》 CAS CSCD 北大核心 2014年第1期18-20,共3页
为了提高K-prototypes算法的聚类准确度,解决其随机选取聚类中心初始值导至的聚类精度较低和聚类结果不稳定的问题。通过对混合属性数据聚类算法的研究,对K-prototypes算法做了进一步的改进。提出了混合属性聚类的初始聚类中心确定方法... 为了提高K-prototypes算法的聚类准确度,解决其随机选取聚类中心初始值导至的聚类精度较低和聚类结果不稳定的问题。通过对混合属性数据聚类算法的研究,对K-prototypes算法做了进一步的改进。提出了混合属性聚类的初始聚类中心确定方法,并且通过加权算法改进了相异度计算公式。最后用UCI数据集对算法进行检验,结果表明,改进的加权K-prototype算法更加稳定,并具有较高的聚类精度。 展开更多
关键词 数据挖掘 混合属性 聚类 权重调整
下载PDF
模糊k-prototypes聚类算法的一种改进算法 被引量:11
5
作者 王宇 杨莉 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第6期849-852,共4页
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果... 模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度. 展开更多
关键词 模糊k-prototypes聚类算法 数值型属性 分类型属性 英语借词 数据挖掘
下载PDF
一种增强的K-prototypes混合数据聚类算法 被引量:4
6
作者 李顺勇 顾嘉成 《陕西科技大学学报》 北大核心 2021年第2期183-188,共6页
针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes Mixed Data Clustering Algorithm,EKPCA).首先定义了一种新的距离计算公式,扩大了数据之间的差异性,有利... 针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes Mixed Data Clustering Algorithm,EKPCA).首先定义了一种新的距离计算公式,扩大了数据之间的差异性,有利于对簇边缘数据进行合理划分;其次选取较多初始原型来覆盖数据的整体信息;最后迭代消去多余原型,得到数据集的真实分类.在8个UCI数据集上对算法进行评测,实验结果表明EKPCA算法有较高聚类精度. 展开更多
关键词 k-prototypes 混合数据 距离计算 初始原型 迭代消去
下载PDF
量子遗传算法的模糊K-prototypes聚类 被引量:1
7
作者 叶奇明 梁根 《计算机工程与应用》 CSCD 北大核心 2010年第1期112-115,共4页
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的... 聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。 展开更多
关键词 聚类算法 量子遗传算法 模糊k-prototypes算法 数值型属性 数据挖掘
下载PDF
基于平均差异度的改进k-prototypes聚类算法 被引量:4
8
作者 石鸿雁 徐明明 《沈阳工业大学学报》 EI CAS 北大核心 2019年第5期555-559,共5页
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中... 针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据. 展开更多
关键词 k-prototypes算法 聚类 初始聚类中心 混合属性数据 平均差异度 信息熵 属性权重 度量公式
下载PDF
基于信息增益的模糊K-prototypes聚类算法
9
作者 欧阳浩 王智文 +1 位作者 戴喜生 刘智琦 《计算机工程与科学》 CSCD 北大核心 2015年第5期1009-1014,共6页
K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用... K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用了信息论中信息增益的计算方法,来获得各个属性的权值。在计算各属性的差异度时,乘以这些权值,从而可以获得更为准确的聚类结果。为了增加算法处理模糊问题的能力,本算法引用了模糊理论,从而使其具有较好的抗干扰能力和处理不确定性问题的能力。通过对四个UCI数据集的聚类分析实验,表明了本算法的有效性。 展开更多
关键词 聚类 信息增益 模糊k-prototypes算法 混合型数据
下载PDF
改进的k-prototypes算法及应用 被引量:1
10
作者 罗冬梅 《武夷学院学报》 2009年第2期74-77,共4页
文中提出了一种改进的k-prototypes算法,该算法可以解决具有数值和分类混合类型数据的聚类问题,将它应用于对某高校网站的Web服务器日志进行数据分析,发现有意义的信息,建立规则库,并验证了算法的有效性。
关键词 数据挖掘 k-prototypes算法 k-MEANS算法 k-modes算法 WEB日志分析
下载PDF
一种改进的K-Prototypes聚类算法 被引量:1
11
作者 吴孟书 吴喜之 《统计与决策》 CSSCI 北大核心 2008年第5期24-26,共3页
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度... 传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。 展开更多
关键词 高维混合数据 投影寻踪聚类 k—Prototyes聚类
下载PDF
不同强度运动抑制糖尿病大鼠肾脏PI3K/AKT/mTOR信号通路改善自噬的比较
12
作者 周鸿雁 张译丹 +1 位作者 季威 刘霞 《中国组织工程研究》 CAS 北大核心 2025年第11期2310-2318,共9页
背景:2型糖尿病损害肾功能。研究表明运动干预可以保护肾脏;鸢尾素可以通过抑制磷脂酰肌醇3-激酶/蛋白激酶B/雷帕霉素靶蛋白信号通路恢复自噬,保护糖尿病肾病患者的肾功能。目的:探讨运动能否通过抑制肾脏磷脂酰肌醇3-激酶/蛋白激酶B/... 背景:2型糖尿病损害肾功能。研究表明运动干预可以保护肾脏;鸢尾素可以通过抑制磷脂酰肌醇3-激酶/蛋白激酶B/雷帕霉素靶蛋白信号通路恢复自噬,保护糖尿病肾病患者的肾功能。目的:探讨运动能否通过抑制肾脏磷脂酰肌醇3-激酶/蛋白激酶B/雷帕霉素靶蛋白信号通路过度激活来恢复自噬,改善肾损伤,以及分析不同方式运动产生影响的差异。方法:将6周龄的SD大鼠随机分为空白对照组(正常大鼠)和糖尿病组,其中糖尿病组大鼠经过高脂高糖喂养加腹腔注射低剂量1%链脲佐菌素(30 mg/kg)建立2型糖尿病模型。造模成功后再将糖尿病组大鼠随机分成糖尿病模型组、中强度持续运动组和高强度间歇运动组。两个运动组大鼠分别进行8周不同强度运动干预。取材后采用葡萄糖氧化酶法检测大鼠空腹血糖,使用试剂盒检测糖化血红蛋白水平,Elisa法检测血清胰岛素浓度,计算胰岛素抵抗指数,RT-PCR检测肾组织磷脂酰肌醇3-激酶、蛋白激酶B、雷帕霉素靶蛋白、Beclin-1、podocin、nephrin的基因表达量,Western Blot检测肾组织雷帕霉素靶蛋白及自噬标记蛋白LC3-1、LC3-2、Beclin-1的蛋白表达量。结果与结论:①2型糖尿病大鼠空腹血糖和糖化血红蛋白水平极显著性升高,胰岛素抵抗水平显著上升,胰岛素水平显著下降;两种运动均能使2型糖尿病大鼠空腹血糖和糖化血红蛋白水平极显著下降,胰岛素抵抗水平显著下降,胰岛素水平显著上升;与中强度持续运动组相比,高强度间歇运动组胰岛素水平显著上升。②2型糖尿病大鼠podocin、nephrin基因表达量显著降低;两种不同形式运动均能显著提高其表达;与高强度间歇运动组相比,中等强度持续性运动组足细胞相关蛋白基因表达有进一步上升趋势,但无显著性差异。③2型糖尿病大鼠肾组织磷脂酰肌醇3-激酶、蛋白激酶B、mTORC1的mRNA及蛋白的表达量显著增加,自噬标志蛋白Beclin-1、LC3-2表达量以及LC3-2/LC3-1显著降低;两种不同形式运动均能使肾组织磷脂酰肌醇3-激酶、蛋白激酶B、mTORC1的mRNA及雷帕霉素靶蛋白蛋白的表达量显著降低,自噬标志蛋白Beclin-1、LC3-2以及LC3-2/LC3-1显著升高;与中等强度持续性运动组相比,高强度间歇运动的磷脂酰肌醇3-激酶、蛋白激酶B、mTORC1的mRNA及雷帕霉素靶蛋白的蛋白表达量有进一步下降的趋势,Beclin-1、LC3-2以及LC3-2/LC3-1有进一步升高的趋势,但仅Beclin-1有显著性差异。④结果说明2型糖尿病肾脏足细胞损伤,自噬受到抑制,与磷脂酰肌醇3-激酶/蛋白激酶B/mTORC1信号通路被异常激活密切相关。高强度间歇运动和中等强度持续性运动可以保护糖尿病肾脏,减少足细胞损伤,促进自噬恢复,这可能与运动抑制磷脂酰肌醇3-激酶/蛋白激酶B/雷帕霉素靶蛋白信号通路过度激活有关。与中等强度持续性运动相比,高强度间歇运动恢复自噬的效果呈更优趋势,但足细胞蛋白表达稍有下降。 展开更多
关键词 糖尿病肾病 足细胞 自噬 高强度间歇运动 中等强度持续性运动 PI3k AkT mTOR
下载PDF
基于改进k-prototypes算法的Web日志分析系统的设计与实现
13
作者 罗冬梅 《吉林工程技术师范学院学报》 2015年第5期93-96,共4页
设计了一个基于改进k-prototypes算法的Web日志分析系统,结合学校网站采集的数据针对相关技术算法进行了应用及分析。
关键词 数据挖掘 WEB日志 k-prototypes算法
下载PDF
一种面向混合型数据聚类的k-prototypes聚类算法 被引量:7
14
作者 贾子琪 宋玲 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1845-1852,共8页
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高... 同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性. 展开更多
关键词 k-prototypes 混合型相异度系数 分类型数据 数值型数据 混合型数据
下载PDF
一种有效的Gk-prototypes聚类算法 被引量:1
15
作者 郭映江 徐蔚鸿 +1 位作者 陈沅涛 文泽林 《计算机工程与科学》 CSCD 北大核心 2019年第9期1693-1699,共7页
针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足,提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。在经典的k-prototypes聚类算法的基础上,利用去模糊相似矩阵来构造粗粒子集,结合粒... 针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足,提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。在经典的k-prototypes聚类算法的基础上,利用去模糊相似矩阵来构造粗粒子集,结合粒计算和最大最小距离法确定初始聚类中心,并改进了目标函数。实验结果和理论分析表明,Gk-prototypes聚类算法与其他基于k-prototypes的改进算法相比,聚类更准确,有效性更好,鲁棒性更强。 展开更多
关键词 k-prototypes聚类 去模糊相似矩阵 粒计算 最大最小距离法
下载PDF
基于改进式k-prototypes聚类的坏数据辨识与修正 被引量:7
16
作者 王孝慈 董树锋 +2 位作者 刘育权 王莉 李俊格 《电测与仪表》 北大核心 2022年第2期9-15,共7页
工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征... 工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征,削弱负荷坏数据对聚类结果的影响,使坏数据辨识和修复结果更准确。改进式k-prototypes算法通过随机初始化,并行计算择优,克服了标准k-prototypes容易随初始聚类中心陷入局部最优解的缺陷;并通过聚类数量的自适应处理,解决了主观决定聚类数量的问题。基于聚类结果,根据正态分布原则确定负荷数据可行域,识别坏数据,并利用类中心置换法进行修正。实验表明,该方法较只考虑负荷数据的模糊均值聚类法效果更好,坏数据识别的召回率与修正的准确率显著提高。 展开更多
关键词 k-prototypes聚类 混合数据集聚类 坏数据辨识 类中心置换修正法 工业负荷预处理
下载PDF
Improvement of the Fit of Bra Prototypes Developed Based on the Existing Bodice Blocks for Adult Women 被引量:1
17
作者 刘驰 王利珍 +1 位作者 贾培培 徐步高 《Journal of Donghua University(English Edition)》 EI CAS 2018年第3期244-251,共8页
An in-depth study of bra pattern designs based on the existing bodice blocks was conducted to improve bra fit.The two popular bra prototypes,D's and Y's prototypes developed based on the existing bodice blocks... An in-depth study of bra pattern designs based on the existing bodice blocks was conducted to improve bra fit.The two popular bra prototypes,D's and Y's prototypes developed based on the existing bodice blocks for adult women,were first analyzed to understand their structural differences.Four bra samples were created and modified with respect to the standard shape and size of 75 B female mannequin breasts to compare the fit of the two bra prototypes.The fitness of these four bra samples was then tested on the mannequin and also on a real model of the same size.The examples demonstrated in the paper illustrate the principles and procedures for designing good-fit bras,and the bodice blocks using to develop bra prototypes in this study can also be replaced and widespread applied in other kind of bodice blocks in the future. 展开更多
关键词 bra prototype bodice block pattern design intimate apparel bra fit
下载PDF
Few-shot image recognition based on multi-scale features prototypical network
18
作者 LIU Jiatong DUAN Yong 《High Technology Letters》 EI CAS 2024年第3期280-289,共10页
In order to improve the models capability in expressing features during few-shot learning,a multi-scale features prototypical network(MS-PN)algorithm is proposed.The metric learning algo-rithm is employed to extract i... In order to improve the models capability in expressing features during few-shot learning,a multi-scale features prototypical network(MS-PN)algorithm is proposed.The metric learning algo-rithm is employed to extract image features and project them into a feature space,thus evaluating the similarity between samples based on their relative distances within the metric space.To sufficiently extract feature information from limited sample data and mitigate the impact of constrained data vol-ume,a multi-scale feature extraction network is presented to capture data features at various scales during the process of image feature extraction.Additionally,the position of the prototype is fine-tuned by assigning weights to data points to mitigate the influence of outliers on the experiment.The loss function integrates contrastive loss and label-smoothing to bring similar data points closer and separate dissimilar data points within the metric space.Experimental evaluations are conducted on small-sample datasets mini-ImageNet and CUB200-2011.The method in this paper can achieve higher classification accuracy.Specifically,in the 5-way 1-shot experiment,classification accuracy reaches 50.13%and 66.79%respectively on these two datasets.Moreover,in the 5-way 5-shot ex-periment,accuracy of 66.79%and 85.91%are observed,respectively. 展开更多
关键词 few-shot learning multi-scale feature prototypical network channel attention label-smoothing
下载PDF
基于改进K-prototypes与GBDT的城市干道车辆出行群体辨识模型
19
作者 梁灯 蔡晓禹 +1 位作者 彭博 邢茹茹 《华东交通大学学报》 2023年第5期49-58,共10页
为了掌握城市干道交通运行规律,向交通管理部门制定相关交通需求管理政策提供理论依据,提出了一种基于组合模型的城市干道车辆出行群体辨识模型。基于青岛市胶州湾隧道过车数据,从出行强度、出行时间与出行习惯3个维度构建了出行特征指... 为了掌握城市干道交通运行规律,向交通管理部门制定相关交通需求管理政策提供理论依据,提出了一种基于组合模型的城市干道车辆出行群体辨识模型。基于青岛市胶州湾隧道过车数据,从出行强度、出行时间与出行习惯3个维度构建了出行特征指标体系以全面刻画车辆个体的出行行为。基于相关性分析剔除了冗余指标以避免对辨识研究的影响。针对混合属性出行特征指标数据,使用改进K-prototypes算法以有效地实现车辆出行群体划分,将其与GBDT算法相结合,建立了一种基于改进K-prototypes与GBDT的辨识模型,随机选取10000个样本开展辨识研究。结果表明:研究道路存在5类车辆出行群体:高频通勤群体、低频通勤群体、营运群体、频次稳定群体与普通群体,对于这5类车辆出行群体,平均识别准确率为97.75%,最高识别准确率可达99.47%。 展开更多
关键词 城市道路交通 群体辨识 出行特征 改进k-prototypes&GBDT
下载PDF
面向本地差分隐私的K-Prototypes聚类方法 被引量:3
20
作者 张国鹏 陈学斌 +2 位作者 王豪石 翟冉 马征 《计算机应用》 CSCD 北大核心 2022年第12期3813-3821,共9页
为了在聚类分析中保护数据隐私的同时确保数据的可用性,提出一种基于本地化差分隐私(LDP)技术的隐私保护聚类方案——LDPK-Prototypes。首先,用户对混合型数据集进行编码;其次,采用随机响应机制对敏感数据进行扰动,而第三方在收集到用... 为了在聚类分析中保护数据隐私的同时确保数据的可用性,提出一种基于本地化差分隐私(LDP)技术的隐私保护聚类方案——LDPK-Prototypes。首先,用户对混合型数据集进行编码;其次,采用随机响应机制对敏感数据进行扰动,而第三方在收集到用户的扰动数据后以最大限度恢复原始数据集;然后,执行K-Prototypes聚类算法,在聚类过程中,使用相异性度量方法确定初始聚类中心,并利用熵权法重新定义新的距离计算公式。理论分析和实验结果表明,所提方案与基于中心化差分隐私(CDP)技术的ODPC算法相比,在Adult和Heart数据集上的平均准确率分别提高了2.95%和12.41%,有效提高了聚类的可用性。同时,LDPK-Prototypes扩大了数据之间的差异性,有效避免了局部最优,提高了聚类算法的稳定性。 展开更多
关键词 本地化差分隐私 k-prototypes 随机响应机制 熵权法 隐私保护
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部