期刊文献+
共找到32,497篇文章
< 1 2 250 >
每页显示 20 50 100
基于K-means算法的建筑群震害分析模型缩减方法
1
作者 陈夏楠 张令心 +1 位作者 林旭川 王祺 《世界地震工程》 北大核心 2024年第1期72-79,共8页
基于建筑群模型和弹塑性时程分析的精细化城市震害模拟技术能够为防震减灾及应急救援决策提供必要的依据和参考。为了减小城市建筑群震害模拟的计算量和计算时间,本文提出一种基于聚类算法的建筑群模型缩减方法。该方法采用K-means聚类... 基于建筑群模型和弹塑性时程分析的精细化城市震害模拟技术能够为防震减灾及应急救援决策提供必要的依据和参考。为了减小城市建筑群震害模拟的计算量和计算时间,本文提出一种基于聚类算法的建筑群模型缩减方法。该方法采用K-means聚类算法,首先基于建筑结构属性向量对建筑群进行聚类,将相似的建筑结构聚为一组;然后从每组选取一个代表建筑组成建筑群缩减模型,通过减少需要分析的建筑结构数量来减少建筑群震害模拟的计算量。本文对传统的K-means算法进行改进,通过设定组内建筑结构的差异上限自动调整聚类分组数量;提出将具体地震动作用下结构地震损伤指数作为结构属性向量进行聚类,并通过算例对比分别采用两种缩减模型,即基于损伤指数聚类的缩减模型与基于结构力学模型参数聚类的缩减模型,计算结构损伤状态准确程度。对比结果表明:在聚类分组数量相同的情况下,基于损伤指数的分组明显优于基于模型参数的分组,采用模型缩减方法能够在保证足够计算精度前提下显著减少建筑群震害模拟计算量和计算时间。 展开更多
关键词 城市建筑群 k-means算法 模型缩减 结构模型参数 地震损伤指数
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
2
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 k-means聚类 特征空间增强 mixup算法
下载PDF
基于特征分箱和K-Means算法的用户行为分析方法
3
作者 殷丽凤 路建政 《云南民族大学学报(自然科学版)》 CAS 2024年第2期251-257,共7页
针对网购用户所产生的购物行为进行分析,首先通过数据处理构建客户关系管理模型(RFM模型),在此模型的基础上采用特征分箱法和K-Means聚类两种方法对用户进行细分,并对2种模型结果进行比较分析,讨论二者的差异性和具体的应用范围和意义.... 针对网购用户所产生的购物行为进行分析,首先通过数据处理构建客户关系管理模型(RFM模型),在此模型的基础上采用特征分箱法和K-Means聚类两种方法对用户进行细分,并对2种模型结果进行比较分析,讨论二者的差异性和具体的应用范围和意义.其中,基于特征分箱法的RFM模型将变量转化到相似的尺度上并将变量离散化,使得用户分类标签更加清晰,也可依据各类标签分类出不同类型的用户.K-Means算法通过轮廓系数评估聚类算法质量以至于选取最优K值.本文实验分析结果可为运营商提供更加可靠直观的数据,使得运营商可以根据不同用户的不同行为进行市场细分,进而进行精准营销和服务设置. 展开更多
关键词 特征分箱 k-means算法 用户行为 RFM模型 网购
下载PDF
启发式k-means聚类算法的改进研究
4
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 聚类算法 k-means 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
一种融合乌鸦搜索算法的K-means聚类算法
5
作者 高海宾 《新乡学院学报》 2024年第3期19-25,共7页
传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全... 传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全局搜索能力,自动确定最佳的聚类数目K,从而提高聚类的质量和效率。通过在Seeds数据集进行实验计算卡林斯基-哈拉巴斯(Calinski-Harabasz)指数等评价指标,发现该算法聚类效果明显优于传统的K-means算法。 展开更多
关键词 k-means算法 乌鸦搜索算法 聚类 Calinski-Harabasz指数
下载PDF
基于改进K-means算法的物流配送中心选址研究
6
作者 姚佼 吴秀荣 +3 位作者 李皓 谢贝贝 王诗璇 梁益铭 《物流科技》 2024年第5期10-13,19,共5页
针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类... 针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类别的影响因素,构建了相应的影响因素指标体系,提出的模型能够识别输入数据的数值型及类别型数据,实现样本的有效聚类。相关的案例分析结果表明,相比传统K-means聚类,文章的改进K-means算法选址结果可使物流总成本降低8.76%,运营成本降低14.85%,固定成本降低8.09%,效果显著。 展开更多
关键词 物流配送中心选址 k-means聚类算法 肘部法 轮廓系数法 独热编码
下载PDF
基于BBO优化K-means算法的WSN分簇路由算法
7
作者 彭程 谭冲 +1 位作者 刘洪 郑敏 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2024年第3期357-364,共8页
针对无线传感器网络中传感器节点能量有限、网络生存期短的问题,提出一种基于生物地理学算法优化K-means的无线传感器网络分簇路由算法BBOK-GA。成簇阶段,通过生物地理学优化算法改进K-means算法,避免求解时陷入局部最优。根据能量因子... 针对无线传感器网络中传感器节点能量有限、网络生存期短的问题,提出一种基于生物地理学算法优化K-means的无线传感器网络分簇路由算法BBOK-GA。成簇阶段,通过生物地理学优化算法改进K-means算法,避免求解时陷入局部最优。根据能量因子和距离因子设计了新的适应度函数选举最优簇首,完成分簇任务。数据传输阶段,则利用遗传算法为簇首节点搜寻到基站的最佳数据传输路径。仿真结果表明,相较于LEACH、LEACH-C、K-GA等算法,BBOK-GA降低了网络能耗,提高了网络吞吐量,延长了网络生存周期。 展开更多
关键词 无线传感器网络 生物地理学优化算法 遗传算法 k-means算法 分簇路由
下载PDF
基于参数化角编码的量子K-means算法
8
作者 冯微军 郭躬德 林崧 《量子电子学报》 CAS CSCD 北大核心 2024年第1期113-124,共12页
结合K-means算法和角编码技术,提出了一种无需量子随机存储(QRAM)的量子K-means算法。该算法利用量子操作的并行性,仅需对数数量的时间复杂度就能完成数据的加载;并且通过对输入数据进行参数预处理操作,确定数据分量的参数阈值,解决了... 结合K-means算法和角编码技术,提出了一种无需量子随机存储(QRAM)的量子K-means算法。该算法利用量子操作的并行性,仅需对数数量的时间复杂度就能完成数据的加载;并且通过对输入数据进行参数预处理操作,确定数据分量的参数阈值,解决了样本不同特征尺度差异的问题。该算法由编码数据、相似度度量、量子最小值搜索和质心迭代更新四个主要步骤组成,细致描述了这些步骤所涉及的算子和线路构建,并对关键线路进行了仿真模拟。实验结果和经典预测结果一致,验证了所提量子K-means算法的可靠性。此外,理论分析表明所提出算法相比于经典算法在运行时间上有平方级加速。 展开更多
关键词 量子光学 量子k-means算法 角编码 量子相位估计 多量子比特交换测试
下载PDF
基于随机森林算法和K-means算法的网络攻击识别方法
9
作者 荣文晶 高锐 +2 位作者 赵弘洋 云雷 彭辉 《电子产品可靠性与环境试验》 2024年第1期8-12,共5页
5G网络与核电的深度融合能够提升核电厂生产安全管控水平,减少人为事故,促进核电行业安全和经济发展。但由于网络的接入,为核电安全生产带来了一定的安全风险,恶意攻击者会通过向核电5G网络发起攻击进而破坏核电生产。为了解决核电5G网... 5G网络与核电的深度融合能够提升核电厂生产安全管控水平,减少人为事故,促进核电行业安全和经济发展。但由于网络的接入,为核电安全生产带来了一定的安全风险,恶意攻击者会通过向核电5G网络发起攻击进而破坏核电生产。为了解决核电5G网络场景下面临的网络异常和恶意攻击的问题,提出了一种在核电5G网络场景下基于随机森林算法和K-means算法的实时网络异常检测和网络攻击识别方法,对于提高核电网络安全具有重要的意义。 展开更多
关键词 随机森林算法 k-means算法 网络异常检测 网络攻击识别
下载PDF
基于K-means聚类的多种群麻雀搜索算法 被引量:1
10
作者 闫少强 刘卫东 +2 位作者 杨萍 吴丰轩 阎哲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期508-518,共11页
为改善麻雀搜索算法(SSA)在单种群搜索中收敛速度过快导致其收敛速度出现冗余,易忽略优质解而陷入局部最优的缺陷,提出一种基于K-means聚类的多种群麻雀搜索算法(KSSA)。将多种群机制引入SSA,减弱单种群的收敛能力,并减小陷入局部最优... 为改善麻雀搜索算法(SSA)在单种群搜索中收敛速度过快导致其收敛速度出现冗余,易忽略优质解而陷入局部最优的缺陷,提出一种基于K-means聚类的多种群麻雀搜索算法(KSSA)。将多种群机制引入SSA,减弱单种群的收敛能力,并减小陷入局部最优的概率;采用K-means聚类划分子种群,增加子种群间的差异性,同时使子种群内个体在小范围内专注搜索,提升前期搜索效率;借助加权重心交流策略改善种群间交流的质量,减少自身种群的干扰,同时消减因某一子种群陷入局部最优而导致所有子种群陷入局部最优的风险;引入动态反向学习到警戒者中,增强其反捕食行为,改善因子种群数量增加而带来的收敛速度变慢和收敛精度不足的缺陷。经测试函数仿真实验表明:较SSA等算法,KSSA具有更优的寻优性能。 展开更多
关键词 麻雀搜索算法 优化算法 多种群 k-means聚类 种群交流
下载PDF
基于优化K-means算法的高校成绩聚类分析研究
11
作者 张梁 杨立波 +1 位作者 张小勇 史俊冰 《太原学院学报(自然科学版)》 2024年第2期79-84,共6页
针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-mean... 针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-means算法避免了区间分类不合理现象,更加准确地反映了成绩样本的分布特点。 展开更多
关键词 均值算法 分布密度 聚类 k-means
下载PDF
基于狄利克雷多项式过程模型与K-means结合的菌群分析
12
作者 彭显 贺建峰 《生物信息学》 2024年第1期47-57,共11页
群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据... 群体分型是一种有助于更好的理解人类身心健康等复杂生物学问题的有效方法,聚类是一种为了对样本分组来降低复杂性的定义肠型的方法,而传统K-means聚类算法的K值选取无法确定,本文在传统K-means聚类算法的基础上进行了改进,并公开数据集上进行了验证,实验表明改进算法能够解决K值选取无法确定的问题,且聚类结果的稳定性、准确性和聚类质量都得到显著提高。将改进后的模型运用于肠道菌群OTUs数据,发现不仅能够有效地区分2-型糖尿病患者样本间的相似性,而且能鉴定出影响菌群结构异质性最大的OTUs菌,为临床解决2-型糖尿病问题提供了一种新的思路。 展开更多
关键词 k-means算法 狄利克雷过程混合模型 菌群分析 群体分型 聚类
下载PDF
基于改进K-means数据聚类算法的网络入侵检测
13
作者 黄俊萍 《成都工业学院学报》 2024年第2期58-62,97,共6页
随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算... 随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算法求取最优初始聚类中心,实现K-means数据聚类算法的改进;最后以计算得出的特征值为输入项,实现对网络入侵行为的精准检测。结果表明:K-means算法改进后较改进前的戴维森堡丁指数更小,均低于0.6,达到了改进目的。改进K-means算法各样本的准确率均高于90%,相对更高,检测时间均低于10 s,相对更少,说明该方法能够以高效率完成更准确的网络入侵检测。 展开更多
关键词 改进k-means数据聚类算法 防火墙日志 入侵检测特征 粒子群算法 网络入侵检测
下载PDF
基于改进SVD++算法和K-means++算法的小文件合并方案
14
作者 张广龙 尹铁源 《长江信息通信》 2024年第1期55-60,共6页
文章提出了一种基于改进SVD++算法和K-means++算法的小文件合并方案。通过引入自适应学习率函数和基于并行分组的SVD++算法,优化了小文件的合并过程,以提高Hadoop存储小文件的效率。同时,利用K-means++算法对合并后的文件进行聚类,优化... 文章提出了一种基于改进SVD++算法和K-means++算法的小文件合并方案。通过引入自适应学习率函数和基于并行分组的SVD++算法,优化了小文件的合并过程,以提高Hadoop存储小文件的效率。同时,利用K-means++算法对合并后的文件进行聚类,优化了数据存储方式,降低了存储空间的浪费。在Hadoop平台上进行的实验表明,该方案在保持数据处理准确性和稳定性的同时,显著提升了Hadoop存储与处理小文件的性能。 展开更多
关键词 HADOOP 小文件合并 SVD++算法 k-means++算法
下载PDF
电网需求侧资源动态分布式k-means聚类算法
15
作者 黄静 饶尧 刘政 《大连交通大学学报》 CAS 2024年第2期109-114,共6页
为有效聚合电网需求侧资源,合理、高效利用电网资源,提出基于分布式k-means的电网需求侧资源动态聚类算法。通过基于置信半径的分布式k-means算法聚类采集到的电网需求侧资源数据,在模糊C均值进化神经网络中,以聚类得到的电网需求侧资... 为有效聚合电网需求侧资源,合理、高效利用电网资源,提出基于分布式k-means的电网需求侧资源动态聚类算法。通过基于置信半径的分布式k-means算法聚类采集到的电网需求侧资源数据,在模糊C均值进化神经网络中,以聚类得到的电网需求侧资源数据为输入向量,输出电网需求侧资源场景,依据场景存在概率,以电网侧资源日均峰谷差最小、DG消纳程度最高与日均负荷波动率最小为目标函数,以电网需求侧资源曲线波动率与负荷互补为约束条件,构建电网需求侧资源多场景聚类模型,经动态改变惯性因子(DCW)粒子群算法求解模型后,实现电网需求侧资源多场景聚类。试验结果表明:该方法可实现电网需求侧资源动态聚类,应用该方法聚类不同场景电网需求侧资源时的日负荷率较低,聚类效果较好,可满足实际电力需求侧资源动态聚类工作的需要。 展开更多
关键词 电网需求 侧资源 动态聚类 分布式 k-means算法 聚类模型
下载PDF
基于K-means聚类和极限学习机组合算法的短期光伏功率预测
16
作者 黄牧涛 邢芳菲 +1 位作者 陈兴邦 卢明 《水电能源科学》 北大核心 2024年第2期217-220,216,共5页
考虑光伏功率的预测精度强依赖于天气模态和气候条件等因素影响,提出了基于极限学习机组合算法的短期光伏功率预测方法。首先,基于K-means聚类算法进行天气分型,分为4个季节下晴天、多云天气、阴雨天气共12组不同天气类别。其次,针对天... 考虑光伏功率的预测精度强依赖于天气模态和气候条件等因素影响,提出了基于极限学习机组合算法的短期光伏功率预测方法。首先,基于K-means聚类算法进行天气分型,分为4个季节下晴天、多云天气、阴雨天气共12组不同天气类别。其次,针对天气分型结果,基于极限学习机ELM、遗传算法改进的极限学习机GA-ELM、鸟群算法改进的极限学习机BSA-ELM3种算法构建光伏功率预测模型。最后,以某光伏电站数据进行所提模型验证。预测结果表明,BSA-ELM预测精度最高,12种天气预测精度达到90%左右,各季节中预测精度最高的天气类型均为晴天,多云天气精度高于阴雨天气精度,可为含高比例光伏并网的新型电力系统安全稳定运行提供有效数据支撑。 展开更多
关键词 光伏发电功率预测 k-means聚类 天气分型 极限学习机算法 遗传算法 鸟群算法
下载PDF
基于K-means算法的跨国零售商客户细分研究
17
作者 崔雯 李剑锋 《中国商论》 2024年第9期37-40,共4页
随着经济全球化及大数据技术的蓬勃发展,跨国零售商之间的竞争日益激烈,根据客户特征进行客户细分,协助客户进行个性化的服务体验,有利于跨国零售商实现精准营销和高效的客户关系管理。为了提高客户细分的精度,本文提出一种基于RFM模型... 随着经济全球化及大数据技术的蓬勃发展,跨国零售商之间的竞争日益激烈,根据客户特征进行客户细分,协助客户进行个性化的服务体验,有利于跨国零售商实现精准营销和高效的客户关系管理。为了提高客户细分的精度,本文提出一种基于RFM模型的K-means聚类算法,使用簇内误方差(SSE)和轮廓系数(Silhouette Coefficient)计算聚类个数,优化K值选取。本文选取一家跨国零售商的数据进行实证检验,对细分后的结果进行特征分析,将客户划分为核心型客户、维护型客户和风险型客户三种类别,并为不同客户群体提供差异化营销策略,仅供参考。 展开更多
关键词 k-means RFM模型 跨国零售商 客户细分 聚类算法
下载PDF
基于融合改进K-means聚类算法的数据检测技术
18
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 k-means聚类 密度峰值检测 主成分分析法 离群检测算法 异常数据检测
下载PDF
基于随机森林和K-Means算法的高校学生评教指标的应用研究
19
作者 梅灿 陈琦 +1 位作者 郝亚兵 刘志鹏 《教育进展》 2024年第5期100-107,共8页
本文旨在探讨随机森林和K-means算法在高校学生评教体系中的应用及其有效性。首先,通过构建随机森林模型对评教数据进行拟合,分析模型的均方误差和拟合优度,验证其预测能力。进一步利用随机森林的特征重要性评估功能,筛选出对评教结果... 本文旨在探讨随机森林和K-means算法在高校学生评教体系中的应用及其有效性。首先,通过构建随机森林模型对评教数据进行拟合,分析模型的均方误差和拟合优度,验证其预测能力。进一步利用随机森林的特征重要性评估功能,筛选出对评教结果影响较大的指标,为优化评教体系提供科学依据。同时,对评教指标进行相关性分析,揭示指标间的相互关系。其次,采用K-means算法对评教数据进行聚类分析,通过轮廓系数确定最佳聚类数,并成功将数据划分为三个具有明显差异的聚类。聚类结果揭示了不同教师在教学理念、风格和要求上的多元性,为教学改进和提升提供了参考依据。本文的方法论和结果对优化高校学生评教体系、提升教学质量具有重要意义。 展开更多
关键词 学生评教 随机森林算法 k-means聚类算法 评价指标
下载PDF
基于Navie Bayes算法与k-means聚类算法的财务数据库异常检测
20
作者 周军侠 《微型电脑应用》 2024年第3期60-63,共4页
为了有效消除用户异常行为对企业财务数据库所带来的安全隐患,以往的数据库异常检测技术(如Navie Bayes算法)通常采用查询反馈,并建立用户行为特征(用户行为轮廓)的方法查找安全隐患,而该方法构建训练集耗时较多,效果不显著。因此,提出... 为了有效消除用户异常行为对企业财务数据库所带来的安全隐患,以往的数据库异常检测技术(如Navie Bayes算法)通常采用查询反馈,并建立用户行为特征(用户行为轮廓)的方法查找安全隐患,而该方法构建训练集耗时较多,效果不显著。因此,提出一种基于Navie Bayes算法与k-means聚类算法相结合的财务数据库异常检测技术。通过调取财务数据库运行日志中的用户查询内容及相应结果,采用k-means聚类算法进行用户分组,采用Navie Bayes算法构建异常检测模型。应用测试结果表明,与传统的用户行为轮廓算法相比,所提算法的训练效率更高,准确率大幅提高,综合F_(1)值有所提升,提高了财务数据的安全性。 展开更多
关键词 财务数据库 异常检测 Navie Bayes算法 安全隐患 k-means聚类算法
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部