期刊文献+
共找到89篇文章
< 1 2 5 >
每页显示 20 50 100
基于聚类挖掘的科技数据价值动态监测方法
1
作者 吴浩 罗少辉 +1 位作者 李颖昕 肖巧洁 《自动化技术与应用》 2024年第2期81-84,106,共5页
由于传统的科技数据存在噪声较多,导致科技数据价值动态监测效果较差等问题,提出一种基于聚类挖掘的科技数据价值动态监测方法。预先采用聚类挖掘方法对数据挖掘与聚类,建立动态距离函数,在此基础上对数据自身属性的识别,使相邻之间的... 由于传统的科技数据存在噪声较多,导致科技数据价值动态监测效果较差等问题,提出一种基于聚类挖掘的科技数据价值动态监测方法。预先采用聚类挖掘方法对数据挖掘与聚类,建立动态距离函数,在此基础上对数据自身属性的识别,使相邻之间的数据进行特性交换与结合,并对数据噪声去除,实现基于聚类挖掘的科技数据价值动态监测。实验结果表明,所研究的监测方法在正常数据下和入侵数据下都能够在短时间内实现数据价值动态监测,并且在入侵数据下也能够实现准确监测,满足方法设计需求。 展开更多
关键词 聚类挖掘 科技数据价值 动态监测 邻域
下载PDF
基于云计算与群体智能算法的大数据聚类挖掘技术研究
2
作者 崔翔 《中文科技期刊数据库(全文版)工程技术》 2023年第6期0024-0027,共4页
现阶段,云计算技术不断推广应用,与此同时,大数据、物联网等技术也在不断发展优化。随着数据时代的到来,每时每刻都有大量的数据生成,数据呈现爆炸式增长趋势,而对海量的数据进行挖掘,提升数据利用价值成为技术研究的重点领域。数据挖... 现阶段,云计算技术不断推广应用,与此同时,大数据、物联网等技术也在不断发展优化。随着数据时代的到来,每时每刻都有大量的数据生成,数据呈现爆炸式增长趋势,而对海量的数据进行挖掘,提升数据利用价值成为技术研究的重点领域。数据挖掘是计算机科学技术的新方向,通过构建多个模型和数据分析工具可以对数据间的联系进行分析,使用强大的算法来收集人们关心的数据。在云计算数据挖掘工具中,聚类分析技术更常用于对数据集进行分组,可以提升模型分析准确性。本文基于云计算和群体智能算法,研究大数据聚类挖掘技术应用,开展仿真实验分析,对比不同聚类挖掘算法结果,验证群体智能算法的聚类效果和准确率更高。 展开更多
关键词 云计算 群体智能算法 大数据 聚类挖掘技术
下载PDF
基于蚁群算法的大学生体育锻炼行为特征聚类挖掘方法
3
作者 周梦天 《安阳工学院学报》 2023年第2期118-123,共6页
以改善聚类分析质量,更好地挖掘大学生体育锻炼行为特征为目的,研究基于蚁群算法的大学生体育锻炼行为特征聚类挖掘方法。通过背景减除的方式确定体育锻炼视频图像中的大学生身体,获取其二值图像,通过图像矩判断体育锻炼中大学生身体的... 以改善聚类分析质量,更好地挖掘大学生体育锻炼行为特征为目的,研究基于蚁群算法的大学生体育锻炼行为特征聚类挖掘方法。通过背景减除的方式确定体育锻炼视频图像中的大学生身体,获取其二值图像,通过图像矩判断体育锻炼中大学生身体的质心,结合局部二值模式直方图特征与质心速度特征获取体育锻炼行为特征向量。构建基于蚁群算法的聚类模型,根据体育锻炼行为特征向量间的一致度实现体育锻炼行为特征聚类。同时针对蚁群算法收敛效率差,且有较大概率产生停滞问题的缺陷,通过优化信息素更新方式与蚂蚁选择路径方式优化蚁群算法。实验结果显示该方法能够准确提取体育锻炼行为特征,获取高质量的体育锻炼行为特征聚类结果。 展开更多
关键词 蚁群算法 体育锻炼 行为特征 聚类挖掘 质心 信息素更新
下载PDF
基于云计算的大数据聚类挖掘算法研究
4
作者 何庆 钟维坚 +2 位作者 覃志智 林锋 唐苏东 《中国新通信》 2023年第24期19-21,共3页
基于云计算的大数据聚类挖掘,需要结合改进粒子群算法、k-means算法的优势,提出基于改进粒子群优化(Particle Swarm Optimization,PSO)的k-means聚类算法,设置自调节惯性权重、云变异算子,根据数据集种群的进化程度,调整粒子群算法的全... 基于云计算的大数据聚类挖掘,需要结合改进粒子群算法、k-means算法的优势,提出基于改进粒子群优化(Particle Swarm Optimization,PSO)的k-means聚类算法,设置自调节惯性权重、云变异算子,根据数据集种群的进化程度,调整粒子群算法的全局搜索、局部搜索能力,追踪数据粒子的个体极值、全局极值,更新每个数据个体在解空间中的点位置、更新速度,并在数据种群进化到一定程度时进行变异操作,选择全局极值作为期望Ex来控制种群迭代次数,避免数据挖掘陷入早熟收敛、局部最优解的情况。 展开更多
关键词 云计算 大数据 k-means聚类挖掘算法 粒子群优化
下载PDF
基于页面内容和站点结构的页面聚类挖掘算法 被引量:20
5
作者 杨怡玲 管旭东 尤晋元 《软件学报》 EI CSCD 北大核心 2002年第3期467-469,共3页
提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,... 提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,发现的频繁访问页组的兴趣性高. 展开更多
关键词 日志分析 页面内容 站点结构 数据库 数据挖掘 页面聚类挖掘算法
下载PDF
多尺度聚类挖掘算法 被引量:7
6
作者 韩玉辉 赵书良 +2 位作者 柳萌萌 罗燕 丁亚飞 《计算机科学》 CSCD 北大核心 2016年第8期244-248,共5页
数据挖掘领域在多尺度研究上已取得了一些进展。然而,当前研究主要集中于空间、图像数据的多尺度挖掘,并且传统的聚类挖掘并未对数据集的多尺度特性进行单独的研究。针对存在的问题,进行了普适性的多尺度聚类挖掘理论和方法的研究。首先... 数据挖掘领域在多尺度研究上已取得了一些进展。然而,当前研究主要集中于空间、图像数据的多尺度挖掘,并且传统的聚类挖掘并未对数据集的多尺度特性进行单独的研究。针对存在的问题,进行了普适性的多尺度聚类挖掘理论和方法的研究。首先,根据概念分层理论扩展尺度定义并构建多尺度数据集;其次,阐述尺度转换原因、分类,归纳多尺度聚类的定义;然后,以克里格法为理论基础,给出多尺度聚类尺度上推算法MSCSUA和多尺度聚类尺度下推算法MSCSDA;最后,利用公用UCI聚类数据集和H省全员人口真实数据集对算法进行实验验证,结果表明MSCSUA和MSCSDA是有效、可行的。 展开更多
关键词 多尺度 尺度转换 多尺度聚类挖掘 克里格法
下载PDF
基于滑动窗口的支持泛在应用的流聚类挖掘算法 被引量:4
7
作者 宋宝燕 张衡 +2 位作者 于洋 奚丽娜 王大玲 《小型微型计算机系统》 CSCD 北大核心 2008年第12期2262-2267,共6页
近年来,泛在数据流挖掘逐渐成为数据挖掘发展的新热点,它具有在有限的资源上去挖掘无限的数据流,并可随时随地返回挖掘结果的特点,对此,本文提出一种基于滑动窗口的流聚类算法;该方法将一个滑动窗口分成n个大小相等的窗口单元,基于窗口... 近年来,泛在数据流挖掘逐渐成为数据挖掘发展的新热点,它具有在有限的资源上去挖掘无限的数据流,并可随时随地返回挖掘结果的特点,对此,本文提出一种基于滑动窗口的流聚类算法;该方法将一个滑动窗口分成n个大小相等的窗口单元,基于窗口单元进行增量式的知识相关性的挖掘,提高了流挖掘的效率;当窗口滑动时,通过衰变函数衰减当前滑动窗口内的第一个窗口单元的挖掘结果,并在当前滑动窗口挖掘结果中将其剔除,实现下一滑动窗口的增量式挖掘. 展开更多
关键词 滑动窗口 聚类挖掘 非线性数据流
下载PDF
面向聚类挖掘的局部旋转扰动隐私保护算法 被引量:7
8
作者 刘洪伟 石雅强 +1 位作者 梁周扬 肖岳 《广东工业大学学报》 CAS 2012年第3期28-34,45,共8页
聚类挖掘可以高效准确地从数据中找出很多潜在的、有价值的规律,但也同时存在着泄露用户隐私数据的安全威胁.已经有一些专门针对聚类挖掘的隐私保护研究,其中乘法扰动方法是一种准确性和安全性都较高的隐私保护算法.研究发现已知信息独... 聚类挖掘可以高效准确地从数据中找出很多潜在的、有价值的规律,但也同时存在着泄露用户隐私数据的安全威胁.已经有一些专门针对聚类挖掘的隐私保护研究,其中乘法扰动方法是一种准确性和安全性都较高的隐私保护算法.研究发现已知信息独立分量分析极大地降低了已有乘法扰动方法的安全性,它能够从乘法扰动数据中近似估计隐私数据.为了解决以上问题,提出了局部旋转扰动隐私保护算法,通过准确性分析得出新算法具有零损失准确性.利用安全性分析证明新算法能够有效抵御独立分量分析的攻击,具有更高的安全性.将新算法应用到聚类挖掘中,得到了与未加隐私保护的聚类挖掘非常接近的结果,说明了它的可行性.局部旋转扰动方法的出现,有效地解决了已有乘法扰动方法的安全漏洞,使得聚类挖掘能够更加安全地得到应用. 展开更多
关键词 聚类挖掘 隐私保护 乘法扰动 局部旋转扰动
下载PDF
一种聚类挖掘软件数据的方法 被引量:8
9
作者 尹云飞 钟智 《河南科技大学学报(自然科学版)》 CAS 2004年第2期37-41,共5页
提出了一种聚类挖掘软件数据的方法。首先将一组软件数据的最可能分类情况称为“中心知识” ,将该组数据的所有可能分类结果称为“知识的浮动域” ,最后将“中心知识”对应分类的可信程度称为“知识的正确度”。分类结果的评价标准主要... 提出了一种聚类挖掘软件数据的方法。首先将一组软件数据的最可能分类情况称为“中心知识” ,将该组数据的所有可能分类结果称为“知识的浮动域” ,最后将“中心知识”对应分类的可信程度称为“知识的正确度”。分类结果的评价标准主要考虑到 :分类数目适中 ,每个类内半径尽可能小 ,类间距离尽可能大的分类结果具有较高的评价分数。进行的“软件数据挖掘实验”结果表明 ,这种方法更加准确、更加切合实际 ,从理论和实践上证明了软件数据挖掘具有广阔的发展前景。 展开更多
关键词 聚类挖掘软件 数据采集 数据处理 软件工程 数据挖掘
下载PDF
面向路线图编制的模糊均值文本聚类挖掘方法研究 被引量:1
10
作者 李向东 刘晓斌 +1 位作者 武利平 常洪梅 《河北工业大学学报》 CAS 北大核心 2011年第3期40-44,共5页
为满足技术路线图编制需要,针对模糊c均值对初始值敏感和稳定性差的缺点,通过引入遗传算法和类的概念向量,提出了一种改进的模糊均值文本聚类挖掘方法——CGFCM方法.首先根据遗传算法全局搜索的特点,CGFCM方法利用遗传算法求出文本的初... 为满足技术路线图编制需要,针对模糊c均值对初始值敏感和稳定性差的缺点,通过引入遗传算法和类的概念向量,提出了一种改进的模糊均值文本聚类挖掘方法——CGFCM方法.首先根据遗传算法全局搜索的特点,CGFCM方法利用遗传算法求出文本的初始聚类中心,然后利用类的概念向量,建立概念向量矩阵,使用迭代概念向量矩阵完成文本的模糊聚类划分,实现文本聚类挖掘.最后通过实例对比,验证了CGFCM方法的挖掘效果. 展开更多
关键词 文本聚类挖掘 模糊C均值 矩阵 遗传算法
下载PDF
基于关联规则的聚类挖掘在远程教育中的应用 被引量:3
11
作者 王新颖 王向丽 张文华 《现代远距离教育》 CSSCI 2008年第4期12-14,共3页
阐述了在远程教育的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小... 阐述了在远程教育的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小的网页排除在聚类外。 展开更多
关键词 聚类挖掘 远程教育 关联规则
下载PDF
云环境下基于群智能算法的大数据聚类挖掘技术 被引量:9
12
作者 刘云恒 《现代电子技术》 北大核心 2019年第9期65-67,71,共4页
云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法... 云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法。首先对云计算Hadoop框架的存储数据能力和采用的Map Reduce计算模型进行分析,然后采用群智能算法对传统数据挖掘K-means聚类算法进行改进,解决其容易陷入局部最优问题。实验结果表明,相比加权K-means聚类算法,提出的改进算法表现出更好的聚类精度和运行速度,可以适用于大规模数据的聚类挖掘。 展开更多
关键词 大数据聚类挖掘 云计算模型分析 分析 算法设计 算法优化 算法改进
下载PDF
面向聚类挖掘的个性化隐私保护算法 被引量:3
13
作者 徐东 李贤 +2 位作者 张子迎 孟宇龙 冯光升 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第11期1779-1785,共7页
针对数据挖掘过程中隐私保护问题,本文提出一种面向聚类挖掘的个性化隐私保护算法。该算法界定了隐私度概念及其编码表示,并构造了由原始数据和隐私度共同描述的隐私数据模型。同时对隐私数据进行拓扑分类以获得隐私数据敏感性的线序集... 针对数据挖掘过程中隐私保护问题,本文提出一种面向聚类挖掘的个性化隐私保护算法。该算法界定了隐私度概念及其编码表示,并构造了由原始数据和隐私度共同描述的隐私数据模型。同时对隐私数据进行拓扑分类以获得隐私数据敏感性的线序集。该算法在原始数据、隐私度、元组敏感度、隐私线序集等视图上进行多视图聚类,结合可变k-匿名策略提出面向多视图聚类的满足个性化需求的隐私保护算法,以对不同聚类簇以及同簇内部元组施加程度有别的个性化保护操作。该算法在一定程度上降低了隐私数据在聚类挖掘过程中泄漏的风险。实验结果表明该算法具有较低的信息损失和较好的运行效率,实验验证了所提算法的可行性。 展开更多
关键词 信息安全 隐私保护 个性化 聚类挖掘 隐私度 多视图
下载PDF
聚类挖掘在电子商务中的应用 被引量:2
14
作者 李勇 王新颖 《商场现代化》 北大核心 2007年第09S期103-104,共2页
阐述了在电子商务系统中的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联... 阐述了在电子商务系统中的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小的网页排除在聚类外。 展开更多
关键词 聚类挖掘 电子商务 关联规则 超图
下载PDF
云环境下基于群智能算法的大数据聚类挖掘技术 被引量:11
15
作者 郑琳 张辉 《现代电子技术》 北大核心 2020年第15期115-118,共4页
传统的大数据聚类挖掘技术由于迭代次数过多,使其并行效率下降,为此,设计云环境下基于群智能算法的大数据聚类挖掘技术。在云环境下采用群智能算法初始化聚类中心,计算数据密度参数及类间距离,根据计算结果更新聚类中心,输出距离最小的... 传统的大数据聚类挖掘技术由于迭代次数过多,使其并行效率下降,为此,设计云环境下基于群智能算法的大数据聚类挖掘技术。在云环境下采用群智能算法初始化聚类中心,计算数据密度参数及类间距离,根据计算结果更新聚类中心,输出距离最小的最优解即为最优划分聚类,设计并行化聚类挖掘,以输出的最优解为依据,完成大数据聚类挖掘。实验结果表明,在数据集相同的情况下,与传统的两种聚类挖掘算法相比,文中设计的云环境下的群智能算法的大数据聚类挖掘算法随着迭代次数的增加,依然保持较高的并行效率,没有出现下降的趋势,说明该算法适合应用在实际项目中。 展开更多
关键词 大数据聚类挖掘 云环境 群智能算法 数据挖掘 并行化聚类挖掘 数据密度计算
下载PDF
聚类挖掘在高校图书馆管理系统中的应用 被引量:5
16
作者 韩存鸽 《重庆理工大学学报(自然科学)》 CAS 2012年第11期83-87,共5页
介绍了聚类挖掘的基本理论。对武夷学院图书馆提供的流通数据进行了聚类分析,主要采集读者借阅册数和图书流通量2类数据,在Clementine中使用K-means模型从读者的借阅册数角度进行分类,将读者划分成"活跃读者""消极读者&q... 介绍了聚类挖掘的基本理论。对武夷学院图书馆提供的流通数据进行了聚类分析,主要采集读者借阅册数和图书流通量2类数据,在Clementine中使用K-means模型从读者的借阅册数角度进行分类,将读者划分成"活跃读者""消极读者"及"一般读者"3类。根据图书流通量进行分类,将图书分成"热门书""冷门书"及"一般书"3类。根据聚类挖掘的结果,为不同类的读者提供不同的服务,针对不同类的图书采取相应的措施。 展开更多
关键词 聚类挖掘 CLEMENTINE K-means模型
下载PDF
Hadoop云平台下基于P-WAP的大数据聚类挖掘算法 被引量:3
17
作者 顾东虎 《长春师范大学学报》 2020年第10期29-35,共7页
传统AP聚类算法性能会随着数据规模扩大和结构复杂化而快速衰减,为此在Hadoop云平台下提出基于P-WAP的聚类挖掘算法。用邻域相似度指标替代传统AP算法中欧式距离相似度,提高聚类算法应对大规模数据的能力,将样本集合中的数据集分配给Had... 传统AP聚类算法性能会随着数据规模扩大和结构复杂化而快速衰减,为此在Hadoop云平台下提出基于P-WAP的聚类挖掘算法。用邻域相似度指标替代传统AP算法中欧式距离相似度,提高聚类算法应对大规模数据的能力,将样本集合中的数据集分配给Hadoop云平台中的数据处理节点,利用平台并行计算能力对待处理数据集进行加权聚类,优化算法性能。实验结果表明,所提算法在海量数据规模下拥有更高的聚类效率,在聚类准确率和时间复杂度控制方面效果更好。 展开更多
关键词 Hadoop云平台 P-WAP 并行计算 聚类挖掘
下载PDF
面向大数据的聚类挖掘算法研究 被引量:2
18
作者 龚静 《中国新技术新产品》 2022年第14期51-54,共4页
目前在对数十种乃至数百种物品进行分析时,由于运算能力的增长,采用手工方法进行统计不但耗费大量的计算时间,而且还会发生计算错误的。因此需要用某种方法对各种东西进行归类,进而产生了几种对数据进行处理的聚类的方法。该文对大数据... 目前在对数十种乃至数百种物品进行分析时,由于运算能力的增长,采用手工方法进行统计不但耗费大量的计算时间,而且还会发生计算错误的。因此需要用某种方法对各种东西进行归类,进而产生了几种对数据进行处理的聚类的方法。该文对大数据进行了分析,研究了数据挖掘算法,建立了个性化的推荐系统,不会对公共资源造成浪费。 展开更多
关键词 大数据 聚类挖掘算法 计算
下载PDF
银行卡客户群体聚类挖掘研究 被引量:2
19
作者 关莉莉 《微计算机信息》 北大核心 2008年第30期142-144,共3页
银行卡业务利润丰厚。通过数据预处理,建立数据立方体,数据挖掘,分析客户群体特征,有目标地发展银行卡客户,使银行获得更大利益。
关键词 银行卡 数据预处理 客户群体聚类挖掘
下载PDF
不确定性数据聚类挖掘研究综述 被引量:1
20
作者 金春霞 周海岩 《现代计算机》 2011年第3期10-12,共3页
根据目前数据挖掘研究的现状,分析不确定数据的聚类挖掘算法。针对不确定数据聚类挖掘存在的问题,提出改进传统的数据挖掘算法来适合不确定数据的聚类挖掘或找出新的聚类挖掘算法,来解决不确定数据聚类挖掘问题的新思路。
关键词 不确定性数据 聚类挖掘 数据挖掘
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部