期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
改进的全局K′-means算法及其在数据分类中的应用 被引量:6
1
作者 李大字 钱丽 +1 位作者 靳其兵 谭天伟 《信息与控制》 CSCD 北大核心 2011年第1期100-104,共5页
为了解决初始聚类中心的选择、簇个数的确定以及孤立点的避免等问题,提出了一种改进的全局K′-means算法.改进的算法不仅能够利用辅助聚类函数来计算初始点,而且能够利用目标函数在没有预定义聚类个数的前提下,找到实际的聚类中心个数,... 为了解决初始聚类中心的选择、簇个数的确定以及孤立点的避免等问题,提出了一种改进的全局K′-means算法.改进的算法不仅能够利用辅助聚类函数来计算初始点,而且能够利用目标函数在没有预定义聚类个数的前提下,找到实际的聚类中心个数,同时避免了孤立点问题.将改进的算法应用到实际数据集的分类中,并与改进的全局K-means算法以及K′-means算法进行了比较,实验结果证明所提出的算法能获得更好的聚类结果. 展开更多
关键词 全局K′-means算法 聚类算法 竞争惩罚机制
下载PDF
基于改进k~*-means算法的不完整公交到站时间填充 被引量:3
2
作者 赵霞 张勇 +2 位作者 尹宝才 刘浩 张可 《北京工业大学学报》 CAS CSCD 北大核心 2018年第1期135-143,共9页
为了有效填充不完整的公交到站时间信息,提出了一种基于改进k~*-means算法的不完整到站时间的填充方法.根据到站流动人数、到站所属时段、站点间距离、站点间运行时间特征加权度量站点间相似性,对现有kmeans算法进行改进以构建公交站点... 为了有效填充不完整的公交到站时间信息,提出了一种基于改进k~*-means算法的不完整到站时间的填充方法.根据到站流动人数、到站所属时段、站点间距离、站点间运行时间特征加权度量站点间相似性,对现有kmeans算法进行改进以构建公交站点间运行时间完备信息表.以北京市地面公交运行数据为例,验证了该方法的可靠性,并与线性拟合、最近邻插值、k-means算法等填充方法进行了对比试验.结果表明:该方法对不完整到站时间的填充率高于97%,且对已知到站时间平均填充误差不高于100 s. 展开更多
关键词 公共交通 数据填充 聚类分析 改进k*-means算法
下载PDF
HMRF半监督近似核k-means算法 被引量:1
3
作者 贾洪杰 王良君 宋和平 《计算机科学》 CSCD 北大核心 2019年第12期31-37,共7页
信息技术的发展催生了海量数据。聚类有助于发现数据的内在联系,从中挖掘有价值的信息。在对数据进行分析时,容易获得一些关于数据的背景知识,使用这些有限的先验信息指导聚类,可以显著改善聚类的结果。基于隐马尔可夫随机场(Hidden Mar... 信息技术的发展催生了海量数据。聚类有助于发现数据的内在联系,从中挖掘有价值的信息。在对数据进行分析时,容易获得一些关于数据的背景知识,使用这些有限的先验信息指导聚类,可以显著改善聚类的结果。基于隐马尔可夫随机场(Hidden Markov Random Fields,HMRF)的半监督聚类使用成对约束作为监督信息,虽然在很多应用场景中有较好的聚类效果,但是其时间和空间复杂度很高,无法满足大规模数据处理的需要。针对该问题,文中首先分析了HMRF半监督聚类与核k-means的数学联系,使用矩阵的迹将两者的目标函数统一起来;然后,为了降低HMRF半监督聚类的复杂度,提出HMRF半监督近似核k-means算法(HMRF semi-supervised Approximate Kernel K-Means,HMRF-AKKM),通过采样构造近似核矩阵,使用近似核k-means优化聚类的目标函数;最后,在基准数据集上将HMRF-AKKM算法与相关的聚类算法进行对比,分析不同算法在实验中的聚类表现。实验结果表明,在相同的聚类任务上,HMRF-AKKM算法与原始的HMRF半监督聚类具有类似的聚类质量,但是HMRF-AKKM算法的聚类时间更短,说明HMRF-AKKM算法继承了HMRF半监督聚类与近似核k-means的优点。该算法一方面可以充分利用成对约束信息改善聚类质量,另一方面通过采样和矩阵近似提高了聚类效率,而且聚类质量和聚类效率可以通过调节采样比例和成对约束数量来平衡。因此,所提出的HMRF-AKKM算法具有良好的可扩展性,适合处理大规模非线性数据的聚类问题。 展开更多
关键词 半监督聚类 HMRF模型 近似核 k -means 矩阵的迹 成对约束
下载PDF
An Innovative K-Anonymity Privacy-Preserving Algorithm to Improve Data Availability in the Context of Big Data
4
作者 Linlin Yuan Tiantian Zhang +2 位作者 Yuling Chen Yuxiang Yang Huang Li 《Computers, Materials & Continua》 SCIE EI 2024年第4期1561-1579,共19页
The development of technologies such as big data and blockchain has brought convenience to life,but at the same time,privacy and security issues are becoming more and more prominent.The K-anonymity algorithm is an eff... The development of technologies such as big data and blockchain has brought convenience to life,but at the same time,privacy and security issues are becoming more and more prominent.The K-anonymity algorithm is an effective and low computational complexity privacy-preserving algorithm that can safeguard users’privacy by anonymizing big data.However,the algorithm currently suffers from the problem of focusing only on improving user privacy while ignoring data availability.In addition,ignoring the impact of quasi-identified attributes on sensitive attributes causes the usability of the processed data on statistical analysis to be reduced.Based on this,we propose a new K-anonymity algorithm to solve the privacy security problem in the context of big data,while guaranteeing improved data usability.Specifically,we construct a new information loss function based on the information quantity theory.Considering that different quasi-identification attributes have different impacts on sensitive attributes,we set weights for each quasi-identification attribute when designing the information loss function.In addition,to reduce information loss,we improve K-anonymity in two ways.First,we make the loss of information smaller than in the original table while guaranteeing privacy based on common artificial intelligence algorithms,i.e.,greedy algorithm and 2-means clustering algorithm.In addition,we improve the 2-means clustering algorithm by designing a mean-center method to select the initial center of mass.Meanwhile,we design the K-anonymity algorithm of this scheme based on the constructed information loss function,the improved 2-means clustering algorithm,and the greedy algorithm,which reduces the information loss.Finally,we experimentally demonstrate the effectiveness of the algorithm in improving the effect of 2-means clustering and reducing information loss. 展开更多
关键词 Blockchain big data K-ANONYMITY 2-means clustering greedy algorithm mean-center method
下载PDF
一种聚类优化的传感器布置方法研究 被引量:8
5
作者 张恒 李世其 +2 位作者 刘世平 张哲 王跃 《振动与冲击》 EI CSCD 北大核心 2017年第14期61-65,共5页
复杂结构试验/理论振型的匹配是模态参数型修正过程的重要内容。以测量并获取用于模态参数识别的最佳信息为目标,实现布置在结构上有限数量的传感器能有效避免信息冗余,提出了一种聚类优化的传感器布置方法。根据结构模态中各自由度振... 复杂结构试验/理论振型的匹配是模态参数型修正过程的重要内容。以测量并获取用于模态参数识别的最佳信息为目标,实现布置在结构上有限数量的传感器能有效避免信息冗余,提出了一种聚类优化的传感器布置方法。根据结构模态中各自由度振型的动力相似性,应用k-means聚类算法对自由度进行自动集结并分类。采用有效独立法分别从各聚类自由度中搜索出模态分辨率最高的传感器位置作为实际的测量位置。最后通过一个悬臂梁、一个悬臂薄板的数值分析和一个旋转滤光轮组件的模态测试试验对该优化布置方法进行验证。分析结果表明,这种方法能有效选出独立敏感性测点,并且具有较高的搜索效率。 展开更多
关键词 传感器布置 A -means聚类 有效独立法 模态试验 模型验证
下载PDF
样本加权的多视图聚类算法 被引量:12
6
作者 洪敏 贾彩燕 +1 位作者 李亚芳 于剑 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1677-1685,共9页
大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多... 大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多视图聚类算法主要从“全局”角度关注不同视图和特征对簇结构的贡献,没有考虑不同样本间存在的“局部”信息间的差异.因此,提出一种新的多视图样本加权聚类算法(sample-weighted multi-view clustering, SWMVC),该算法对每个样本的不同视图进行加权,采用交替方向乘子法自适应学习样本权值,不仅可以学习不同样本点间不同视图权重的“局部”差异,还可以从学习到的“局部”差异反映出不同视图对簇结构贡献的“全局”差异,具有较好的灵活性.多个数据集上的实验表明:SWMVC方法在异质视图数据上具有较好的聚类效果. 展开更多
关键词 数据挖掘 多视图 聚类 K -means 样本权重
下载PDF
基于畸变校正与视觉显著特征的纺织品瑕疵检测 被引量:10
7
作者 龙涵彬 狄岚 梁久祯 《模式识别与人工智能》 EI CSCD 北大核心 2020年第12期1122-1134,共13页
针对含有复杂图案的纺织品瑕疵检测问题,提出基于畸变校正与视觉显著特征的纺织品瑕疵检测方法.首先,计算图像周期,获取最佳分块模板,根据模板对图像进行畸变校正.再对图像进行卡通纹理层分解,只保留具有图像主要特征的卡通层.然后,采... 针对含有复杂图案的纺织品瑕疵检测问题,提出基于畸变校正与视觉显著特征的纺织品瑕疵检测方法.首先,计算图像周期,获取最佳分块模板,根据模板对图像进行畸变校正.再对图像进行卡通纹理层分解,只保留具有图像主要特征的卡通层.然后,采用改进的上下文视觉显著性算法提取卡通层的显著性特征,分离具有高显著性特征的瑕疵与低显著性特征的背景.最后,采用K-means聚类算法突出显著图中的瑕疵,完成瑕疵检测.实验表明,文中方法对星型、箱型和点型图案纺织品的瑕疵检测的平均查全率较高,同时平均查全-查准效果也较优. 展开更多
关键词 畸变校正 卡通纹理层分解 视觉显著特征 K -means聚类 瑕疵检测
下载PDF
基于Hadoop的海量安全日志聚类算法研究 被引量:6
8
作者 陆勰 罗守山 张玉梅 《信息网络安全》 CSCD 北大核心 2018年第8期56-63,共8页
大数据环境下,网络安全事件层出不穷,网络安全成为各界关注的热点。安全日志记录着设备运行状态的重要信息,通过对其分析可以实时掌握网络安全态势,可作为事前防护、事后追责的安全审计手段,实现对异常事件的追责与溯源。针对日志审计... 大数据环境下,网络安全事件层出不穷,网络安全成为各界关注的热点。安全日志记录着设备运行状态的重要信息,通过对其分析可以实时掌握网络安全态势,可作为事前防护、事后追责的安全审计手段,实现对异常事件的追责与溯源。针对日志审计的重要性并结合数据挖掘在日志分析领域的重要作用,同时针对单机环境下处理海量数据效率相对滞后等问题,文章提出一种基于Hadoop的面向海量安全日志的聚类算法。首先,文章提出了基于最大最小距离(MMD)和均值思想对K-means聚类算法进行改进,克服了传统K-means聚类算法在寻找初始聚类中心随机性的缺陷;其次,为了适应海量数据的有效处理,提高聚类的效率与速度,将改进的K-means聚类算法部署在Map/Reduce上进行迭代计算。实验表明,改进的聚类算法的准确性优于其他典型算法,聚类效果稳定,在集群的性能上具有较好的运行速度和加速比。 展开更多
关键词 安全日志 聚类 -means MAP/REDUCE HADOOP
下载PDF
两种聚类模型在城市垃圾清运路径规划中的应用 被引量:2
9
作者 王龙 刘世于 胡建波 《湖北工程学院学报》 2015年第3期26-31,共6页
基于广东省深圳市南山区的实地调查,提出了一种新的城市垃圾处理设备的分布设计和清运方案。在厨余垃圾处理设备的分布设计时,建立了两种数学模型,即最短距离聚类模型和k-Means聚类模型。通过对两者的比较得出k-Means聚类模型更适合垃... 基于广东省深圳市南山区的实地调查,提出了一种新的城市垃圾处理设备的分布设计和清运方案。在厨余垃圾处理设备的分布设计时,建立了两种数学模型,即最短距离聚类模型和k-Means聚类模型。通过对两者的比较得出k-Means聚类模型更适合垃圾清运路径的规划。本文提出的方法对解决深圳市南山区垃圾处理的路径规划具有较高的准确性,可用于全国其他各大城市的垃圾处理方案设计中。 展开更多
关键词 城市垃圾处理 最短距离聚类 k -means聚类法 路径规划
下载PDF
Changes in Seasonal Patterns of Temperature and Precipitation in China During 1971-2000 被引量:2
10
作者 宋连春 A.J.CANNON P.H.WHITFIELD 《Advances in Atmospheric Sciences》 SCIE CAS CSCD 2007年第3期459-473,共15页
Many studies have shown evidence for significant changes in surface climate in different regions of the world and during different seasons over the past 100 years. Based on daily temperature and precipitation data fro... Many studies have shown evidence for significant changes in surface climate in different regions of the world and during different seasons over the past 100 years. Based on daily temperature and precipitation data from 720 climate stations in China, cluster analysis was used to identify regions in China that have experienced similar changes in the seasonal cycle of temperature and precipitation during the 1971-2000 climate normal period. Differences in 11-day averages of daily mean temperature and total precipitation between the first (1971-1985) and second (1986-2000) halves of the record were analyzed using the Mann- Whitney U test and the global κ-means clustering algorithm. Results show that most parts of China experienced significant increases in temperature between the two periods, especially in winter, although some of this warming may be attributable to the urban heat island effect in large cities. Most of western China experienced more precipitation in 1986-2000, while precipitation decreased in the Yellow River valley. Changes in the summer monsoon were also evident, with decreases in precipitation during the onset and decay phases, and increases during the wettest period. 展开更多
关键词 κ-means clustering SEASONALITY TRENDS TEMPERATURE PRECIPITATION China
下载PDF
不同聚类算法在Wi-Fi定位中的研究 被引量:2
11
作者 陈蕾 《智能计算机与应用》 2019年第2期78-81,88,共5页
本文比较分析了K-means聚类、蚁群聚类和DBSCAN聚类三种聚类算法在室内定位系统中的应用,通过比较3种算法分别与基于Wi-Fi信号接收强度的支持向量机回归算法室内定位模型相结合定位的仿真实验,发现K-means和DBSCAN聚类算法均优于蚁群聚... 本文比较分析了K-means聚类、蚁群聚类和DBSCAN聚类三种聚类算法在室内定位系统中的应用,通过比较3种算法分别与基于Wi-Fi信号接收强度的支持向量机回归算法室内定位模型相结合定位的仿真实验,发现K-means和DBSCAN聚类算法均优于蚁群聚类算法,且两者定位结果相差不大。考虑到DBSCAN聚类算法可以去除噪音点,将DBSCAN聚类与K-means聚类算法混合分析后,再与定位模型结合,获得更好的定位效果。 展开更多
关键词 K -means 聚类 DBSCAN 聚类 室内定位
下载PDF
不停工清洗过滤网方法的应用
12
作者 帖红伟 郭建波 《石油化工安全技术》 2002年第3期21-23,共3页
介绍在装置不停工状态下,进行压缩机入口过滤网的清洗工作,并从中找到使装置长周期运行的方法。
关键词 不停工清洗过滤网方法 应用 炼油 压缩机 重整装置
下载PDF
浅谈初中语文创新教育 被引量:4
13
作者 崔宝山 《科学之友》 2007年第2期133-133,135,共2页
文章指出语言教学中教师必须改进教学方法和教学手段。渗透创新教育,在语言教学中创造性地进行审美教育与德育教育。
关键词 创新教育 教学方法 教学手段
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部