期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于改进自适应DBSCAN的混合式MOOC视频观看模式挖掘
1
作者 王若宾 耿芳东 +3 位作者 张永梅 宋威 王伟锋 徐琳 《计算机工程与科学》 CSCD 北大核心 2023年第9期1670-1678,共9页
基于密度聚类的DBSCAN算法能够依据数据特征自动执行分类任务,多应用于含噪声的复杂数据集的聚类分析,但也存在难以确定参数以及人工参与度高的缺陷,限制了自动高准确率挖掘的应用。基于此,提出了一种基于k-dist图斜率的自适应DBSCAN算... 基于密度聚类的DBSCAN算法能够依据数据特征自动执行分类任务,多应用于含噪声的复杂数据集的聚类分析,但也存在难以确定参数以及人工参与度高的缺陷,限制了自动高准确率挖掘的应用。基于此,提出了一种基于k-dist图斜率的自适应DBSCAN算法KSSA-DBSCAN,可以依据k-dist图斜率自动选择合适的k-dist图拐点作为最佳邻域,并在聚类迭代过程中依据聚类数目的变化自动确定最佳密度阈值,克服了难以确定参数和人工参与度过高的缺陷。基于6个数据集将KSSA-DBSCAN和DBSCAN、KANN-DBSCAN进行了对比,实验结果显示,该算法的准确率在4个数据集上均优于其它算法,并且与DBSCAN相比准确率最大提高了25%。将其应用于某混合式MOOC视频观看行为数据的模式挖掘,结果显示该算法能够对视频观看模式进行有效的自动挖掘,进一步验证了该算法的有效性。 展开更多
关键词 密度聚类 自适应 k-dist 混合式MOOC 视频观看模式
下载PDF
K-means初始聚类中心的选择算法 被引量:35
2
作者 郑丹 王潜平 《计算机应用》 CSCD 北大核心 2012年第8期2186-2188,2192,共4页
K-means算法随机选取初始聚类中心,容易造成聚类准确率低且聚类结果不稳定。针对这一问题,提出一种初始聚类中心的选择算法。通过k-dist的差值(DK)图分析,确定数据点在k-dist图上的位置,选择主要密度水平曲线上k-dist值最小的点作为初... K-means算法随机选取初始聚类中心,容易造成聚类准确率低且聚类结果不稳定。针对这一问题,提出一种初始聚类中心的选择算法。通过k-dist的差值(DK)图分析,确定数据点在k-dist图上的位置,选择主要密度水平曲线上k-dist值最小的点作为初始聚类中心。实验证明,改进算法选择的初始聚类中心唯一,聚类结果稳定,聚类准确率高,迭代次数少。 展开更多
关键词 聚类 K-MEANS算法 k-dist k-dist的差值图 密度
下载PDF
一种改进的DBSCAN密度算法 被引量:35
3
作者 于亚飞 周爱武 《计算机技术与发展》 2011年第2期30-33,38,共5页
DBSCAN算法是一种基于密度的聚类算法,算法存在许多优点,也存在一些不足。比如对输入参数Eps敏感,DB-SCAN由于采用全局Eps值,所以在数据密度不均匀和类间距离相差比较大的情况下,聚类质量会受到很大影响。文中主要针对算法输入参数Eps... DBSCAN算法是一种基于密度的聚类算法,算法存在许多优点,也存在一些不足。比如对输入参数Eps敏感,DB-SCAN由于采用全局Eps值,所以在数据密度不均匀和类间距离相差比较大的情况下,聚类质量会受到很大影响。文中主要针对算法输入参数Eps以及数据密度不均匀问题加以改进,提出了一种新的数据分区方法,通过对k-dist图纵坐标距离值单维度聚类,然后对比横坐标实现分区,使每个分区的数据尽可能均匀。实验证明,改进算法明显缓解了全局Eps导致的聚类质量恶化问题,聚类结果更加准确。 展开更多
关键词 DBSCAN算法 EPS 数据分区 k-dist
下载PDF
基于MapReduce的改进DBSCAN算法 被引量:5
4
作者 赖丽萍 聂瑞华 +1 位作者 汪疆平 黄家鸿 《计算机科学》 CSCD 北大核心 2015年第B11期396-399,共4页
针对聚类算法DBSCAN中存在的Eps参数问题和处理海量数据集时的效率问题,提出OPDBSCAN算法。OPDBSCAN算法通过交叠分区获取局部Eps以降低全局Eps参数对聚类质量的影响,并结合MapReduce并行框架提高算法效率。实验结果表明,OPDBSCAN算法... 针对聚类算法DBSCAN中存在的Eps参数问题和处理海量数据集时的效率问题,提出OPDBSCAN算法。OPDBSCAN算法通过交叠分区获取局部Eps以降低全局Eps参数对聚类质量的影响,并结合MapReduce并行框架提高算法效率。实验结果表明,OPDBSCAN算法的效率和聚类质量都高于原DBSCAN算法。 展开更多
关键词 OPDBSCAN MAPREDUCE EPS k-dist 交叠分区
下载PDF
基于数据分区的OPTICS聚类算法 被引量:5
5
作者 周传华 鲁勇 于猜 《传感器与微系统》 CSCD 北大核心 2022年第10期103-107,共5页
针对OPTICS算法存在着对于密度不均匀以及高维数据聚类效果差的问题,提出了基于数据分区的OPTICS聚类算法(DP-OPTICS)。该方法计算所有样本点的K距离(K-dist)值,用改进的K均值算法对K-dist值进行单维度聚类,并依据肘图拐点的位置调整K... 针对OPTICS算法存在着对于密度不均匀以及高维数据聚类效果差的问题,提出了基于数据分区的OPTICS聚类算法(DP-OPTICS)。该方法计算所有样本点的K距离(K-dist)值,用改进的K均值算法对K-dist值进行单维度聚类,并依据肘图拐点的位置调整K值大小,以此实现数据分区;在分区内用OPTICS算法进行局部聚类,最后按一定规则将数据分区合并。选取多个不平衡人工数据集和UCI数据集进行对比实验,实验结果表明:改进的算法是切实可行的,明显提升了OPTICS算法对于数据密度不均匀问题的聚类质量,并且对高维数据也有着较好的处理能力,具有很强的鲁棒性。 展开更多
关键词 聚类 数据分区 OPTICS算法 K距离
下载PDF
BUCHI K-370自动定氮仪蒸馏程序相关参数的试验研究
6
作者 方舸 吴凡 连亚光 《微生物学免疫学进展》 2009年第2期22-25,共4页
为了分析BUCHI K-370全自动定氮仪相关参数即蒸汽力度,蒸馏时间的设置使之最适合生物制品中蛋白质含量的测定。分别选用蒸汽力度90%、80%,蒸馏时间190s、170s配对进行硫酸铵回收试验同时对每次回收试验后氨的残留量进行分析比较。再将... 为了分析BUCHI K-370全自动定氮仪相关参数即蒸汽力度,蒸馏时间的设置使之最适合生物制品中蛋白质含量的测定。分别选用蒸汽力度90%、80%,蒸馏时间190s、170s配对进行硫酸铵回收试验同时对每次回收试验后氨的残留量进行分析比较。再将选出的测定参数对人血白蛋白国家标准品中的蛋白质进行测定。采用蒸汽力度90%,蒸馏时间190s时硫酸铵回收率为100.08%,RSD最小,为0.28%,回收试验后氨残留量最小;且测得标准品的蛋白质含量与真实值对比无显著差异。结果表明采用蒸汽力度90%,蒸馏时间190s最适合生物制品中蛋白含量的测定。 展开更多
关键词 蒸汽力度 蒸馏时间 硫酸铵回收率 BUCHI K-370全自动定氮仪
下载PDF
一种K-均值聚类的改进算法及其应用 被引量:3
7
作者 江京亚 郭庆胜 +2 位作者 陈旺 周贺杰 陈勇 《测绘工程》 CSCD 2015年第5期42-46,共5页
由于传统的K-均值聚类算法固有的特性,如对初始聚类中心的依赖性和对噪声点的敏感性,导致了其聚类结果的不稳定。文中基于k-dist图提出一种改进算法,算法首先去除数据集中的噪声点,然后从数据集中选取靠近点聚集区域、相距最远的k′个... 由于传统的K-均值聚类算法固有的特性,如对初始聚类中心的依赖性和对噪声点的敏感性,导致了其聚类结果的不稳定。文中基于k-dist图提出一种改进算法,算法首先去除数据集中的噪声点,然后从数据集中选取靠近点聚集区域、相距最远的k′个数据点作为初始簇中心。实验结果证明,文中算法能够很好地消除K-均值聚类算法对初始簇中心的依赖性,并能有效去除噪声点。 展开更多
关键词 数据挖掘 K-均值聚类 第4邻近距离图 初始簇中心 噪声点
下载PDF
PCA-KDKM算法及其在微博舆情中的应用 被引量:5
8
作者 刘荣凯 孙忠林 《山东科技大学学报(自然科学版)》 CAS 北大核心 2018年第6期84-92,共9页
针对K-means算法因随机选取聚类中心而易造成聚类结果不稳定的问题,提出PCA-KDKM算法。该算法使用主成分分析法对数据集的属性降维,提取主属性;利用k′dist曲线自动获取k值;计算平缓曲线上所含数据对象的均值并选取其中一值,作为首个初... 针对K-means算法因随机选取聚类中心而易造成聚类结果不稳定的问题,提出PCA-KDKM算法。该算法使用主成分分析法对数据集的属性降维,提取主属性;利用k′dist曲线自动获取k值;计算平缓曲线上所含数据对象的均值并选取其中一值,作为首个初始聚类中心;利用基于密度和最大最小距离的算法思想进行聚类;结合类间距离和类内聚类提出聚类质量评价函数。将该算法与K-means、KNE-KM、QMC-KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定,聚类准确率高。将PCA-KDKM算法应用在微博舆情分析中,抓取不同类别的数万条数据进行聚类分析。实验结果表明,PCA-KDKM算法在微博舆情分析中有更高的准确性和稳定性,有利于及时发现热点舆情。 展开更多
关键词 K-MEANS算法 k′dist曲线图 聚类 质量评价函数 准确率 PCA-KDKM算法 微博舆情
下载PDF
高速公路桥梁车辆荷载的三峰分布概率模型 被引量:4
9
作者 杨小森 王斐 +1 位作者 李彦伟 刘宏 《兰州交通大学学报》 CAS 2017年第3期31-35,共5页
为研究高速公路桥梁车辆荷载分布模型,选择G6京藏高速公路,通过统计分析甘肃省内的车辆荷载,得到每日的车辆荷载分布主要由小型车辆、中型车辆和大型车辆组成,呈现出三峰分布的状态,并采用一个极值I型与两个正态分布的加权和拟合得到了... 为研究高速公路桥梁车辆荷载分布模型,选择G6京藏高速公路,通过统计分析甘肃省内的车辆荷载,得到每日的车辆荷载分布主要由小型车辆、中型车辆和大型车辆组成,呈现出三峰分布的状态,并采用一个极值I型与两个正态分布的加权和拟合得到了三峰分布的概率模型.然后将拟合结果与实际结果、拟合结果之间进行K-S检验,检验结果显示拟合结果可以表明实际的三峰分布,同时每一天的车辆荷载是属于同一分布.这就消除了因为工作日、双休日还有国家法定节假日而导致的车辆荷载分布不同的影响. 展开更多
关键词 车辆荷载 三峰分布 分布拟合 K-S检验
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部