期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于信息熵和Canopy-K-Means算法的货车驾驶风格识别
1
作者 李浩 王肇飞 李微 《交通工程》 2024年第7期123-128,共6页
为识别货车的激进驾驶行为,保障货车行车安全,提出1种基于信息熵和Canopy-K-Means算法的货车驾驶风格识别方法。首先,从货车自然驾驶数据中提取出604个驾驶片段,根据信息熵理论计算各个驾驶片段的速度熵值、横向加速度熵值和纵向加速度... 为识别货车的激进驾驶行为,保障货车行车安全,提出1种基于信息熵和Canopy-K-Means算法的货车驾驶风格识别方法。首先,从货车自然驾驶数据中提取出604个驾驶片段,根据信息熵理论计算各个驾驶片段的速度熵值、横向加速度熵值和纵向加速度熵值,构成货车驾驶风格表征指标集;其次,针对K-Means算法的聚类数量主观选取、初始聚类中心随机选取的问题,使用Canopy算法改进K-Means算法(Canopy-K-Means算法);最后,分别使用K-Means算法和Canopy-K-Means算法对货车驾驶风格进行识别。研究结果显示,Canopy-K-Means算法的轮廓系数和Calinski-Harabasz指数均大于K-Means算法,表现出更优的聚类性能。根据Canopy-K-Means算法,可将货车驾驶风格分为沉稳型、常规型和激进型3类,其中激进型货车驾驶风格的指标熵值和极差均较大,存在较高的安全隐患,需要引起相关部门的高度重视。 展开更多
关键词 交通工程 驾驶风格 canopy-k-means算法 信息熵 货车
下载PDF
基于改进Canopy-K-means算法的并行化研究 被引量:11
2
作者 王林 贾钧琛 《计算机测量与控制》 2021年第2期176-179,186,共5页
随着互联网数据的快速增长,原始的K-means算法已经不足以应对大规模数据的聚类需求;为此,提出一种改进的Canopy-K-means聚类算法;首先面对Canopy算法中心点随机选取的不足,引入“最大最小原则”优化Canopy中心点的选取;接着借助三角不... 随着互联网数据的快速增长,原始的K-means算法已经不足以应对大规模数据的聚类需求;为此,提出一种改进的Canopy-K-means聚类算法;首先面对Canopy算法中心点随机选取的不足,引入“最大最小原则”优化Canopy中心点的选取;接着借助三角不等式定理对K-means算法进行优化,减少冗余的距离计算,加快算法的收敛速度;最后结合MapReduce框架并行化实现改进的Canopy-K-means算法;基于构建的微博数据集,对优化后的Canopy-K-means算法进行测试;试验结果表明:对不同数据规模的微博数据集,优化后算法的准确率较K-means算法提高了约15%,较原始的Canopy-K-means算法提高了约7%,算法的执行效率和扩展性也有较大提升。 展开更多
关键词 canopy-k-means算法 文本聚类 最大最小原则 三角不等式 MAPREDUCE
下载PDF
基于Canopy-K-means算法的高校贫困生预测的研究 被引量:3
3
作者 王全民 张书军 《计算机与数字工程》 2020年第12期3012-3016,3041,共6页
高校贫困生的认定和和资助工作对于高等人才的培养、减轻贫困生家庭经济负担是非常重要的;如何做到精准扶贫一直是高校贫苦生认定和资助工作的重点和难点。基于校园一卡通学生消费数据、上网日志等多模态数据,提出了一种基于Canopy-K-me... 高校贫困生的认定和和资助工作对于高等人才的培养、减轻贫困生家庭经济负担是非常重要的;如何做到精准扶贫一直是高校贫苦生认定和资助工作的重点和难点。基于校园一卡通学生消费数据、上网日志等多模态数据,提出了一种基于Canopy-K-means算法的高校贫困生预测的方法。该方法通过引入Canopy改进的聚类算法,得到贫困生所属类别,并将该类学生与实际的贫困生作对比,分析贫困生在校消费习惯和上网行为。该实验能有效地对贫困生进行分类,为学校贫困生认定提供辅助决策作用。 展开更多
关键词 贫困生认定 多模态数据 数据挖掘 canopy-k-means算法
下载PDF
结合Canopy-K-means算法和出租车轨迹数据的公交车站预测方法 被引量:6
4
作者 刘旭 陈云波 +1 位作者 施昆 黄强 《测绘通报》 CSCD 北大核心 2018年第11期63-68,共6页
公共交通轨迹的规划和站点确定是很困难的,而出租车的GPS数据用处很大,能够挖掘出人们活动的热点,因此利用出租车的GPS数据有助于规划公交站点。本文基于武汉市出租车轨迹数据,提出了一种基于Canopy-K-means算法的公共交通站点的预测方... 公共交通轨迹的规划和站点确定是很困难的,而出租车的GPS数据用处很大,能够挖掘出人们活动的热点,因此利用出租车的GPS数据有助于规划公交站点。本文基于武汉市出租车轨迹数据,提出了一种基于Canopy-K-means算法的公共交通站点的预测方法。该方法通过引入Canopy-K-means改进聚类算法,得到客源地的出行热点区域,并将该区域和已有公交站点对比,分析公交站点存在的合理性;然后采用数理统计的方法,对客流量的时空分布特征进行研究。采用武汉市2014年7月31日—2014年8月12日2064台出租车的GPS坐标数据进行研究,试验结果表明:该方法能有效判断公交站点位置的合理性,为公交车发车频率提供辅助决策支持。 展开更多
关键词 出租车轨迹数据 canopy-k-means算法 公交车站 公交车的发车频率
下载PDF
基于Hadoop的Canopy-K-means并行算法的学生成绩与毕业流向关系分析 被引量:11
5
作者 郭卫霞 薛涛 李婷 《西安工程大学学报》 CAS 2018年第6期705-712,共8页
为了探究学生成绩与其毕业去向之间存在的内在关系,提出基于Hadoop的Canopy-Kmeans并行算法并进行分析.首先基于"最小最大原则"确定Canopy的初始中心点并快速粗糙聚类,将其作为K-means算法的初始聚类中心,并基于MapReduce计... 为了探究学生成绩与其毕业去向之间存在的内在关系,提出基于Hadoop的Canopy-Kmeans并行算法并进行分析.首先基于"最小最大原则"确定Canopy的初始中心点并快速粗糙聚类,将其作为K-means算法的初始聚类中心,并基于MapReduce计算框架实现其并行化.然后以西安工程大学2017届毕业生的教务数据为基础,进行海量教务数据的挖掘分析实验,完成相同毕业流向类型学生的聚类,同时分析各毕业流向与课程之间的内在联系.实验结果证明,改进后的Canopy-K-means算法在处理海量数据时,相比传统K-means算法,聚类收敛速度提高约2.1倍,准确率提高约15%,具有良好的聚类效果. 展开更多
关键词 HADOOP canopy-k-means 最小最大原则 MAPREDUCE 教务 毕业流向
下载PDF
基于Canopy-K-means算法的半挂汽车列车行驶数据分析
6
作者 李兵 屈亚洲 +2 位作者 熊乐 王晓亮 赵晨光 《科技和产业》 2021年第8期288-294,共7页
为实时监测车辆行驶状态,建立了基于Canopy-K-means算法的车辆行驶安全特征分类模型。采用Canopy-K-means聚类算法对车辆行驶数据进行挖掘分析,以欧氏距离大小作为数据集属性间的相似性分类指标,得到表征不同行驶安全特征的离线聚类质心... 为实时监测车辆行驶状态,建立了基于Canopy-K-means算法的车辆行驶安全特征分类模型。采用Canopy-K-means聚类算法对车辆行驶数据进行挖掘分析,以欧氏距离大小作为数据集属性间的相似性分类指标,得到表征不同行驶安全特征的离线聚类质心;搭建TruckSim与Simulink联合仿真平台,设置定半径变车速和方向盘斜阶跃输入仿真工况对车辆行驶状态进行在线识别;同时为验证该方法在实车上的应用效果,设置相同工况对离线聚类质心进行验证分析。仿真和实车结果表明:基于Canopy-K-means算法的数据挖掘方法可以对不同行驶状态数据进行分类,得到的表征不同行驶安全特征的聚类质心能在一定程度上对车辆行驶稳定性进行评价,可以作为车辆控制和预警的判定依据。 展开更多
关键词 行驶稳定性 canopy-k-means算法 分类模型 半挂汽车列车 欧氏距离
下载PDF
基于改进RBFNN的1000 kV特高压线损预测 被引量:10
7
作者 杨建华 肖达强 +2 位作者 张伟 余明琼 易本顺 《中国电力》 CSCD 北大核心 2022年第5期122-127,142,共7页
针对特高压输电线线损与特征参数间关系复杂的特点,提出一种联合聚类优化算法(Canopy-Kmeans)和自适应二次变异差分进化(adaptive second mutation differential evolution,ASMDE)算法改进的径向基神经网络(radial basis function neura... 针对特高压输电线线损与特征参数间关系复杂的特点,提出一种联合聚类优化算法(Canopy-Kmeans)和自适应二次变异差分进化(adaptive second mutation differential evolution,ASMDE)算法改进的径向基神经网络(radial basis function neural network,RBFNN)模型,用于特高压输电线线损的预测。通过理论分析确定特高压输电线线损的特征参数,采用Canopy-K-means聚类算法进行聚类,以此确定径向基(radial basis function,RBF)神经网络的隐藏层节点,从而确保RBF神经网络具有较优的隐藏层中心。用特征参数和线损的样本数据训练ASMDE算法优化的RBF神经网络,拟合出线损与特征参数之间复杂的非线性关系。以华中地区某特高压输电线路的历史数据为例,仿真验证了所提方法的实用性和有效性。 展开更多
关键词 特高压 线损 径向基神经网络 canopy-k-means算法
下载PDF
一种改进的K-means入侵检测算法 被引量:2
8
作者 张珂嘉 黄树成 《计算机与数字工程》 2021年第10期1963-1966,2047,共5页
传统的K-means算法存在初始质心敏感、需要人为指定K个数等问题,可以通过融合Canopy算法在一定程度上缓解,但是仍然存在抗噪能力弱、质心选择盲目、运算时间长等问题。论文提出了一种改进算法,在抗噪性、初始质心选择、运算过程三方面,... 传统的K-means算法存在初始质心敏感、需要人为指定K个数等问题,可以通过融合Canopy算法在一定程度上缓解,但是仍然存在抗噪能力弱、质心选择盲目、运算时间长等问题。论文提出了一种改进算法,在抗噪性、初始质心选择、运算过程三方面,对Canopy-K-means算法进行优化。该算法采用了剪枝、“最大最小规则”、相似度计算等策略来实现算法目标。实验数据表明,改进后的Canopy-K-means算法对比传统的Canopy-K-means算法、K-means算法均具有更高的检测率、更低的误报率。 展开更多
关键词 入侵检测 K-MEANS算法 canopy-k-means算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部