期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于S_Dbw的可变特征算子的改进随机森林算法 被引量:5
1
作者 简琤峰 陈嘉诚 张美玉 《小型微型计算机系统》 CSCD 北大核心 2018年第2期393-395,共3页
针对传统随机森林算法中,由于数据集内部差异程度随着节点分裂迅速降低,导致模型过早收敛的问题,提出允许上下特征不一致的改进随机森林算法.该算法根据聚类评估指标S_Dbw对每次二分k-means的结果进行评估,在节点分裂的过程中选择最合... 针对传统随机森林算法中,由于数据集内部差异程度随着节点分裂迅速降低,导致模型过早收敛的问题,提出允许上下特征不一致的改进随机森林算法.该算法根据聚类评估指标S_Dbw对每次二分k-means的结果进行评估,在节点分裂的过程中选择最合适的特征算子计算数据特征以维持节点数据分裂的可靠性和判别性,提高随机森林的判别能力.在此基础上将该算法的输出形式进行结构化,实现从二维向量调整为一个二维概率分布,构造成一个结构化随机森林.实验证明,针对背景中存在类肤色干扰和光照变化的手部检测,该算法可以有效地提高模型的判别能力. 展开更多
关键词 s_dbw 特征算子不一致 改进随机森林 结构化
下载PDF
新闻类短文本聚类新方法的研究 被引量:3
2
作者 傅承涛 谢佳璇 牛永洁 《延安大学学报(自然科学版)》 2020年第4期67-71,76,共6页
针对短文本矢量化数据稀疏和维度高,基于词频统计语义缺失,传统聚类方法对非球面类别检测困难以及计算量大等问题,提出一种聚类新方法。该方法主要包含三个步骤:一对文本使用Doc2vec方法进行矢量化;二使用基于密度的聚类算法CFDP对矢量... 针对短文本矢量化数据稀疏和维度高,基于词频统计语义缺失,传统聚类方法对非球面类别检测困难以及计算量大等问题,提出一种聚类新方法。该方法主要包含三个步骤:一对文本使用Doc2vec方法进行矢量化;二使用基于密度的聚类算法CFDP对矢量化后的文本数据进行聚类;三采用t-分布领域嵌入算法(t-SNE)将数据压缩到二维空间并进行可视化。并对聚类算法中关键参数进行了交叉测试,采用S_Dbw评价聚类的效果,得到CFDP算法最优的参数组合,最后对聚类效果进行了可视化,聚类结果与文本原始类别进行比较,F值达到89.24,聚类效果良好。 展开更多
关键词 Doc2vec 数据压缩 密度 s_dbw 聚类
下载PDF
基于K-means++的无线传感网能量高效分簇协议 被引量:4
3
作者 余扬 李艳彩 陈君华 《云南民族大学学报(自然科学版)》 CAS 2019年第2期165-171,共7页
针对传统无线传感网的分层路由算法中存在着分簇不均匀、簇首数量不固定、簇首位置不合理、节点的可扩展性不足以及数据传输方式比较单一的问题,提出一种无线传感网能量高效分簇协议.该协议在簇的建立阶段基于K-means++聚类算法进行分... 针对传统无线传感网的分层路由算法中存在着分簇不均匀、簇首数量不固定、簇首位置不合理、节点的可扩展性不足以及数据传输方式比较单一的问题,提出一种无线传感网能量高效分簇协议.该协议在簇的建立阶段基于K-means++聚类算法进行分簇并采用S_Dbw聚类评价指标挑选其最优分簇,在簇的建立阶段,从每个簇中选取簇内剩余能量最高的节点作为簇首;在数据传输阶段,基于节点间的通信代价使用Dijkstra算法来寻找每个簇首到汇聚节点的最优路径.仿真结果表明:该协议可降低节点与汇聚节点之间数据传输的能耗,延长传感网的生命周期,并且在整个网络能量处于较低水平时也可以较好的覆盖整个监测区域. 展开更多
关键词 K-means++算法 s_dbw 自适应分簇 可扩展性 DIJKSTRA算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部