期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于属性值信息熵的KNN改进算法 被引量:32
1
作者 童先群 周忠眉 《计算机工程与应用》 CSCD 北大核心 2010年第3期115-117,共3页
为了克服传统KNN算法,距离加权-KNN算法在距离定义及投票方式上的不足,提出了一种基于属性值对类别重要性的改进算法Entropy-KNN。首先定义两个样本间的距离为相同属性值的平均信息熵,此距离可通过重要属性值有效度量样本之间的相似程度... 为了克服传统KNN算法,距离加权-KNN算法在距离定义及投票方式上的不足,提出了一种基于属性值对类别重要性的改进算法Entropy-KNN。首先定义两个样本间的距离为相同属性值的平均信息熵,此距离可通过重要属性值有效度量样本之间的相似程度,其次算法Entropy-KNN根据上述定义的距离选取与待测试样本距离最小的K个近邻,最后根据各类近邻样本点的平均距离及个数判断待测试样本的类别。在蘑菇数据集上的实验表明,Entropy-KNN算法的分类准确率高于传统KNN算法和距离加权KNN算法。 展开更多
关键词 分类 KNN算法 属性值 信息熵
下载PDF
航空图像中阴影区域的检测 被引量:17
2
作者 杨益军 赵荣椿 汪文秉 《信号处理》 CSCD 2002年第3期228-232,共5页
航空图像中的阴影区域可以提供大量的关于目标形状、相对位置、表面特性、高度的相关信息,本文首先对阴影的特征进行了研究,认为阴影对图像的影响是使所投射地表的表面光照强度降低,但不改变原有地表,目标表面的光照特征,如纹理特征及... 航空图像中的阴影区域可以提供大量的关于目标形状、相对位置、表面特性、高度的相关信息,本文首先对阴影的特征进行了研究,认为阴影对图像的影响是使所投射地表的表面光照强度降低,但不改变原有地表,目标表面的光照特征,如纹理特征及光照强度方向统计特征等。阴影区域内的灰度方差一般小于其他非阴影区域,不同阴影区域之间的灰度值具有较强的一致性。然后,本文利用基于二维直方图的最大熵门限化方法求得边缘图像,并对边缘图像进行了细化和跟踪,删除那些对比很弱、或者虽然对比度较强,但是不满足光照条件的边缘,得到阴影边缘。在门限化过程中使用了邻域函数和过渡区域,既保留了弱边缘,又最大程度地抑制了噪声对边缘的干扰。根据阴影边缘构出假想的阴影区域,并统计这些区域的灰度直方图,求得阴影区域的灰度区间。根据该灰度区间可以得到阴影区域,这些区域具有对比度较高、至少有一侧比较规则、光学性质类似的特点。 展开更多
关键词 航空图像 阴影区域 检测 二维直方图 最大熵门限化 最大领域差 细化
下载PDF
基于信息熵的二次聚类推荐算法 被引量:3
3
作者 李辉 石钊 易军凯 《计算机工程》 CAS CSCD 北大核心 2016年第5期213-217,223,共6页
用户对网页文本缺少主动评价信息会影响最终推荐结果的准确程度。为此,提出一种新的二次聚类推荐算法,通过对用户所浏览过的网页文本特征词的提取及相关权重的计算,得出每一个网页的文本信息熵值与最邻近熵差。利用连续型随机变量的均... 用户对网页文本缺少主动评价信息会影响最终推荐结果的准确程度。为此,提出一种新的二次聚类推荐算法,通过对用户所浏览过的网页文本特征词的提取及相关权重的计算,得出每一个网页的文本信息熵值与最邻近熵差。利用连续型随机变量的均匀分布计算得到最邻近熵差阈值,借助平均熵值逼近确定二次聚类初始聚类簇数和簇心,结合对数函数拟合的方法计算推荐数量,通过2次文本聚类,运用欧氏距离和信息熵值确定推荐内容。实验结果表明,该推荐算法在实际系统中运行稳定,与单纯只进行2次聚类运算的推荐算法相比,推荐准确程度有所提高。 展开更多
关键词 最邻近熵差阈值 平均熵值逼近 二次聚类 对数拟合 推荐区域 推荐算法
下载PDF
基于值差度量和聚类优化的K最近邻算法在银行客户行为预测中的应用 被引量:7
4
作者 李博 张晓 +4 位作者 颜靖艺 李可威 李恒 凌玉龙 张勇 《计算机应用》 CSCD 北大核心 2019年第9期2784-2788,共5页
为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(K NN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进K NN算法。首先对收集到的数据信息进行基于VDM距离的K NN算法... 为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(K NN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进K NN算法。首先对收集到的数据信息进行基于VDM距离的K NN算法的聚类,再对聚类结果进行迭代分析,最后通过联合训练提高了预测精度。基于葡萄牙零售银行2008—2013年收集的客户数据比较可知,改进的K NN算法与传统的K NN算法、基于属性值相关距离的K NN改进(FCD-K NN)算法、高斯贝叶斯算法、Gradient Boosting等现有算法相比具有更好的性能和稳定性,在银行数据预测客户行为中具有很大的应用价值。 展开更多
关键词 K-最近邻算法 值差异度量距离 金融危机 行为预测 数据挖掘
下载PDF
基于特征熵相关度差异的KNN算法 被引量:5
5
作者 周靖 刘晋胜 《计算机工程》 CAS CSCD 北大核心 2011年第17期146-148,共3页
传统K最近邻(KNN)法在进行样本分类时容易产生无法判断或判断错误的问题。为此,将特征熵与KNN相结合,提出一种新的分类算法(FECD-KNN)。该算法采用熵作为类相关度,以其差异值计算样本距离。用熵理论规约分类相关度,并根据相关度间的差... 传统K最近邻(KNN)法在进行样本分类时容易产生无法判断或判断错误的问题。为此,将特征熵与KNN相结合,提出一种新的分类算法(FECD-KNN)。该算法采用熵作为类相关度,以其差异值计算样本距离。用熵理论规约分类相关度,并根据相关度间的差异值衡量特征对分类的影响程度,从而建立距离测度与类别间的内在联系。仿真实验结果表明,与KNN及Entropy-KNN法相比,FECD-KNN在保持效率的情况下,能够提高分类准确性。 展开更多
关键词 K最近邻算法 相关度 差异
下载PDF
基于二维直方图和最大熵门限化的直线边缘检测方法 被引量:4
6
作者 杨益军 赵荣椿 汪文秉 《计算机工程》 CAS CSCD 北大核心 2002年第8期120-122,共3页
提出了一种基于二维直方图和最大熵门限化的直线边缘检测方法。为了得到与实际边缘对应的单宽度直线,还利用了细化、连接与直线跟踪等处理方法,不但可以自动确定阈值,而且可以较好地保留弱边缘,去除噪声。最后得到单宽度的直线边缘,这... 提出了一种基于二维直方图和最大熵门限化的直线边缘检测方法。为了得到与实际边缘对应的单宽度直线,还利用了细化、连接与直线跟踪等处理方法,不但可以自动确定阈值,而且可以较好地保留弱边缘,去除噪声。最后得到单宽度的直线边缘,这对于目标识别和图像理解有着重要的意义。 展开更多
关键词 二维直方图 最大熵门限化 直线边缘检测 图像处理 图像理解
下载PDF
基于EMD和神经网络的变速箱状态识别研究 被引量:1
7
作者 王传菲 安钢 杨凡杰 《计算机测量与控制》 CSCD 北大核心 2011年第1期170-172,共3页
针对变速箱故障信号的非平稳和时变特点,提出了EMD和奇异值相结合的变速箱故障诊断方法;以变速箱箱体振动信号作为分析对象,首先对信号进行EMD分解,提取包含主要信息成分的IMF分量构成特征向量矩阵,计算其奇异值和奇异值熵,分别作为特... 针对变速箱故障信号的非平稳和时变特点,提出了EMD和奇异值相结合的变速箱故障诊断方法;以变速箱箱体振动信号作为分析对象,首先对信号进行EMD分解,提取包含主要信息成分的IMF分量构成特征向量矩阵,计算其奇异值和奇异值熵,分别作为特征向量,通过神经网络和K近邻法判别变速箱的工作状态;在某型装甲车辆的实车测试中,以奇异值作为神经网络的输入特征向量和以奇异值熵作为K近邻法的特征向量均取得了较好的识别效果。 展开更多
关键词 EMD 奇异值 奇异值熵 神经网络 K近邻法
下载PDF
基于多传感器融合的跌倒检测算法研究 被引量:1
8
作者 陈祥宝 杜玉晓 《自动化与仪表》 2018年第1期46-50,共5页
针对传统的跌倒检测算法实时性低,误报率高的问题,提出一种基于多传感器融合的跌倒检测方法。利用基于二次判定(阈值和KNN联合)进行跌倒判定,即通过对日常行为和跌倒产生的加速度峰值进行一次阈值过滤,对通过阈值的特征数据再进行二次KN... 针对传统的跌倒检测算法实时性低,误报率高的问题,提出一种基于多传感器融合的跌倒检测方法。利用基于二次判定(阈值和KNN联合)进行跌倒判定,即通过对日常行为和跌倒产生的加速度峰值进行一次阈值过滤,对通过阈值的特征数据再进行二次KNN算法判定。仿真结果表明,该方法可以降低算法判定时间,而且拥有较高的准确率,克服了传统跌倒算法判定误报率高的不足,对保护老年人生活起居提供有价值的保障。 展开更多
关键词 跌倒检测算法 阈值定位 KNN 特征提取 六轴传感器 人口老龄化
下载PDF
罚处共享最近邻密度峰聚类算法 被引量:1
9
作者 高润峰 苏一丹 覃华 《计算机工程与设计》 北大核心 2021年第12期3407-3414,共8页
为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现... 为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现簇中心点的自动选择。在人工数据集、UCI真实数据集以及图像数据集上进行仿真实验,其结果表明,该算法能找到数据集的簇中心和簇数目,聚类精度优于相比较的其它算法,该算法是可行的、有效的。 展开更多
关键词 密度峰聚类算法 共享最近邻局部密度 簇中心点 罚处系数 迭代阈值法
下载PDF
Adapt Bagging to Nearest Neighbor Classifiers 被引量:7
10
作者 Zhi-HuaZhou YangYu 《Journal of Computer Science & Technology》 SCIE EI CSCD 2005年第1期48-54,共7页
It is well-known that in order to build a strong ensemble, the component learners should be with high diversity as well as high accuracy. If perturbing the training set can cause significant changes in the component l... It is well-known that in order to build a strong ensemble, the component learners should be with high diversity as well as high accuracy. If perturbing the training set can cause significant changes in the component learners constructed, then Bagging can effectively improve accuracy. However, for stable learners such as nearest neighbor classifiers, perturbing the training set can hardly produce diverse component learners, therefore Bagging does not work well. This paper adapts Bagging to nearest neighbor classifiers through injecting randomness to distance metrics. In constructing the component learners, both the training set and the distance metric employed for identifying the neighbors are perturbed. A large scale empirical study reported in this paper shows that the proposed BagInRand algorithm can effectively improve the accuracy of nearest neighbor classifiers. 展开更多
关键词 BAGGING data mining ensemble learning machine learning Minkowsky distance nearest neighbor value difference metric
原文传递
一种基于信息熵的自适应k值KNN二分类方法 被引量:16
11
作者 谢妙 林泳昌 朱晓姝 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第11期1483-1486,1505,共5页
针对传统k最近邻(k-nearest neighbor,KNN)算法中需要设定k值的问题,文章提出一种基于信息熵的自适应k值KNN二分类算法(adaptive k-value KNN bisecting classification algorithm based on information entropy,EAKNN)。该算法通过引... 针对传统k最近邻(k-nearest neighbor,KNN)算法中需要设定k值的问题,文章提出一种基于信息熵的自适应k值KNN二分类算法(adaptive k-value KNN bisecting classification algorithm based on information entropy,EAKNN)。该算法通过引入样本比例定义信息熵,加强小样本的重要性;通过计算小于预设熵阈值的最小信息熵,得到对应的k值和模型分数;在此基础上,结合提出的精度提升模型计算得到模型精度,不断迭代模型精度,直到模型精度最大化。实验结果表明,该算法提升模型精度明显,分类准确率高。 展开更多
关键词 信息熵 样本 分类 K最近邻 自适应k值
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部