期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
1
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k nn)查询算法 不规则区域划分方法 MAP REDUCE 大数据
下载PDF
基于改进K-NN和SVM的多学科协作诊疗决策支持系统 被引量:1
2
作者 李晓峰 王妍玮 李东 《计算机系统应用》 2020年第6期80-88,共9页
由于当前的诊疗决策支持系统采用单一学科的决策方法,导致诊疗精度不高,获取的数据分类结果准确率较低,提出并设计一种基于改进K-NN(K-Nearest Neighbour)分类算法和SVM(Support Vector Mechine)的多学科协作诊疗决策支持系统.在构建系... 由于当前的诊疗决策支持系统采用单一学科的决策方法,导致诊疗精度不高,获取的数据分类结果准确率较低,提出并设计一种基于改进K-NN(K-Nearest Neighbour)分类算法和SVM(Support Vector Mechine)的多学科协作诊疗决策支持系统.在构建系统总体框架的基础上,对数据库系统模块、人机交互模块和诊疗推理模块进行设计,其中诊疗推理模块是系统的软件核心,通过改进K-NN分类算法和SVM建立推理引擎,在计算机的辅助下,搜索与患者病症信息相似的医疗案例,并进行相似度匹配,根据匹配结果与患者症状集构建一个新的临床案例,引入CDA(Clinical Document Architecture)概念,实现改进K-NN分类算法和SVM算法的有效融合,完成多学科协作诊疗决策.实验结果表明,与传统系统相比,该系统的诊疗决策精度高,评价指标测试平均值达到95.98%,分类结果准确率较高,在该系统辅助下能提高医生诊断正确性,降低误诊率,且运算复杂度较低. 展开更多
关键词 改进k-nn分类算法 SVM 多学科协作 诊疗决策支持系统
下载PDF
多颜色模型分割自学习k-NN设备状态识别方法 被引量:2
3
作者 郭雪梅 刘桂雄 《中国测试》 CAS 北大核心 2016年第4期107-110,共4页
在浪涌测试中,由于每次识别对象不同,直接采用特征匹配每次测试前需要根据受试设备重新训练样本。先根据图像中高亮度点、白光所占比例,决策用于图像分割的颜色模型(L*a*b*、HSL、HSV),实现自适应分割;其次,提出自学习k-NN算法,以像素数... 在浪涌测试中,由于每次识别对象不同,直接采用特征匹配每次测试前需要根据受试设备重新训练样本。先根据图像中高亮度点、白光所占比例,决策用于图像分割的颜色模型(L*a*b*、HSL、HSV),实现自适应分割;其次,提出自学习k-NN算法,以像素数n、偏心率e、密实度比r、欧拉数E为样本S特征向量X,构建数据集T0,以欧氏距离D实现样本分类;若样本置信度为k,加入预备数据集Tz′中,当Tz′满足条件,则扩充数据集Tz形成数据集Tz+1。结果证明:算法在9组各类样本(共21 600帧图像)识别中,准确度可达98.65%;并自学习扩充5组样本,距离矩阵变化较小,可见算法学习效率、学习准确度较高。 展开更多
关键词 多颜色模型 k近邻算法 自学习 浪涌测试
下载PDF
基于双层结构的加速K-NN分类方法 被引量:3
4
作者 王晓 赵丽 《计算机工程与设计》 北大核心 2018年第4期1071-1077,共7页
在传统K-NN分类中,对于每个待测样本均需计算并寻找k个决策近邻,分类效率较低。针对该问题,提出一种双层结构的加速K-NN分类(K-NN classification based on double-layer structure,KNN_DL)方法。将正类和负类样本分别划分为多个不同子... 在传统K-NN分类中,对于每个待测样本均需计算并寻找k个决策近邻,分类效率较低。针对该问题,提出一种双层结构的加速K-NN分类(K-NN classification based on double-layer structure,KNN_DL)方法。将正类和负类样本分别划分为多个不同子集,计算每个子集的中心和半径。当新样本进入时,选择k个决策近邻子集,若其具有相同的类别标签,将该样本标记为相应类别;反之,选择决策近邻子集中最近的k个决策近邻。这种双层结构的加速方式,压缩待测样本的决策近邻规模,提高效率。实验结果表明,KNN_DL方法能够获得较高的样本预测速度和较好的预测准确率。 展开更多
关键词 k-nn分类 决策近邻子集 决策近邻样本 中心 半径 knn_DL方法
下载PDF
基于值差度量和聚类优化的K最近邻算法在银行客户行为预测中的应用 被引量:7
5
作者 李博 张晓 +4 位作者 颜靖艺 李可威 李恒 凌玉龙 张勇 《计算机应用》 CSCD 北大核心 2019年第9期2784-2788,共5页
为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(K NN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进K NN算法。首先对收集到的数据信息进行基于VDM距离的K NN算法... 为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(K NN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进K NN算法。首先对收集到的数据信息进行基于VDM距离的K NN算法的聚类,再对聚类结果进行迭代分析,最后通过联合训练提高了预测精度。基于葡萄牙零售银行2008—2013年收集的客户数据比较可知,改进的K NN算法与传统的K NN算法、基于属性值相关距离的K NN改进(FCD-K NN)算法、高斯贝叶斯算法、Gradient Boosting等现有算法相比具有更好的性能和稳定性,在银行数据预测客户行为中具有很大的应用价值。 展开更多
关键词 k-最近邻算法 值差异度量距离 金融危机 行为预测 数据挖掘
下载PDF
结合局部敏感哈希的k近邻数据填补算法 被引量:4
6
作者 郑奇斌 刁兴春 +2 位作者 曹建军 周星 许永平 《计算机应用》 CSCD 北大核心 2016年第2期397-401,共5页
k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之... k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的k条记录,并按照k NN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的k NN填补算法LSH-k NN相对经典的k NN算法能够显著提高填补效率,并且保持准确性基本不变。 展开更多
关键词 数据质量 数据完整性 数据填补 k近邻算法 局部敏感哈希
下载PDF
面向K最近邻分类的遗传实例选择算法 被引量:7
7
作者 黄宇扬 董明刚 敬超 《计算机应用》 CSCD 北大核心 2018年第11期3112-3118,共7页
针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围... 针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围;再使用遗传算法在该范围内精确删除噪声样本,可有效地降低误删率并提高效率,采用基于最近邻规则的验证集选择策略,进一步提高了遗传算法实例选择的准确度;最后引进基于均方误差(MSE)的分类精度惩罚函数来计算遗传算法中个体的适应度,提高有效性和稳定性。在20个数据集上,该方法相较于基于预分类的KNN(PRKNN)、基于协同进化的实例特征选择算法(IFS-CoCo)、K最近邻(KNN),在分类精度上的提升分别为0.07~26.9个百分点、0.03~11.8个百分点、0.2~12.64个百分点,在AUC和Kappa的上的提升分别为0.25~18.32个百分点、1.27~23.29个百分点、0.04~12.82个百分点。实验结果表明,该方法相较于当前实例选择算法在分类精度和分类效率上均具有优势。 展开更多
关键词 k最近邻 遗传算法 决策树 实例选择 噪声样本 机器学习
下载PDF
多分类器联合虚警可控的海上小目标检测方法 被引量:4
8
作者 薛安克 毛克成 张乐 《电子与信息学报》 EI CSCD 北大核心 2023年第7期2528-2536,共9页
模式识别技术已经广泛应用于海上目标检测,其中二分类的模式识别算法在处理该问题时会面临类别非均衡的困境。传统方法一般通过添加人工仿真目标回波扩充目标数据集,检测结果容易受到仿真精度的影响,且增加算法的复杂度。该文提出一种... 模式识别技术已经广泛应用于海上目标检测,其中二分类的模式识别算法在处理该问题时会面临类别非均衡的困境。传统方法一般通过添加人工仿真目标回波扩充目标数据集,检测结果容易受到仿真精度的影响,且增加算法的复杂度。该文提出一种基于多分类思想的多特征海上小目标智能检测方法,先对海杂波数据与目标数据进行多维特征提取,构建高维特征空间;再基于多分类思想中的“1对1”方法,将海杂波特征空间划分成多个子空间,每个杂波子空间与目标数据特征空间等大,构造多个二分类器进行联合判决。该文选取的二分类器为改进的双参数K近邻(K-NN)算法,可有效调节虚警率。经冰多参数成像X波段雷达(IPIX)数据集验证,所提方法在观测时间为1.024 s时获得了82.40%的检测概率,与基于K-NN的检测器做比较,获得了2%的性能提升。 展开更多
关键词 海杂波 小目标检测 多分类 双参数寻优k近邻(k-nn)算法 可控虚警
下载PDF
基于高分遥感数据的阿尔泰山乔木林地上生物量预测
9
作者 张绘芳 朱雅丽 +2 位作者 张景路 高健 地力夏提·包尔汉 《林业资源管理》 北大核心 2023年第2期104-110,共7页
为了在区域尺度上精准和便捷地估测森林生物量,以高分遥感数据和实地调查数据为基础,通过提取植被指数、纹理等遥感特征变量,并运用最近邻算法(k-NN)构建乔木林地上生物量预测模型。结果表明,运用k-NN进行区域尺度上乔木林生物量遥感定... 为了在区域尺度上精准和便捷地估测森林生物量,以高分遥感数据和实地调查数据为基础,通过提取植被指数、纹理等遥感特征变量,并运用最近邻算法(k-NN)构建乔木林地上生物量预测模型。结果表明,运用k-NN进行区域尺度上乔木林生物量遥感定量估测,当k值为2,特征为B1(波段1)、SR(简单植被指数)、NDVI(归一化植被指数)、B4(波段4)时,研究区乔木林生物量估测结果最优。通过分析可知:乔木林生物量整体表现不高,地上生物量为803.90万t,单位面积生物量均值为82.15 t/hm^(2);乔木林主要龄组是成熟林时,其面积和生物量占比均最大;在海拔1500~2400 m范围,乔木林单位生物量较高。 展开更多
关键词 乔木林 地上生物量 最近邻算法(k-nn) 遥感反演 特征选择
下载PDF
Multi-color space threshold segmentation and self-learning k-NN algorithm for surge test EUT status identification
10
作者 Jian HUANG Gui-xiong LIU 《Frontiers of Mechanical Engineering》 SCIE CSCD 2016年第3期311-315,共5页
The identification of targets varies in different surge tests. A multi-color space threshold segmentation and self-learning k-nearest neighbor algorithm (k-NN) for equipment under test status identification was prop... The identification of targets varies in different surge tests. A multi-color space threshold segmentation and self-learning k-nearest neighbor algorithm (k-NN) for equipment under test status identification was proposed after using feature matching to identify equipment status had to train new patterns every time before testing. First, color space (L*a*b*, hue saturation lightness (HSL), hue saturation value (HSV)) to segment was selected according to the high luminance points ratio and white luminance points ratio of the image. Second, the unknown class sample Sr was classified by the k-NN algorithm with training set T~ according to the feature vector, which was formed from number ofpixels, eccentricity ratio, compact- ness ratio, and Euler's numbers. Last, while the classification confidence coefficient equaled k, made Sr as one sample ofpre-training set Tz'. The training set Tz increased to Tz+1 by Tz' if Tz' was saturated. In nine series of illuminant, indicator light, screen, and disturbances samples (a total of 21600 frames), the algorithm had a 98.65% identification accuracy, also selected five groups of samples to enlarge the training set from To to T5 by itself. Keywords multi-color space, k-nearest neighbor algorithm (k-NN), self-learning, surge test 展开更多
关键词 multi-color space k-nearest neighbor algorithm (k-nn) SELF-LEARNING surge test
原文传递
基于颜色和深度信息融合的目标识别方法 被引量:17
11
作者 吴鑫 王桂英 丛杨 《农业工程学报》 EI CAS CSCD 北大核心 2013年第A01期96-100,共5页
传统的机器视觉采用二维RGB图像,难以满足三维视觉检测的要求,深度图像能直接反映物体表面的三维特征,正逐渐受到重视。该文提出的方案将RGB和深度信息相结合,分割出物体所在区域,并利用梯度方向直方图(HOG,histograms of oriented grad... 传统的机器视觉采用二维RGB图像,难以满足三维视觉检测的要求,深度图像能直接反映物体表面的三维特征,正逐渐受到重视。该文提出的方案将RGB和深度信息相结合,分割出物体所在区域,并利用梯度方向直方图(HOG,histograms of oriented gradients)分别提取RGB图像和深度图像特征信息。在分类算法上,该文采用k最邻近节点算法(k-NN)对特征进行筛选,识别出目标物体。试验结果表明,综合利用深度信息和RGB信息,识别准确率很高,此方案能够对物体和手势进行很好识别。 展开更多
关键词 物体识别 图像处理 图像分割 深度图像 RGB图像 k最邻近节点算法(k-nn)
下载PDF
高维不确定数据的子空间聚类算法 被引量:3
12
作者 万静 郑龙君 +1 位作者 何云斌 李松 《计算机应用》 CSCD 北大核心 2019年第11期3280-3287,共8页
如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维... 如何降低不确定数据对高维数据聚类的影响是当前的研究难点。针对由不确定数据与维度灾难导致的聚类精度低的问题,采用先将不确定数据确定化,后对确定数据聚类的方法。在将不确定数据确定化的过程中,将不确定数据分为值不确定数据与维度不确定数据,并分别处理以提高算法效率。采用结合期望距离的K近邻(K NN)查询得到对聚类结果影响最小的不确定数据近似值以提高聚类精度。在得到确定数据之后,采用子空间聚类的方式避免维度灾难的影响。实验结果证明,基于Clique的高维不确定数据聚类算法(UClique)在UCI数据集上有较好的表现,有良好的抗噪声能力和伸缩性,在高维数据上能得到较好的聚类结果,在不同的不确定数据集实验中能够得到较高精度的实验结果,体现出算法具有一定的健壮性,能够有效地对高维不确定数据集聚类。 展开更多
关键词 高维 不确定 CLIQUE算法 k近邻
下载PDF
SCATS线圈数据短时多步双重预测方法 被引量:2
13
作者 李琦 姜桂艳 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2013年第2期123-128,共6页
为了进一步改善悉尼自适应交通控制系统(Sydney coordinated adaptive traffic system,SCATS)线圈数据短时多步预测的效果,在对SCATS线圈数据进行预处理的基础上,将当前与之前若干时间间隔的交通数据及对应的时间点作为交通模式特征向... 为了进一步改善悉尼自适应交通控制系统(Sydney coordinated adaptive traffic system,SCATS)线圈数据短时多步预测的效果,在对SCATS线圈数据进行预处理的基础上,将当前与之前若干时间间隔的交通数据及对应的时间点作为交通模式特征向量的构成要素,用欧式距离作为当前交通模式特征向量和历史交通模式特征向量相似性的测度指标,以多步预测结果的误差最小为目标选取近邻数,通过对交通模式之间距离的倒数正规化处理,确定了所选相似交通模式的未来交通参数的权重,设计了一种基于k近邻(k nearest neighbor,k-NN)算法的短时多步双重预测方法,包括SCATS线圈数据的多步预测方法以及可预测步数在线估计方法,并采用某特大城市SCATS线圈实测数据进行了验证和对比分析.结果表明,所提出的新方法能够进一步降低SCATS线圈数据短时多步预测的误差. 展开更多
关键词 交通运输工程 悉尼自适应交通控制系统 感应线圈 短时交通预测 k近邻算法
下载PDF
基于可变核的自适应光辐射强度估算
14
作者 王海波 张文辉 +1 位作者 杨辉华 周欢 《计算机应用》 CSCD 北大核心 2011年第8期2240-2242,2245,共4页
针对传统的K最近邻(K-NN)光辐射强度估算只能通过发射大量的光子、增加光子密度来提高估算精度这一缺陷,提出用具有平滑性的可变核(VK)函数估算光辐射强度,通过计算光子到估算点的距离与该光子预先分配的半径之比,实现与传统估算算法不... 针对传统的K最近邻(K-NN)光辐射强度估算只能通过发射大量的光子、增加光子密度来提高估算精度这一缺陷,提出用具有平滑性的可变核(VK)函数估算光辐射强度,通过计算光子到估算点的距离与该光子预先分配的半径之比,实现与传统估算算法不同的自适应光辐射强度估算。实验结果表明,VK算法不需发射大量光子就能改善图像质量且渲染速度快。 展开更多
关键词 光辐射强度估算 k最邻近算法 可变核 自适应
下载PDF
改进SMOTE的不平衡数据集成分类算法 被引量:32
15
作者 王忠震 黄勃 +2 位作者 方志军 高永彬 张娟 《计算机应用》 CSCD 北大核心 2019年第9期2591-2596,共6页
针对不平衡数据集的低分类准确性,提出基于改进合成少数类过采样技术(SMOTE)和AdaBoost算法相结合的不平衡数据分类算法(KSMOTE-AdaBoost)。首先,根据K近邻(K NN)的思想,提出噪声样本识别算法,通过样本的K个近邻中所包含的异类样本数目... 针对不平衡数据集的低分类准确性,提出基于改进合成少数类过采样技术(SMOTE)和AdaBoost算法相结合的不平衡数据分类算法(KSMOTE-AdaBoost)。首先,根据K近邻(K NN)的思想,提出噪声样本识别算法,通过样本的K个近邻中所包含的异类样本数目,对样本集中的噪声样本进行精确识别并予以滤除;其次,在过采样过程中基于聚类的思想将样本集划分为不同的子簇,根据子簇的簇心及其所包含的样本数目,在簇内样本与簇心之间进行新样本的合成操作。在样本合成过程中充分考虑类间和类内数据不平衡性,对样本及时修正以保证合成样本质量,平衡样本信息;最后,利用AdaBoost算法的优势,采用决策树作为基分类器,对平衡后的样本集进行训练,迭代多次直到满足终止条件,得到最终分类模型。选择G-mean、AUC作为评价指标,通过在6组KEEL数据集进行对比实验。实验结果表明,所提的过采样算法与经典的过采样算法SMOTE、自适应综合过采样技术(ADASYN)相比,G-means和AUC在4组中有3组最高;所提分类模型与现有的不平衡分类模型SMOTE-Boost,CUS-Boost,RUS-Boost相比,6组数据中:G-means均高于CUS-Boost和RUS-Boost,有3组低于SMOTE-Boost;AUC均高于SMOTE-Boost和RUS-Boost,有1组低于CUS-Boost。验证了所提的KSMOTE-AdaBoost具有更好的分类效果,且模型泛化性能更高。 展开更多
关键词 不平衡数据分类 合成少数类过采样技术 k近邻 过采样 聚类 ADABOOST算法
下载PDF
基于多尺度信息熵的雷达辐射源信号识别 被引量:21
16
作者 黄颖坤 金炜东 +1 位作者 葛鹏 李冰 《电子与信息学报》 EI CSCD 北大核心 2019年第5期1084-1091,共8页
随着雷达信号的日益复杂,从实数序列中提取特征变得越来越困难,但当它们表示成符号序列时,通常能更容易地挖掘出有效的特征参数。因此,该文提出一种基于多尺度信息熵(MSIE)的雷达信号识别方法。首先通过符号聚合近似(SAX)算法在不同字... 随着雷达信号的日益复杂,从实数序列中提取特征变得越来越困难,但当它们表示成符号序列时,通常能更容易地挖掘出有效的特征参数。因此,该文提出一种基于多尺度信息熵(MSIE)的雷达信号识别方法。首先通过符号聚合近似(SAX)算法在不同字符集尺度下将雷达信号转换为符号化序列;然后联合各符号序列的信息熵值,组成MSIE特征向量;最后,使用k邻近算法(k-NN)作为分类器实现雷达信号的分类识别。通过仿真6种典型的雷达信号进行验证,结果表明该方法在信噪比(SNR)为5 dB时,不同雷达信号的识别正确率大于90%,并且优于传统的基于复杂度特征(盒维数和稀疏性)的识别方法。 展开更多
关键词 雷达信号识别 符号聚合近似算法 多尺度信息熵 k邻近算法
下载PDF
软件定义广域网中控制器部署与交换机动态迁移策略 被引量:5
17
作者 郭烜成 林晖 +1 位作者 叶秀彩 许传丰 《计算机应用》 CSCD 北大核心 2019年第2期453-457,共5页
在软件定义广域网(SD-WAN)部署中,由于广域网(WAN)覆盖范围极大这一特性,单控制器部署策略无论在容量、负载还是安全方面都无法满足其需求,多控制器的部署成为必然趋势。而多控制器部署后整体网络的静态配置很难适应动态的网络流变化,... 在软件定义广域网(SD-WAN)部署中,由于广域网(WAN)覆盖范围极大这一特性,单控制器部署策略无论在容量、负载还是安全方面都无法满足其需求,多控制器的部署成为必然趋势。而多控制器部署后整体网络的静态配置很难适应动态的网络流变化,从而造成控制器的负载不均衡,整体网络性能降低。针对上述问题,提出一种多控制器部署算法SC-cSNN,以有效减小控制器和交换机之间的传播时延;并提出一种基于时延、控制器容量以及控制器安全等特征的交换机动态迁移算法,以有效解决控制器超负载问题。仿真实验结果表明,SC-cSNN控制器部署算法的平均最大时延优于现有的基于k-means和基于谱聚类的控制器部署算法,交换机动态迁移算法从多特征的角度有效地解决了SD-WAN控制器负载不均衡的问题。 展开更多
关键词 软件定义广域网 谱聚类 控制器部署 k邻近算法 交换机动态迁移
下载PDF
改进混合二进制蝗虫优化特征选择算法 被引量:4
18
作者 赵泽渊 代永强 《计算机科学与探索》 CSCD 北大核心 2021年第7期1339-1349,共11页
特征选择是从数据集的原始特征中选出最优或较优特征子集,从而在加快分类速度的同时提高分类准确率。提出了一种改进的混合二进制蝗虫优化特征选择算法:通过引入步长引导个体位置变化的二进制转化策略,降低了进制转换的盲目性,提高了算... 特征选择是从数据集的原始特征中选出最优或较优特征子集,从而在加快分类速度的同时提高分类准确率。提出了一种改进的混合二进制蝗虫优化特征选择算法:通过引入步长引导个体位置变化的二进制转化策略,降低了进制转换的盲目性,提高了算法在解空间中的搜索性能;通过引入混合复杂进化方法,将蝗虫群体划分子群并独立进化,提高了算法的多样性,降低了早熟收敛的概率。采用改进算法对UCI部分数据集进行特征选择,使用K-NN分类器对特征子集进行分类评价,实验结果表明:与基本二进制蝗虫优化算法、二进制粒子群优化算法和二进制灰狼优化算法相比,改进算法具有较优的搜索性能、收敛性能与较强的鲁棒性,能够获得更好的特征子集,取得更好的分类效果。 展开更多
关键词 二进制 蝗虫优化算法 混合复杂进化方法 特征选择 分类 k邻近(k-nn)算法
下载PDF
不平衡时间序列集成分类算法 被引量:2
19
作者 曹阳 闫秋艳 吴鑫 《计算机应用》 CSCD 北大核心 2021年第3期651-656,共6页
针对现有集成分类方法对不平衡时间序列数据学习能力欠佳的问题,采用优化组件算法性能和集成策略的思路,以异构集成方法即基于变换的集合的层次投票集合(HIVE-COTE)为基础,提出一种不平衡时间序列集成分类算法IMHIVE-COTE。该算法主要... 针对现有集成分类方法对不平衡时间序列数据学习能力欠佳的问题,采用优化组件算法性能和集成策略的思路,以异构集成方法即基于变换的集合的层次投票集合(HIVE-COTE)为基础,提出一种不平衡时间序列集成分类算法IMHIVE-COTE。该算法主要包含两个改进内容:首先,增加了一个新的不平衡分类组件SBST-HESCA,引入Boosting结合重采样的思路,并通过交叉验证预测结果来更新样本权重,从而使数据集的重采样过程更有利于提升少数类样本的分类质量;其次,结合SBST-HESCA组件对HIVE-COTE计算框架进行改进,通过优化组件算法的权重使不平衡时间序列分类算法对分类结果拥有更高的投票比重,从而再次提升集成算法整体的分类质量。实验部分对IMHIVE-COTE的性能进行了验证和分析:和对比方法相比,IMHIVE-COTE有最高的整体分类评价,并且在三个不平衡分类指标值上分别得到了最优、最优、第三优的整体分类评价,可以证明IMHIVE-COTE解决不平衡时间序列分类问题的能力明显较高。 展开更多
关键词 不平衡时间序列 集成分类算法 提升方法 k最近邻 基于变换的集合的层次投票集合
下载PDF
基于K-NN最邻近点算法的因子提取方法及量化策略研究 被引量:5
20
作者 金元浩 房勇 卢焱 《数学的实践与认识》 2021年第19期106-119,共14页
如何提升多因子模型对超额收益的经济解释同时兼顾实际的投资效果一直是资产定价和投资学研究领域的热点和棘手问题之一.在因子的提取问题上,大部分实证研究局限在改变或替换因子上.将机器学习中的K-NN最临近点算法应用到因子提取之中,... 如何提升多因子模型对超额收益的经济解释同时兼顾实际的投资效果一直是资产定价和投资学研究领域的热点和棘手问题之一.在因子的提取问题上,大部分实证研究局限在改变或替换因子上.将机器学习中的K-NN最临近点算法应用到因子提取之中,不仅提升了多因子模型的经济解释能力,而且保证了较好的实证结果的统计性质,进而据此给出了一个量化选股策略.通过选取沪深300指数全部股票从2014年至2019年的相关数据进行实证分析,并使用2020年1月至9月的数据进行了外推及效果验证.实证结果表明,给出的因子提取方法具备更好的统计检验效果且能得到更高的累计收益,并且量化选股策略具有更优秀的收益风险表现. 展开更多
关键词 多因子模型 k-nn最临近点算法 因子提取
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部