期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
基于变采样分辨率相关分析法的铁道客车轮对动平衡测试
1
作者 吕守宝 赵世田 +3 位作者 崔治 曾勇 唐崇邦 黄涛 《噪声与振动控制》 CSCD 北大核心 2024年第6期143-148,共6页
铁道客车轮对上的不平衡质量影响列车运行安全及速度的进一步提升,轮对安装前需要精确检测不平衡质量并进行动平衡处理。本文提出自适应小波消噪、MUSIC(Multiple Signal Classification)谱估计、相关分析法相结合的方法,实现铁道客车... 铁道客车轮对上的不平衡质量影响列车运行安全及速度的进一步提升,轮对安装前需要精确检测不平衡质量并进行动平衡处理。本文提出自适应小波消噪、MUSIC(Multiple Signal Classification)谱估计、相关分析法相结合的方法,实现铁道客车轮对动平衡振动信号特征的提取。通过Labview软件与MATLAB混合编程实现软件开发,并搭建铁道客车轮对动平衡测试平台进行实验验证,实验验证结果表明,经过降噪和采样分辨率的控制,可以克服现场噪声及频率干扰问题,提取的信号幅值及相位具有较高的精度,可实现轮对上不平衡质量及位置的准确探测。 展开更多
关键词 振动与波 变采样分辨率 相关分析法 铁道客车轮对 振动信号特征提取 动平衡
下载PDF
基于PSO-ELM组合算法的热力站负荷预测研究
2
作者 马文菁 郭晓杰 +3 位作者 曹姗姗 孙春华 夏国强 齐承英 《暖通空调》 2024年第3期157-162,共6页
提出了一种粒子群优化极限学习机(PSO-ELM)算法用于热力站负荷预测,应用粒子群(PSO)算法优化极限学习机(ELM)的输入权值和隐含层阈值。将提出的组合算法应用于天津市某小区热力站的负荷预测中,并与ELM、支持向量回归(SVR)和粒子群优化... 提出了一种粒子群优化极限学习机(PSO-ELM)算法用于热力站负荷预测,应用粒子群(PSO)算法优化极限学习机(ELM)的输入权值和隐含层阈值。将提出的组合算法应用于天津市某小区热力站的负荷预测中,并与ELM、支持向量回归(SVR)和粒子群优化支持向量回归(PSO-SVR)算法在同等条件下进行比较。结果表明,PSO-ELM在预测精度上优于其他算法;在热负荷波动较大时,表现优于PSO-SVR;在一定范围内样本容量对预测结果影响不大,PSO-ELM可遗忘更多的数据。 展开更多
关键词 热力站 热负荷预测 极限学习机 粒子群优化 负荷波动 训练集样本容量
下载PDF
基于点集匹配的缺陷样本图像生成方法 被引量:1
3
作者 高海洋 张明川 +1 位作者 葛泉波 刘华平 《智能系统学报》 CSCD 北大核心 2023年第5期1030-1038,共9页
针对工业缺陷检测中存在的由产品次品率过低、产品迭代更新过快、缺陷种类难以覆盖全部以及缺陷样本高质量标注难度较高导致的小样本问题,使用基于点集匹配的缺陷样本图像生成方法来对缺陷数据进行扩充。将缺陷部位从多特征角度进行变换... 针对工业缺陷检测中存在的由产品次品率过低、产品迭代更新过快、缺陷种类难以覆盖全部以及缺陷样本高质量标注难度较高导致的小样本问题,使用基于点集匹配的缺陷样本图像生成方法来对缺陷数据进行扩充。将缺陷部位从多特征角度进行变换,使用单张样本进行扩充得到不同特征的缺陷图像,解决小样本条件下深度学习方法难以生成高质量缺陷图像的问题。通过图像评估与实验验证,该方法生成的图像具有更好的视觉效果,并且对缺陷与分割模型有着高效的提升。该方法可应用于样本较少的深度学习模型训练过程中,达到扩充样本提高训练效果的目的。 展开更多
关键词 工业 缺陷检测 小样本问题 点集匹配 样本扩充 缺陷样本生成 有效训练 循环生成对抗网络模型 矢量化变分自动编码器
下载PDF
变电站屏柜运检中的图像识别技术应用 被引量:2
4
作者 钱卓昊 张红旗 卢梓睿 《集成电路应用》 2023年第3期210-211,共2页
阐述变电站屏柜运检中的图像识别技术应用,不仅可以对图像进行识别,同样也可以将采集到的图像作为新的样本集,不断地对现有的模型进行优化和迭代,提升模型的性能。
关键词 图像识别技术 模型训练 图像样本集 识别算法
下载PDF
粗糙集-神经网络故障诊断方法研究 被引量:23
5
作者 郝丽娜 王伟 +1 位作者 吴光宇 王宛山 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期252-255,共4页
从人工神经网络故障诊断模型的特点出发 ,利用粗糙集理论解决该模型应用中的主要问题 ,包括进行训练样本质量研究 ,定义相关概念 ,给出故障特征提取算法等 ,提出了粗糙集 神经网络智能混合系统模型 ,分析了该模型的实现步骤 ,结合具体... 从人工神经网络故障诊断模型的特点出发 ,利用粗糙集理论解决该模型应用中的主要问题 ,包括进行训练样本质量研究 ,定义相关概念 ,给出故障特征提取算法等 ,提出了粗糙集 神经网络智能混合系统模型 ,分析了该模型的实现步骤 ,结合具体实例验证了上述理论的正确性·利用SAS软件进行了数值仿真·结果表明 ,提出的理论较好地解决了神经网络结构、训练样本的大小、样本质量等对人工神经网络的精度及泛化能力有直接影响的问题 ,减少了训练所需的计算量和时间 ,提高了模型的正确率· 展开更多
关键词 粗糙集 人工神经网络 故障诊断 训练样本质量 智能混合系统
下载PDF
主动学习算法研究进展 被引量:11
6
作者 杨文柱 田潇潇 +1 位作者 王思乐 张锡忠 《河北大学学报(自然科学版)》 CAS 北大核心 2017年第2期216-224,共9页
主动学习的主要目的是在保证分类器精度不降低的前提下尽量降低人工标注的成本.主动学习算法通过迭代方式在原始样例集中挑选可以提升模型性能的样例进行专家标注,并将其补充到已有的训练集中,使被训练的分类器在较低的标注成本下获得... 主动学习的主要目的是在保证分类器精度不降低的前提下尽量降低人工标注的成本.主动学习算法通过迭代方式在原始样例集中挑选可以提升模型性能的样例进行专家标注,并将其补充到已有的训练集中,使被训练的分类器在较低的标注成本下获得较强的泛化能力.首先对主动学习算法中3个关键步骤的研究进展情况进行了分析:1)初始训练样例集的构建方法及其改进;2)样例选择策略及其改进;3)算法终止条件的设定及其改进;然后对传统主动学习算法面临的问题及改进措施进行了深入剖析;最后展望了主动学习需进一步研究的内容. 展开更多
关键词 主动学习 初始训练集 样例选择策略 终止条件
下载PDF
kNN文本分类器类偏斜问题的一种处理对策 被引量:33
7
作者 郝秀兰 陶晓鹏 +1 位作者 徐和祥 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2009年第1期52-61,共10页
类偏斜问题(class i mbalance problem)是数据挖掘领域的常见问题之一,人们提出了各种策略来处理这个问题.当训练样本存在类偏斜问题时,kNN分类器会将小类中的样本错分到大类,导致分类的宏F1指标下降.针对kNN存在的这个缺陷,提出了文本... 类偏斜问题(class i mbalance problem)是数据挖掘领域的常见问题之一,人们提出了各种策略来处理这个问题.当训练样本存在类偏斜问题时,kNN分类器会将小类中的样本错分到大类,导致分类的宏F1指标下降.针对kNN存在的这个缺陷,提出了文本训练集的临界点(critical point,CP)的概念并对其性质进行了探讨,给出了求CP,CP的下近似值LA、上近似值UA的算法.之后,根据LA或UA及训练样本数对传统的kNN决策函数进行修改,这就是自适应的加权kNN文本分类.为了验证自适应的加权kNN文本分类的有效性,设计了2组实验进行对比:一组为不同的收缩因子间进行对比,可看做是与Tan的工作进行对比,同时用来证实在LA或UA上分类器的宏F1较好;另一组则是与随机重取样进行实验对比,其中,传统kNN方法作为对比的基线.实验表明,所提的自适应加权kNN文本分类优于随机重取样,使得宏F1指标明显上升.该方法有点类似于代价相关学习. 展开更多
关键词 文本分类 KNN 类偏斜 文本训练集的临界点 权重调节 随机重取样
下载PDF
应用快速多分类SVM的航空发动机故障诊断方法 被引量:20
8
作者 徐启华 师军 耿帅 《推进技术》 EI CAS CSCD 北大核心 2012年第6期961-967,共7页
提出了一种新的快速多分类SVM算法,用于解决大样本情况下航空发动机的多类故障诊断问题。首先,选用层次支持向量机(H-SVM)来实现多类分类,用各类数据中心代表该类数据,通过自组织特征映射神经网络(SOFM)进行聚类,把类中心之间距离较近... 提出了一种新的快速多分类SVM算法,用于解决大样本情况下航空发动机的多类故障诊断问题。首先,选用层次支持向量机(H-SVM)来实现多类分类,用各类数据中心代表该类数据,通过自组织特征映射神经网络(SOFM)进行聚类,把类中心之间距离较近的数据归为同一个子类进行训练,得到H-SVM层次结构。其次,在训练H-SVM中的二元分类器时,应用相对边界向量(RBV)代替全部训练样本,在保持分类精度几乎不变的条件下大幅度减少了训练样本数,使训练时间明显缩短;同时,由于支持向量的数量减小,分类时间也相应缩短。在分类数据混迭较为严重的情况下,新算法先剔除混迭的异类数据,再计算RBV,并且把与计算的RBV距离小于一定数值的样本都选择来训练SVM,保证了RBV的合理性,防止了关键数据的丢失,有效提高了分类精度。针对一个航空涡喷发动机5类复合故障的分类进行了实例仿真,总的故障分类正确率达到91.2%,二元SVM的训练时间最多只有原来的16.20%;当训练样本总数达到7500的大规模情况下,根据本算法,约减后的样本数量只有原来的3.05%。仿真结果表明,提出的算法有效、可靠,容易实现。 展开更多
关键词 航空发动机 支持向量机 故障诊断 大规模训练集 样本约减 神经网络
下载PDF
基于阴影集数据选择的可拓神经网络性能改进 被引量:5
9
作者 周玉 钱旭 王自强 《北京工业大学学报》 CAS CSCD 北大核心 2013年第3期430-437,共8页
为了改进可拓神经网络的性能,提出一种基于阴影集的数据选择方法.通过该方法获取用于训练可拓神经网络的训练样本,进而改进可拓神经网络的性能.针对可拓神经网络的特点,选择核数据和边界数据作为可拓神经网络的训练样本;利用基于阴影集... 为了改进可拓神经网络的性能,提出一种基于阴影集的数据选择方法.通过该方法获取用于训练可拓神经网络的训练样本,进而改进可拓神经网络的性能.针对可拓神经网络的特点,选择核数据和边界数据作为可拓神经网络的训练样本;利用基于阴影集的数据选择方法,可以自动获取核数据和边界数据.实验结果表明,与传统可拓神经网络相比,改进的可拓神经网络不仅节约了训练时间,而且网络的泛化能力和分类识别准确度得到了有效提高. 展开更多
关键词 可拓神经网络 数据选择 阴影集 训练样本 泛化能力
下载PDF
基于虚拟样本的加权稀疏表示人脸识别研究 被引量:3
10
作者 项晓丽 武圣 +1 位作者 龙伟 武和雷 《控制工程》 CSCD 北大核心 2018年第3期488-492,共5页
实际的人脸识别系统常常会面临小样本问题,为了提高在小样本情况下人脸识别的分类正确率,提出一种基于虚拟样本的高斯加权稀疏表示的人脸识别方法。该方法首先利用人脸的对称性来构造虚拟训练样本,扩充训练样本集;然后,对每个测试... 实际的人脸识别系统常常会面临小样本问题,为了提高在小样本情况下人脸识别的分类正确率,提出一种基于虚拟样本的高斯加权稀疏表示的人脸识别方法。该方法首先利用人脸的对称性来构造虚拟训练样本,扩充训练样本集;然后,对每个测试样本,利用高斯核距离度量该测试样本和各个训练样本的相似性关系,并将该高斯核距离作为训练样本的权值来形成加权的训练样本集:最后,利用稀疏表示方法进行人脸的识别分类。实验结果比较分析表明,该方法在小样本情况下可以获得更好的识别效果。 展开更多
关键词 人脸识别 小样本问题 虚拟训练样本 高斯核距离 加权的训练样本集 相似性关系
下载PDF
模糊聚类与LBG级联的VQ算法 被引量:4
11
作者 姜占才 孙燕 姚刚 《计算机工程与科学》 CSCD 北大核心 2011年第5期155-159,共5页
针对LBG算法初始码本随机选取后易出现空胞腔、易陷入局部极小、迭代次数大等缺陷,本文依据模糊聚类理论引入了矢量量化码本设计训练的模糊聚类与LBG级联算法:先用模糊聚类算法训练码本,将训练得到的码本作为传统LBG算法的初始码本,再... 针对LBG算法初始码本随机选取后易出现空胞腔、易陷入局部极小、迭代次数大等缺陷,本文依据模糊聚类理论引入了矢量量化码本设计训练的模糊聚类与LBG级联算法:先用模糊聚类算法训练码本,将训练得到的码本作为传统LBG算法的初始码本,再用传统LBG算法训练。论述了模糊聚类和LBG联合算法的原理与方法;用该算法分别训练了语音线性预测系数的对数面积比(LAR)码本和语音子带浊音度码本;训练过程显示,模糊聚类训练阶段能训练到码本设计目标或接近目标,再经LBG训练阶段,都能达到设计的最佳目标。将训练得到的码本用于多种声码器中进行仿真实验,得到了可懂度高且较自然、清晰的解码语音。 展开更多
关键词 矢量量化 模糊聚类 LBG 码本 训练样本集
下载PDF
基于Haar-like特征与Adaboost算法的前方车辆辨识技术研究 被引量:11
12
作者 朱志明 乔洁 《电子测量技术》 2017年第5期180-184,共5页
为了提高前方车辆的辨识效能,提出一种融合Haar-like特征与Adaboost算法的前方车辆辨识方法,基于海量车辆样本集进行离线训练,提取有效车辆轮廓与纹理特征,以Haar-like特征作为目标描述方法,采用Adaboost机器学习算法训练分类器,并构建... 为了提高前方车辆的辨识效能,提出一种融合Haar-like特征与Adaboost算法的前方车辆辨识方法,基于海量车辆样本集进行离线训练,提取有效车辆轮廓与纹理特征,以Haar-like特征作为目标描述方法,采用Adaboost机器学习算法训练分类器,并构建特征样本级联分类器,对测试对象进行车辆存在性检测。试验结果表明,提出的融合Haar-like与Adaboost的车辆辨识算法检测准确率为91%以上,平均检测速率28ms,对车辆类型和环境干扰等非确定因素具有较强的自适应能力,提高了前方车辆纵向检测的鲁棒性,满足了车辆纵向维度的安全行驶应用需求。 展开更多
关键词 HAAR-LIKE特征 ADABOOST 训练样本集 辨识
下载PDF
基于虚拟样本图像集的多流形鉴别学习算法 被引量:1
13
作者 董西伟 尧时茂 +1 位作者 王玉伟 朱阳平 《计算机应用研究》 CSCD 北大核心 2018年第6期1872-1878,共7页
为了丰富训练样本的类内变化信息,提出了基于通用训练样本集的虚拟样本生成方法。为了利用生成的虚拟样本中的类内变化信息有效地完成单样本人脸识别任务,提出了基于虚拟样本图像集的多流形鉴别学习算法。该算法将每类仅有的单个训练样... 为了丰富训练样本的类内变化信息,提出了基于通用训练样本集的虚拟样本生成方法。为了利用生成的虚拟样本中的类内变化信息有效地完成单样本人脸识别任务,提出了基于虚拟样本图像集的多流形鉴别学习算法。该算法将每类仅有的单个训练样本图像和该类的虚拟样本图像划分为互不重叠的局部块并构建流形,然后为每个流形学习一个投影矩阵,使得相同流形内的局部块在投影后的低维特征空间间隔最小化,不同流形中的局部块在投影后的低维特征空间中间隔最大化。实验结果表明,所提算法能够准确地预测测试样本中的类内变化,是一种有效的单样本人脸识别算法。 展开更多
关键词 单样本人脸识别 虚拟样本 通用训练样本集 多流形鉴别学习
下载PDF
基于大训练样本集的ε-SVR改进算法研究 被引量:1
14
作者 魏延 曾绍华 +1 位作者 王勇 曹长修 《计算机仿真》 CSCD 北大核心 2010年第10期352-356,共5页
在改进算法的研究中,从大训练样本集中进行样本抽样是构建大样本支持向量回归机的重要手段。根据ε-SVR支持向量分布的特有属性和支持向量逐步回归机算法求解ε-SVR的缺陷,为改善训练时间,优化收敛性,从大训练样本集中抽取的小样本集的... 在改进算法的研究中,从大训练样本集中进行样本抽样是构建大样本支持向量回归机的重要手段。根据ε-SVR支持向量分布的特有属性和支持向量逐步回归机算法求解ε-SVR的缺陷,为改善训练时间,优化收敛性,从大训练样本集中抽取的小样本集的ε-SVR超平面出发,通过计算大训练样本集样本点距近似超平面距离d,剔除大训练样本集中在ε≤d≤dmax外的训练样本点,逐步搜索SVs,建立大训练样本集ε-SVR。提出了构建大训练样本集ε-SVR的逐步搜索算法,理论分析和仿真实验验证了搜索算法的收敛性和有效性。 展开更多
关键词 搜索算法 大训练样本 仿真
下载PDF
基于遗传神经网络热轧带钢卷曲温度预报系统 被引量:1
15
作者 孙铁军 高海 +1 位作者 王洪希 徐昭云 《自动化仪表》 CAS 2008年第4期23-25,共3页
带钢冷却过程的热交换是非常复杂的多变量、非线性、强耦合、大滞后的过程,难以用数学模型精确表达。提出了一种将遗传算法与神经网络结合起来,能够提高卷取温度预报精度的系统。利用热连轧现场生产过程中的实际历史数据,对预报带钢卷... 带钢冷却过程的热交换是非常复杂的多变量、非线性、强耦合、大滞后的过程,难以用数学模型精确表达。提出了一种将遗传算法与神经网络结合起来,能够提高卷取温度预报精度的系统。利用热连轧现场生产过程中的实际历史数据,对预报带钢卷取温度的遗传神经网络进行离线学习和测试。结果表明,达到了卷取温度预报的精度要求,同时具有较快的收敛速度,能够满足在线实时控制的要求。 展开更多
关键词 遗传神经网络 迭代 训练集样本 非线性 温度控制
下载PDF
判别外观模型下的寻优匹配跟踪算法 被引量:3
16
作者 刘万军 刘大千 费博雯 《模式识别与人工智能》 EI CSCD 北大核心 2017年第9期791-802,共12页
针对模型匹配跟踪算法易受遮挡、复杂背景等因素影响的问题,提出判别外观模型下的寻优匹配跟踪算法.首先,提取前5帧图像的局部特征块,建立由特征块组成的训练样本集,并利用颜色、纹理特征进行聚类组建判别外观模型.然后,利用双向最优相... 针对模型匹配跟踪算法易受遮挡、复杂背景等因素影响的问题,提出判别外观模型下的寻优匹配跟踪算法.首先,提取前5帧图像的局部特征块,建立由特征块组成的训练样本集,并利用颜色、纹理特征进行聚类组建判别外观模型.然后,利用双向最优相似匹配方法进行目标检测.为了解决复杂背景干扰,提出前景划分方法约束匹配过程,得到更准确的匹配结果.最后,定期将跟踪结果加入聚类集合以更新外观模型.实验表明,由于利用多帧训练的判别外观模型及双向最优相似匹配方法,算法在局部遮挡、复杂背景等条件下的跟踪准确率较高. 展开更多
关键词 训练样本集 判别外观模型 最优相似性匹配 双向校验 目标跟踪
下载PDF
最小二乘支持向量机与Kalman滤波耦合的瓦斯涌出量动态预测模型 被引量:3
17
作者 付华 訾海 《计算机应用》 CSCD 北大核心 2015年第1期289-293,共5页
针对瓦斯涌出量的多影响因素预测问题,提出一种最小二乘支持向量机(LS-SVM)回归算法与卡尔曼滤波耦合的动态预测方法。该方法依据预测残差方差比检验策略确定自适应的动态训练样本集以取代固定的训练样本集。LS-SVM辨识网络对瓦斯涌出... 针对瓦斯涌出量的多影响因素预测问题,提出一种最小二乘支持向量机(LS-SVM)回归算法与卡尔曼滤波耦合的动态预测方法。该方法依据预测残差方差比检验策略确定自适应的动态训练样本集以取代固定的训练样本集。LS-SVM辨识网络对瓦斯涌出量的相关因素进行非线性映射并提取出最佳维数的状态向量以建立基于卡尔曼滤波最优估计的瓦斯涌出量预测模型。利用矿井监测到的各项历史数据进行实验。结果表明,该模型的预测平均相对误差为2.17%,平均相对变动值ARV为0.008 873,相比单一的神经网络或支持向量机预测模型,具有更高的预测精度与更强的泛化能力。 展开更多
关键词 非线性 动态训练样本集 最小二乘支持向量机 卡尔曼滤波 瓦斯涌出量
下载PDF
基于智能选择多维特征的肺部CT图像检索 被引量:2
18
作者 刘丛 唐坚刚 张丽红 《计算机应用》 CSCD 北大核心 2010年第7期1867-1869,共3页
单一特征检索图像和手工设置多维加权系数特征检索图像越来越不能满足基于内容图像检索精度的需要,为此提出一种基于训练样本集聚类的多维特征向量加权算法。该算法需要手工建立训练样本集,提取出每个图像的颜色、纹理和形状等多维特征... 单一特征检索图像和手工设置多维加权系数特征检索图像越来越不能满足基于内容图像检索精度的需要,为此提出一种基于训练样本集聚类的多维特征向量加权算法。该算法需要手工建立训练样本集,提取出每个图像的颜色、纹理和形状等多维特征,使用遗传算法寻找特征向量集的最优加权系数序列,最后使用该加权序列计算测试集的特征值进行图像检索。实验证明,该算法相对于单一特征检索和手工设置多维特征加权在检索的准确度上有一定的提高,并且在相似度比较高的两个聚类检索时,有很高的准确性。 展开更多
关键词 图像检索 训练样本集 多维特征向量 遗传算法 最优加权系数
下载PDF
一种基于权重选择虚拟样本的新分类算法 被引量:3
19
作者 俞庆生 《计算机应用与软件》 CSCD 北大核心 2013年第7期280-282,共3页
虚拟样本是一种在学习过程中引入先验知识的有效手段,一定程度上提高了分类器的性能。然而由于生成的虚拟样本集的数据分布与原始训练集的分布不一致,因此利用虚拟样本扩充后的训练样本集进行学习的分类器分类性能上存在波动。针对这种... 虚拟样本是一种在学习过程中引入先验知识的有效手段,一定程度上提高了分类器的性能。然而由于生成的虚拟样本集的数据分布与原始训练集的分布不一致,因此利用虚拟样本扩充后的训练样本集进行学习的分类器分类性能上存在波动。针对这种不足,提出一种基于权重选择虚拟样本的新分类算法。该方法首先利用TrAdaBoost算法对扩充后的样本集进行预处理,然后选取权重大于某一给定阈值的样本构造新训练样本集,最后根据新样本集进行训练得到分类器。由于排出了不重要的样本,因此在新样本集上得到的分类器具有更高的精度。在部分UCI标准数据集与KDD cup 99网络入侵检测数据集上的对比实验说明了该算法较不产生虚拟样本的直接分类算法和利用虚拟样本全集进行训练的分类算法具有更高的精度。 展开更多
关键词 虚拟样本 样本集扩充 特征向量 标签赋值
下载PDF
基于聚类的加速k-近邻分类方法 被引量:7
20
作者 任丽芳 《计算机应用与软件》 CSCD 2015年第10期298-301,共4页
实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Spe... 实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Speeding k-NN Classification Method Based on Clustering)。该方法首先对训练样本进行聚类,得到初始聚类结果,并计算每个类的聚类中心,选择与聚类中心相似度最高的训练样本构成新的训练样本集,然后针对每个测试样本,计算新训练样本集中与其相似度最高的k个样本,并选择该k个近邻样本中最多的类别标签作为该测试样本的预测模式类别。实验结果表明,C_k-NN分类方法在保持较高分类精度的同时大幅度提高模型的分类效率。 展开更多
关键词 k-近邻分类 聚类 相似度 训练样本集 C_k-NN算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部