期刊文献+
共找到7,939篇文章
< 1 2 250 >
每页显示 20 50 100
改进F-score特征选择的MPSO-BP神经网络短期负荷预测 被引量:14
1
作者 丁坚勇 朱炳翔 +3 位作者 田世明 卜凡鹏 陈俊艺 朱天曈 《电测与仪表》 北大核心 2018年第15期36-41,共6页
针对海量数据提出一种基于改进Fisher分数(F-score)特征选择的改进粒子群优化的BP(Modified Particle Swarm Optimization and Back Propagation,MPSO-BP)神经网络短期负荷预测方法。首先采用改进F-score特征评价准则计算影响负荷预测... 针对海量数据提出一种基于改进Fisher分数(F-score)特征选择的改进粒子群优化的BP(Modified Particle Swarm Optimization and Back Propagation,MPSO-BP)神经网络短期负荷预测方法。首先采用改进F-score特征评价准则计算影响负荷预测精度各个特征的F-score值,再通过F-score Area法设定阈值筛选出最优特征子集,然后将最优特征子集作为MPSO-BP神经网络模型的输入变量完成对预测日一天24点负荷的预测,并与MPSO-BP神经网络短期负荷预测和传统BP神经网络短期负荷预测进行对比。算例表明,文中提出的短期负荷预测方法可以较好地对海量数据进行挖掘,具有较高的预测精度。 展开更多
关键词 f-score特征选择 降维 最优特征子集 改进粒子群
下载PDF
基于F-Score特征选择的癫痫脑电信号识别方法
2
作者 凌宇 杜玉晓 李向欢 《自动化与信息工程》 2023年第5期58-62,73,共6页
随着癫痫脑电信号自动检测算法研究地不断深入,需要处理的特征维度也不断增加,且冗余特征增大了算法的复杂度,导致算法性能下降。为此,提出一种基于F-Score特征选择的癫痫脑电信号识别方法。首先,从原始癫痫脑电信号数据集中提取特征,... 随着癫痫脑电信号自动检测算法研究地不断深入,需要处理的特征维度也不断增加,且冗余特征增大了算法的复杂度,导致算法性能下降。为此,提出一种基于F-Score特征选择的癫痫脑电信号识别方法。首先,从原始癫痫脑电信号数据集中提取特征,并计算每个特征的F-Score统计值;然后,根据分类模型的分类准确率,通过序列前向搜索方法,选择最优特征集;最后,利用支持向量机和逻辑回归分类模型进行实验,并与传统的特征降维方法PCA进行对比。实验结果表明,本文方法可有效降低特征矩阵的维数,提高算法运算效率。 展开更多
关键词 f-score PCA 特征提取 特征选择 癫痫脑电信号识别
下载PDF
基于F-score特征选择和支持向量机的P300识别算法 被引量:5
3
作者 杨立才 李金亮 +1 位作者 姚玉翠 吴晓晴 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2008年第1期23-26,52,共5页
如何从脑电信号中快速准确地识别出P300成分是脑-机接口研究中的一个热点问题。针对P300的识别问题,我们提出了一种将F-score特征选择与支持向量机相结合的判别方法,该方法采用F-score特征选择减少输入特征的维数,以克服支持向量机算法... 如何从脑电信号中快速准确地识别出P300成分是脑-机接口研究中的一个热点问题。针对P300的识别问题,我们提出了一种将F-score特征选择与支持向量机相结合的判别方法,该方法采用F-score特征选择减少输入特征的维数,以克服支持向量机算法判别速度慢的缺点;然后借助支持向量机算法良好的分类性能实现P300的识别。本文在BCI Competition 2003的P300实验数据集上对该方法进行了验证,结果表明,在5次重复实验中该方法的识别准确率达到了100%,且判别速度与未经特征选择的传统支持向量机算法相比提高了近2倍。 展开更多
关键词 脑-机接口 P300 f-score特征选择 支持向量机
下载PDF
顾及特征离散程度的SEaTH特征优化选择方法 被引量:1
4
作者 瞿伟 王宇豪 +2 位作者 王乐 李久元 李达 《测绘学报》 EI CSCD 北大核心 2024年第1期20-35,共16页
特征选择是面向对象信息提取的关键步骤之一。本文针对分离阈值(separability and threshold,SEaTH)这一特征选择方法在实际应用中存在的不足,例如未考虑特征值的离散程度,仅利用J-M距离评判单一特征,特征间可能存在较强相关性,以及无... 特征选择是面向对象信息提取的关键步骤之一。本文针对分离阈值(separability and threshold,SEaTH)这一特征选择方法在实际应用中存在的不足,例如未考虑特征值的离散程度,仅利用J-M距离评判单一特征,特征间可能存在较强相关性,以及无法有效确定出分类顺序,提出了一种改进的SEaTH算法(optimized SEaTH,OPSEaTH)。OPSEaTH算法首先在J-M距离基础上构建了一类特征评价指标(E值),有效解决了特征值的离散度问题;然后,基于E值构建出特征组合评价指标(C_(e)值),可有效评估得到每种地物的最佳特征组合并自动确定出地物的分类顺序;最后基于eCognition等分类器可完成对地物对象的最终有效分类。利用高分二号遥感影像数据对本文方法进行了测试,并将结果分别与SEaTH算法、DPC、OIF和最近邻分类器的分类结果进行了对比,结果表明:OPSEaTH算法不仅能有效降低特征维数、优化特征空间,还能够对分类顺序进行自动化合理确定,总体精度和Kappa系数及其他精度指标,均显著优于基于SEaTH算法的特征选择结果。本文方法无论从特征降维效果、分类结果精度还是计算效率方面均优于DPC、OIF和最近邻分类器结果。OPSEaTH是一种更优的特征选择方法。 展开更多
关键词 SEaTH算法 特征选择 离散系数 特征组合 分类顺序 改进SEaTH算法
下载PDF
基于特征选择及ISSA-CNN-BiGRU的短期风功率预测 被引量:2
5
作者 王瑞 徐新超 逯静 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第3期228-239,共12页
针对风电功率随机性大、平稳性低,以及直接输入预测模型往往难以取得较高精度等问题,提出了一种基于特征选择及改进麻雀搜索算法(ISSA)优化卷积神经网络-双向门控循环单元(CNN-BiGRU)的短期风电功率预测方法。首先,利用变分模态分解(VMD... 针对风电功率随机性大、平稳性低,以及直接输入预测模型往往难以取得较高精度等问题,提出了一种基于特征选择及改进麻雀搜索算法(ISSA)优化卷积神经网络-双向门控循环单元(CNN-BiGRU)的短期风电功率预测方法。首先,利用变分模态分解(VMD)将原始功率分解为一组包含不同信息的子分量,以降低原始功率序列的非平稳性,提升可预测性,同时通过观察中心频率方式确定模态分解数。其次,对每一分量采用随机森林(RF)特征重要度的方法进行特征选择,从风速、风向、温度、空气密度等气象特征因素中,选取对各个分量预测贡献度较高的影响因素组成输入特征向量。然后,建立各分量的CNN-BiGRU预测模型,针对神经网络算法参数难调、手动配置参数随机性大的问题,利用ISSA对模型超参数寻优,自适应搜寻最优参数组合。最后,叠加各分量的预测值,得到最终的预测结果。以中国内蒙古某风电场实际数据进行仿真实验,与多种单一及组合预测方法进行对比,结果表明,本文所提方法相比于其他方法具有更高的预测精度,其平均绝对百分比误差值达到2.644 0%;在其他4个数据集上进行的模型准确性及泛化性验证结果显示,模型平均绝对百分比误差值分别为4.385 3%、3.174 9%、1.576 1%和1.358 8%,均保持在5.000 0%以内,证明本文所提方法具有较好的预测精度及泛化能力。 展开更多
关键词 短期风功率预测 变分模态分解 特征选择 改进麻雀搜索算法 卷积神经网络 双向门控循环单元
下载PDF
基于不一致近邻的模糊粗糙集特征选择
6
作者 赵洁 叶文浩 +2 位作者 梁周扬 陈建新 董振宁 《计算机工程》 CSCD 北大核心 2024年第1期110-119,共10页
模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个... 模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个对象的模糊近邻集,持续删减其中不影响计算的近邻,若对象的不一致近邻删减至空,则删减该对象,从而提高算法效率。同时,设计一种基于不一致近邻递减的属性重要度,可有效抑制冗余特征入选,提升效率及分类精度。通过理论证明,所提的加速策略及属性重要度不影响属性入选的次序。在此基础上,提出新的模糊粗糙集特征选择算法。在9个UCI和scikit数据集上进行验证,实验结果表明,该算法不仅有效缩短运行时间,并可取得较高的分类精度,相比FA-FSCE、AVDP和IV-FS-FRS-2算法,运行时间至少可缩短9.44%,尤其在高维和大规模数据上可缩短61.01%~99.54%,在支持向量机和K-近邻算法的分类精度上最高可分别提高11.20%和19.95%。 展开更多
关键词 模糊粗糙集 特征选择 水平截集 不一致近邻 属性重要度
下载PDF
增强学习标签相关性的多标签特征选择方法
7
作者 滕少华 卢建磊 +1 位作者 滕璐瑶 张巍 《计算机应用研究》 CSCD 北大核心 2024年第7期2079-2086,共8页
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合... 针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合样本语义信息的代表性实例,同时计算其对应的标签向量,而这些标签向量体现了每个簇包含不同标签的重要程度;其次,通过原始样本和每个簇中心的标签级自表示,既捕获了原始标签空间中的标签相关性,又探索了每一个簇内的标签相关性;最后,对自表示系数矩阵进行稀疏处理,以减少噪声的影响,并将原始样本和每个簇代表性实例分别从特征空间映射到重构标签空间进行特征选择。在9个多标签数据集上的实验结果表明,所提算法与其他方法相比具有更好的性能。 展开更多
关键词 多标签学习 特征选择 标签相关性 聚类
下载PDF
基于特征选择和ELM神经网络的轴承可靠性预测
8
作者 高淑芝 陈国庆 +1 位作者 张义民 陈一丹 《机械设计与制造》 北大核心 2024年第8期170-173,共4页
针对滚动轴承可靠性预测问题,提出了基于特征选择和ELM网络的可靠性预测方法。首先,对振动信号提取特征,构成特征参数初选集;其次,引入单调性、相关性、鲁棒性三个特征评价指标对特征参数初选集进行特征评价,并定义了一种新的限制性指标... 针对滚动轴承可靠性预测问题,提出了基于特征选择和ELM网络的可靠性预测方法。首先,对振动信号提取特征,构成特征参数初选集;其次,引入单调性、相关性、鲁棒性三个特征评价指标对特征参数初选集进行特征评价,并定义了一种新的限制性指标,得到可以反映轴承退化过程的参数,构成退化特征参数集;再次,对退化特征参数集进行维数约简,构成低维特征向量集;最后,以退化特征参数集和特征向量集分别为输入数据和标签带入ELM网络中做可靠性预测。通过西安交通大学轴承振动信号数据集证明了该方法的有效性。 展开更多
关键词 特征评价指标 特征选择 ELM神经网络 可靠性预测
下载PDF
具有潜在表示和动态图约束的多标签特征选择
9
作者 李坤 刘婧 齐赫 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1188-1202,共15页
针对现有嵌入式方法忽略实例相关性的潜在表示对伪标记学习的影响以及固定的图矩阵导致计算误差随迭代的加深而不断增大的问题,提出一种具有潜在表示和动态图约束的多标签特征选择方法.该方法首先利用实例相关性的潜在表示构造伪标签矩... 针对现有嵌入式方法忽略实例相关性的潜在表示对伪标记学习的影响以及固定的图矩阵导致计算误差随迭代的加深而不断增大的问题,提出一种具有潜在表示和动态图约束的多标签特征选择方法.该方法首先利用实例相关性的潜在表示构造伪标签矩阵,并将其与线性映射和最小化伪标签与真实标签之间的Friedman范数距离相结合,从而保证伪标签与真实标签之间具有较高的相似性.其次,利用伪标签的低维流形结构构建动态图,以缓解固定图矩阵导致的随迭代深度增加计算误差的问题.在12个数据集上与7种先进方法的对比实验结果表明,该方法的整体分类性能优于现有先进方法,能较好地处理多标记特征选择问题. 展开更多
关键词 多标签学习 特征选择 潜在表示 动态图 流形学习
下载PDF
基于特征选择的LightGBM算法预测钠离子电池剩余寿命
10
作者 史永胜 翟欣然 +1 位作者 栾飞 胡玙珺 《陕西科技大学学报》 北大核心 2024年第2期174-181,共8页
钠离子电池剩余使用寿命(RUL)的准确预测对于可再生能源系统中的大规模储能设备具有重要意义.提出了一种基于特征选择的LightGBM方法来预测钠离子电池的剩余使用寿命.通过结合Pearson相关系数和灰色关联度,选择了四个与电池寿命高度相... 钠离子电池剩余使用寿命(RUL)的准确预测对于可再生能源系统中的大规模储能设备具有重要意义.提出了一种基于特征选择的LightGBM方法来预测钠离子电池的剩余使用寿命.通过结合Pearson相关系数和灰色关联度,选择了四个与电池寿命高度相关且不同特征之间自相关程度较低的最佳特征.采用LightGBM模型,并结合网格搜索(GridSearchCV)算法对其超参数进行优化,以达到最佳的预测性能.通过钠离子电池数据验证了预测模型的优越性,并与使用GridSearchCV算法的GBRD和RF模型在相同条件下进行比较.结果表明,该方法能够显著加快模型运算速度,并相比传统算法具有更高的可靠性和更好的预测性能,预测的最大MAE、MSE、RMSE分别不超过3.0、17.7、4.2. 展开更多
关键词 钠离子电池 剩余使用寿命 LightGBM 特征选择
下载PDF
基于轻量化特征选择的镜片多尺度缺陷检测系统研究
11
作者 许桢英 杨钰峂 +3 位作者 雷英俊 王匀 武子乾 韩丽玲 《计量学报》 CSCD 北大核心 2024年第6期786-794,共9页
为解决对镜片缺陷识别和定位困难的问题,设计了一种基于轻量化特征选择(LFSN)的镜片多尺度缺陷检测系统。首先通过四步相移栅格光成像系统采集缺陷图像,基于傅里叶变换对图像进行融合以提高图像质量;然后,LFSN使用自动特征层选择结构,... 为解决对镜片缺陷识别和定位困难的问题,设计了一种基于轻量化特征选择(LFSN)的镜片多尺度缺陷检测系统。首先通过四步相移栅格光成像系统采集缺陷图像,基于傅里叶变换对图像进行融合以提高图像质量;然后,LFSN使用自动特征层选择结构,在训练过程中计算无锚框分支损失,获得最优特征层信息,更新参数,从而优化模型对不同缺陷大小信息的学习能力;还使用了深度分离可变卷积,通过双线性插值增加像素点在平面的偏移量,从而提升模型对缺陷形貌的主动学习能力,并一定程度减少模型训练参数量,降低检测时间,同时优化回归定位损失明确各阶段训练任务,利用一次惩罚项指导前期预测框中心距离回归;利用归一化二次项,指导后期预测框大小比例回归,使预测框更接近真实值;最后,通过实验采集镜片缺陷图像,并构建数据集进行对比实验。实验结果表明:识别和定位镜片的缺陷的准确率为96.3%,单幅检测时间为24.9 ms。 展开更多
关键词 光学计量 镜片 缺陷检测 栅格光成像 轻量化特征选择 混合交并比
下载PDF
基于LightGBM-VIF-MIC-SFS的风电机组故障诊断输入特征选择方法
12
作者 马良玉 程东炎 +2 位作者 梁书源 耿妍竹 段新会 《热力发电》 CAS CSCD 北大核心 2024年第1期154-164,共11页
针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有... 针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有特征的重要性计算,确定初步特征空间;其次,根据方差膨胀因子(VIF)和最大信息系数(MIC)构建相关性判别阵,据此评估一次筛选中重要性相近的特征,舍弃相似性高的输入特征;最后,使用序列前向搜索法对特征进行第3次处理,逐个输入前2次特征选择获得的特征,保留能提升系统性能的特征,从而实现最终特征的选取。在完成了模型的建立后,使用风电场真实SCADA系统数据进行性能评估,将所提方法与2种对比算法在6个数据集上进行对比,结果显示所提出的LightGBM-VIF-MIC-SFS相较2种对比特征选择算法有显著优势。对所提方法内部的3个模块进行了消融实验,有效验证了所提特征选取方法内部各个模块的有效性以及基于所提方法得到的最优特征空间的合理性及准确性。 展开更多
关键词 风电机组 特征选择 LightGBM 方差膨胀因子 最大信息系数 序列前向搜索
下载PDF
创伤性颅脑损伤输血预测模型的特征加权选择方法研究
13
作者 刘强 曹磊 +3 位作者 熊伟 吴承高 乐爱平 刘威 《中国数字医学》 2024年第2期84-89,共6页
目的:通过构建的特征加权方法筛选出最佳特征子集,构建创伤性颅脑损伤输血机器学习预测模型。方法:通过对临床输血多维数据的异常值与缺失值处理、特征方差与相关性系数计算、特征评分归一化与特征分数加权相加和基于相关性的特征选择(C... 目的:通过构建的特征加权方法筛选出最佳特征子集,构建创伤性颅脑损伤输血机器学习预测模型。方法:通过对临床输血多维数据的异常值与缺失值处理、特征方差与相关性系数计算、特征评分归一化与特征分数加权相加和基于相关性的特征选择(CFS),建立单病种输血大数据的特征加权选择方法,并筛选出最佳特征子集,采用XGBoost算法模型验证特征子集的应用性能。结果:本研究建立了创伤性颅脑损伤输血大数据的特征加权选择方法,通过对医院3579例颅脑创伤患者临床输血大数据纳入的46个特征进行筛选,最终纳入16个特征作为最佳特征子集。XGBoost算法模型预测结果显示特征加权选择的特征子集构建的模型的准确率、ROC曲线下面积、召回率和F1值均高于卡方算法、随机森林和逻辑回归特征选择。结论:特征加权选择方法可有效提取临床输血多维数据中的重要特征,可提升临床输血模型预测准确性,为构建输血预测机器学习模型和人工智能开发提供支持。 展开更多
关键词 创伤性颅脑损伤 临床输血 预测模型 特征选择
下载PDF
融合对比学习和特征选择的入侵检测模型
14
作者 陈虹 程明佳 +2 位作者 金海波 武聪 姜朝议 《信息安全研究》 CSCD 北大核心 2024年第5期453-461,共9页
入侵检测系统可以主动识别恶意流量,是保护网络安全的重要工具.针对网络流量中存在的冗余特征以及现有的入侵检测算法在特征选择过程中存在的不足,提出一种融合对比学习和特征选择的入侵检测模型(contrastive learning and feature sele... 入侵检测系统可以主动识别恶意流量,是保护网络安全的重要工具.针对网络流量中存在的冗余特征以及现有的入侵检测算法在特征选择过程中存在的不足,提出一种融合对比学习和特征选择的入侵检测模型(contrastive learning and feature selection,CL-FS).利用皮尔逊相关系数(Pearson correlation coefficient,PCCs)对预处理后的网络流量进行相关性分析,过滤掉相似特征;使用自编码器(autoencoder,AE)进行深度特征提取,在提取阶段融入对比学习,减少类间相似性,将提取的新特征和过滤后的特征融合,得到表征能力更强的特征集;利用改进的鸽群算法进行包裹特征选择,根据贝叶斯分类器的性能选择最优特征子集,提高分类精度.在NSL-KDD,UNSW-NB15这2个数据集的实验结果表明,CL-FS模型可以提升分类精度并减少处理时间,在2个数据集上的2分类实验准确率分别为90.45%和88.52%,分类处理时间大约减少为原来的一半. 展开更多
关键词 对比学习 皮尔逊相关系数 鸽群算法 特征提取 特征选择
下载PDF
面向特征选择任务的改进蜣螂优化算法
15
作者 李珺 徐秦 《电子测量技术》 北大核心 2024年第1期79-86,共8页
蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:... 蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:精英初始化种群策略、灰狼蜣螂融合策略、运行加速策略,进一步提高蜣螂优化算法在特征选择任务上的性能,并给出了算法整体的伪代码。实验结果表明,比较其他改进型启发式算法,蜣螂灰狼融合优化算法在12个分类数据集中能够得到更高精度、更低维度的特征子集,同时兼备收敛速度、运行速度更快的优点。 展开更多
关键词 特征选择 蜣螂优化算法 分类
下载PDF
基于生物入侵的特征选择算法
16
作者 张健 张博 《计算机工程》 CAS CSCD 北大核心 2024年第9期46-53,共8页
在自然界中,生物入侵以其发展的迅速和巨大的生态影响而受到关注,所引入种群对合适栖息地的寻找过程往往有其内在的逻辑,种群之间的交流和种群的扩张也在这个过程中起到了重要作用。通过探究种群对适宜栖息地的寻找原理,提出一种基于生... 在自然界中,生物入侵以其发展的迅速和巨大的生态影响而受到关注,所引入种群对合适栖息地的寻找过程往往有其内在的逻辑,种群之间的交流和种群的扩张也在这个过程中起到了重要作用。通过探究种群对适宜栖息地的寻找原理,提出一种基于生物入侵的特征选择(BIAFS)算法。在BIAFS算法中,生物入侵过程分为种群建立、种群迁移、种群交流和扩张、种群发展4个阶段。在实验验证过程中,在9个数据集上将BIAFS算法与8种高性能算法进行实验比较。实验结果显示,BIAFS算法在7个数据集上的分类准确率(CA)和降维(DR)率均超过了对比算法。此外,适应度标准偏差的比较实验也证实了BIAFS算法的高稳定性,表明其在多个数据集上能更加稳健地寻找最优解。上述实验结果证明了BIAFS算法在特征选择任务中的有效性和优越性。 展开更多
关键词 生物入侵 特征选择 入侵动态 差分进化 精英策略
下载PDF
二进制鼠群优化算法的特征选择及数据分类
17
作者 鲍美英 申晋祥 《计算机与数字工程》 2024年第6期1612-1616,1675,共6页
针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,... 针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,对特征进行有效的降维并减少数据分类的错误率。在UCI的10个数据集上进行测试,并与遗传算法、粒子群算法、樽海鞘群算法和正余弦算法进行比较,实验结果表明,所提算法能够提高数据分类准确率并有效降低特征维度,算法具有较好的收敛性和鲁棒性。 展开更多
关键词 鼠群优化算法 特征选择 数据分类 K近邻
下载PDF
进化计算在大规模高维特征选择中的应用综述
18
作者 叶志伟 王巧 +3 位作者 周雯 王明威 蔡婷 何其祎 《北方工业大学学报》 2024年第2期8-19,共12页
随着大数据时代的到来,数据的规模和特征维度呈现爆炸式增长,这给数据处理带来了前所未有的挑战。特征选择作为数据预处理的关键环节,在处理大规模高维数据时显得尤为重要。而进化计算方法因其出色的全局搜索能力和高效的优化性能,越来... 随着大数据时代的到来,数据的规模和特征维度呈现爆炸式增长,这给数据处理带来了前所未有的挑战。特征选择作为数据预处理的关键环节,在处理大规模高维数据时显得尤为重要。而进化计算方法因其出色的全局搜索能力和高效的优化性能,越来越多的研究者开始对其进行研究,其在大规模高维特征选择中得到了广泛的应用。本文首先介绍了大规模高维数据处理的重要性;然后简单介绍了部分经典和较新的进化计算方法,并详细介绍了其在大规模高维特征选择中的应用情况;最后对目前进化计算在大规模高维特征选择中存在的问题进行总结,并展望了其未来的发展方向。 展开更多
关键词 特征选择 进化计算 全局搜索 数据预处理 机器学习
下载PDF
采用动态相关度权重的特征选择算法
19
作者 许华杰 刘冠霆 +1 位作者 张品 秦远卓 《计算机工程与应用》 CSCD 北大核心 2024年第4期89-98,共10页
基于互信息的特征选择算法在考虑候选特征提供的新分类信息时,通常忽略了候选特征的加入会使得已选特征和类标签的相关性发生变化而带来额外的新增信息量,以及在计算冗余信息时采用累加求和的形式可能导致低估候选特征的冗余程度。针对... 基于互信息的特征选择算法在考虑候选特征提供的新分类信息时,通常忽略了候选特征的加入会使得已选特征和类标签的相关性发生变化而带来额外的新增信息量,以及在计算冗余信息时采用累加求和的形式可能导致低估候选特征的冗余程度。针对以上问题,提出动态相关度权重的定义,以更全面地考虑候选特征带来的新信息量成分;提出改进冗余项的定义,采用取最大值和归一化策略,以解决传统算法存在的低估冗余问题;在此基础上提出一种采用动态相关度权重的特征选择算法(feature selection using dynamic relevance weight,FSDRW)。选取五种当前主流的基于互信息的过滤式特征选择算法进行对比实验,在来自加州大学尔湾分校UCI和亚利桑那州立大学ASU的机器学习测试数据集上的实验表明,所提出的算法在分类准确率及综合性能方面具有较好的表现。最后将所提出算法应用于广西某水库工程的微震、爆破信号识别中,算法选取出的特征用于微震信号识别可达到98.86%的分类准确率,验证了算法在实际应用中的有效性。 展开更多
关键词 特征选择 互信息 信息熵 动态相关度权重
下载PDF
深圳市土地出让区位选择空间特征及影响因素研究
20
作者 赵良仕 戴振威 《辽宁师范大学学报(自然科学版)》 CAS 2024年第2期251-259,共9页
以深圳市2007—2022年的2908宗土地出让地块为样本,采用GIS空间分析、数据统计分析等方法对深圳土地出让区位选择空间特征与影响因素进行了研究.研究结果表明:(1)土地出让数量最多的是龙岗及宝安区,土地出让收入最高的是南山及宝安区,... 以深圳市2007—2022年的2908宗土地出让地块为样本,采用GIS空间分析、数据统计分析等方法对深圳土地出让区位选择空间特征与影响因素进行了研究.研究结果表明:(1)土地出让数量最多的是龙岗及宝安区,土地出让收入最高的是南山及宝安区,最少的都是盐田区,土地出让数量和收入总体上都呈稳中有升的趋势.(2)深圳商服、住宅、工矿仓储和总用地的出让均呈显著集聚模式.(3)总用地出让热点区分布较均衡,冷点区在东南部较多.商服用地热点区高度集聚于西南部的都市核心区.住宅用地热点区分布相对均衡,且在深圳中部的热度明显超过另两类用地.工矿仓储用地热点区集聚于北部边缘地区.(4)总用地出让的核密度在西南部及东北部高,东南部低,呈多中心多层次点状集聚的空间特征.商服用地高密度区集聚于西南部,呈大规模连片分布单中心集聚的空间特征.住宅用地高密度区分布较均衡,呈多中心多层次点状集聚的空间特征.工矿仓储用地高密度区主要位于北部,且临近深莞、深惠交界处,呈多中心点状集聚的空间特征.(5)土地出让区位选择模式是商服用地高度集聚于前海等城市新中心,工矿仓储用地主要位于北部城市边缘地区,住宅用地夹于另两类用地之间的同时也与商服、工矿仓储用地混合分布.(6)土地出让区位选择受到交通、地形、经济与人口规模、城市化和土地利用与城市规划等多方面的综合影响. 展开更多
关键词 土地出让 区位选择 空间特征 影响因素 深圳市
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部