期刊文献+
共找到2,311篇文章
< 1 2 116 >
每页显示 20 50 100
二进制鼠群优化算法的特征选择及数据分类
1
作者 鲍美英 申晋祥 《计算机与数字工程》 2024年第6期1612-1616,1675,共6页
针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,... 针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,对特征进行有效的降维并减少数据分类的错误率。在UCI的10个数据集上进行测试,并与遗传算法、粒子群算法、樽海鞘群算法和正余弦算法进行比较,实验结果表明,所提算法能够提高数据分类准确率并有效降低特征维度,算法具有较好的收敛性和鲁棒性。 展开更多
关键词 鼠群优化算法 特征选择 数据分类 K近邻
下载PDF
一种基于FKPCA和AHP的房屋安全大数据特征选择与分类算法
2
作者 尹帮治 田桂丰 +1 位作者 鄢创辉 谭宓 《信息记录材料》 2024年第5期239-242,共4页
快速核主成分分析算法(fast kernel principal component analysis,FKPCA)和层次分析法(analytic hierarchy process,AHP)在房屋安全大数据分析中可以检测异常、预测故障、优化决策等,提供房屋安全管理和风险控制的支持。本文首先针对... 快速核主成分分析算法(fast kernel principal component analysis,FKPCA)和层次分析法(analytic hierarchy process,AHP)在房屋安全大数据分析中可以检测异常、预测故障、优化决策等,提供房屋安全管理和风险控制的支持。本文首先针对房屋安全大数据特征选择与分类问题,提出一种基于快速FKPCA与AHP的算法。其次,通过FKPCA对大数据进行降维,使用AHP方法进行特征权重计算,从而筛选出与房屋安全密切相关的特征,最后,用选定的特征进行优化分析。该算法通过特征选择性能评价和分类模型性能评价两方面进行评估,以提升分类模型的性能和准确性。 展开更多
关键词 房屋安全大数据 特征选择 特征分类 FKPCA AHP
下载PDF
基于CFS-GA特征选择算法的中文网页自动分类 被引量:2
3
作者 喻春萍 黄晓霞 《上海海事大学学报》 北大核心 2012年第1期77-81,共5页
为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色... 为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色体进行二进制编码;利用CFS启发值作为GA的适应度函数对个体进行评价;CFS值越大的个体遗传到下一代的概率越大.结合GA的全局搜索特性,该算法可保证所得特征子集是全局最优的.利用weka平台,对搜狗实验室提供的中文网页数据集进行实验.结果表明,该算法能有效降低特征空间的维度、提高分类精度。 展开更多
关键词 中文网页分类 特征选择 基于关联的特征选择算法 遗传算法
下载PDF
基于邻域粗糙集的多标记分类特征选择算法 被引量:109
4
作者 段洁 胡清华 +2 位作者 张灵均 钱宇华 李德玉 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期56-65,共10页
多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法... 多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法以应对维数灾难问题,但对于多标记的属性约简和特征选择却鲜有研究.将粗糙集应用于多标记数据的特征选择中,针对多标记分类任务,重新定义了邻域粗糙集的下近似和依赖度计算方法,探讨了这一模型的性质,进而构造了基于邻域粗糙集的多标记分类任务的特征选择算法,并给出了在公开数据上的实验结果.实验分析证明算法的有效性. 展开更多
关键词 多标记分类 特征选择 邻域粗糙集 依赖度
下载PDF
文本分类中基于基尼指数的特征选择算法研究 被引量:38
5
作者 尚文倩 黄厚宽 +3 位作者 刘玉玲 林永民 瞿有利 董红斌 《计算机研究与发展》 EI CSCD 北大核心 2006年第10期1688-1694,共7页
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的... 随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的特征空间对于大多数分类器来说是难以忍受的,因此采用适当的文本特征选择算法降低原始文本特征空间的维数成为文本分类的首要任务.目前也有很多的文本特征选择算法,介绍了另一种新的基于基尼指数的文本特征选择算法,使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的特征选择评估函数.实验表明,基于基尼指数的文本特征选择能进一步提高分类性能,而且计算复杂度小. 展开更多
关键词 文本分类 文本特征选择 基尼指数 文本预处理
下载PDF
基于条件互信息特征选择法和Adaboost算法的电能质量复合扰动分类 被引量:19
6
作者 李长松 刘凯 +1 位作者 肖先勇 金耘岭 《高电压技术》 EI CAS CSCD 北大核心 2019年第2期579-585,共7页
为准备识别复杂电能质量扰动类型,提出一种基于条件互信息平均最优化(avg-CMIM)特征选择法与Adaboost动态集成分类器的电能质量复合扰动分类策略。首先基于条件互信息,提出准确衡量特征与扰动类别相关性、特征集内部目标导向冗余性的评... 为准备识别复杂电能质量扰动类型,提出一种基于条件互信息平均最优化(avg-CMIM)特征选择法与Adaboost动态集成分类器的电能质量复合扰动分类策略。首先基于条件互信息,提出准确衡量特征与扰动类别相关性、特征集内部目标导向冗余性的评价准则,得到不同扰动标签相匹配的最优分类特征集。再利用Adaboost分类器进行动态增强学习,对未知样本进行标签识别,通过组合标签结果确定复合扰动的组成成分,实现电能质量复合扰动的识别。仿真结果表明,在不同程度噪音下,该方法能够高效准确地识别电压暂升、电压暂降、电压短时中断、谐波、脉冲暂态和振荡暂态等单一扰动和其组合成的复合扰动,并通过实测数据验证了方法的正确性和可行性。 展开更多
关键词 电能质量 复合扰动分类 特征选择 条件互信息 ADABOOST算法
下载PDF
一种改进的文本网页分类特征选择方法 被引量:8
7
作者 李粤 李星 +1 位作者 刘辉 许静芳 《计算机应用》 CSCD 北大核心 2004年第7期119-121,共3页
网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本... 网页分类是网络信息检索研究的关键技术之一。文中针对分类技术中的特征选择方法展开研究。在分析、比较常用的文本分类特征选择方法基础上 ,提出了一种联合特征选择方法。该方法将已有的X2 统计方法和互信息方法综合起来 ,在标准文本网页数据集分类实验中 ,综合查全率和查准率得到明显的提高。该选择方法已应用于“网络指南针” 展开更多
关键词 文本网页分类 特征选择 X^2统计量 互信息量 联合特征选择
下载PDF
基于分类间隔的特征选择算法 被引量:14
8
作者 任双桥 傅耀文 +1 位作者 黎湘 庄钊文 《软件学报》 EI CSCD 北大核心 2008年第4期842-850,共9页
对于二类目标特征选择问题,首先讨论了特征空间的线性可分性问题,并给出了其判别条件;其次,通过借鉴支撑矢量机原理,分析了特征可分性判据的基本性质;最后,依据各特征对分类间隔的贡献大小定义了特征有效率,并以此进行特征选择和特征空... 对于二类目标特征选择问题,首先讨论了特征空间的线性可分性问题,并给出了其判别条件;其次,通过借鉴支撑矢量机原理,分析了特征可分性判据的基本性质;最后,依据各特征对分类间隔的贡献大小定义了特征有效率,并以此进行特征选择和特征空间降维.实测数据与网络公开UCI(University of california,Irvine)数据库的实验结果表明,与经典的Relief特征选择算法相比,该算法在识别性能和推广能力上明显有所提高. 展开更多
关键词 特征选择 有效率 分类间隔 支撑矢量机
下载PDF
中文文本分类中的特征选择算法研究 被引量:47
9
作者 胡佳妮 徐蔚然 +1 位作者 郭军 邓伟洪 《光通信研究》 北大核心 2005年第3期44-46,共3页
比较了文档频率、信息增益、互信息、X2统计量、期望交叉熵、文本证据权以及几率比等7种常用于文本分类的特征选择算法。实验采用国家"八六三计划"中文文本语料库和Rocchio分类器对以上的特征选择算法分别进行评估,测评结果表... 比较了文档频率、信息增益、互信息、X2统计量、期望交叉熵、文本证据权以及几率比等7种常用于文本分类的特征选择算法。实验采用国家"八六三计划"中文文本语料库和Rocchio分类器对以上的特征选择算法分别进行评估,测评结果表明,几率比法的性能优于其它特征选择算法。 展开更多
关键词 文本分类 特征选择 评价函数
下载PDF
一种基于PSO同步进行特征选择及参数优化的核K近邻分类算法 被引量:5
10
作者 任江涛 姚树宇 纪庆革 《小型微型计算机系统》 CSCD 北大核心 2007年第8期1461-1464,共4页
特征选择及分类器参数优化是提高分类器性能的两个重要方面,传统上这两个问题是分开解决的.近年来,随着进化优化计算技术在模式识别领域的广泛应用,编码上的灵活性使得特征选择及参数的同步优化成为一种可能和趋势.为了解决此问题,本文... 特征选择及分类器参数优化是提高分类器性能的两个重要方面,传统上这两个问题是分开解决的.近年来,随着进化优化计算技术在模式识别领域的广泛应用,编码上的灵活性使得特征选择及参数的同步优化成为一种可能和趋势.为了解决此问题,本文研究采用二进制PSO算法进行特征选择及核K近邻分类器参数的同步优化.实验表明,该方法可有效地找出合适的特征子集及核函数参数,并取得较好的分类效果. 展开更多
关键词 特征选择 分类器参数 同步优化 粒子群算法 核K近邻算法
下载PDF
视频语义分类特征选择算法 被引量:5
11
作者 魏维 赵学龙 +1 位作者 刘凤玉 许满武 《系统仿真学报》 EI CAS CSCD 北大核心 2006年第5期1143-1146,共4页
提出一种将连续特征数字量化后进行特征选择的算法(ABFSA)。利用样本集中的先验信息选择出特征值域中最具类间区分意义的区域,将其作为完整量化区间。采用向后式的启发搜索策略,搜索合并后能使贝叶斯分类错误率降低的相邻量化区间。合... 提出一种将连续特征数字量化后进行特征选择的算法(ABFSA)。利用样本集中的先验信息选择出特征值域中最具类间区分意义的区域,将其作为完整量化区间。采用向后式的启发搜索策略,搜索合并后能使贝叶斯分类错误率降低的相邻量化区间。合并搜索得到的两相邻量化区间,量化的级数降低一阶。重复搜索和合并过程,直至贝叶斯分类错误率不再降低为止。所有特征搜索、合并完成后,总的特征量化阶数得到大幅降低。用UCI仿真数据集及真实视频数据进行实验,对比结果表明该算法能有效选取视频语义概念分类的重要特征,其综合性能较优。 展开更多
关键词 特征选择 特征量化 贝叶斯分类错误率 视频语义概念
下载PDF
基于可调品质因子小波变换和随机森林特征选择算法的电能质量复合扰动分类 被引量:33
12
作者 杨晓梅 郭林明 +1 位作者 肖先勇 张家宁 《电网技术》 EI CSCD 北大核心 2020年第8期3014-3020,共7页
针对电能质量复合扰动分类的复杂性,提出了基于可调品质因子小波变换(tunableQ-factorwavelettransform,TQWT)和随机森林特征选择算法的电能质量复合扰动分类方法。首先利用TQWT分解扰动信号,以减弱扰动分量间的耦合性,并使用提出的筛... 针对电能质量复合扰动分类的复杂性,提出了基于可调品质因子小波变换(tunableQ-factorwavelettransform,TQWT)和随机森林特征选择算法的电能质量复合扰动分类方法。首先利用TQWT分解扰动信号,以减弱扰动分量间的耦合性,并使用提出的筛选方法选取最优子带并提取时域和频域特征;然后基于随机森林算法计算特征重要性,通过序列前向选择法去掉不相关特征和冗余特征,得到对应每种扰动标签的最优特征集;最后训练生成随机森林多标签分类模型,根据输出标签的组合得到扰动类别。仿真数据实验表明,该方法能够准确高效识别23类扰动,且抗噪能力强,提高了含暂降、含中断的复合扰动的分类准确率。并以实测数据实验证明了方法的可行性。 展开更多
关键词 电能质量 复合扰动分类 可调品质因子小波变换 特征选择 随机森林
下载PDF
基于多级区域选择与跨层特征融合的野生菌分类
13
作者 李俊仪 李向阳 +3 位作者 龙朝勋 李海燕 李红松 余鹏飞 《计算机工程》 CAS CSCD 北大核心 2024年第9期179-188,共10页
近年来误食有毒野生菌导致的中毒事件频发,严重危害人们的身体健康,这使得准确鉴别野生菌变得尤为重要。然而,现有的野生菌分类算法在处理背景噪声大、类间差异小和类内差异大的图片时容易出现识别错误的问题。为了解决这一问题,提出一... 近年来误食有毒野生菌导致的中毒事件频发,严重危害人们的身体健康,这使得准确鉴别野生菌变得尤为重要。然而,现有的野生菌分类算法在处理背景噪声大、类间差异小和类内差异大的图片时容易出现识别错误的问题。为了解决这一问题,提出一种基于Vision Transformer(ViT)架构结合多级区域选择和跨层特征融合的野生菌分类算法。该算法旨在捕获具有强鉴别力的特征,以确保网络能够聚焦在主要信息上,并提高分类的准确性。首先采用ViT作为网络框架,以提取野生菌图像的特征和全局上下文信息。其次设计多头自注意力选择模块,用于提取具有鉴别力的token,并通过自适应分配算法为不同层级的编码层确定抽取token的数量。最后为进一步提升分类性能,引入跨层特征融合策略和标签平滑损失进行拟合训练,从而减少细节信息的丢失。为使网络对野生菌图像特征的学习更具针对性,自建野生菌数据集。实验结果表明,所提出的算法与基线算法相比,分类精度有了显著提高,准确率达到98.65%。 展开更多
关键词 图像分类 Vision Transformer架构 特征选择 自适应分配 特征融合 标签平滑
下载PDF
文本分类中信息增益特征选择算法的改进 被引量:14
14
作者 郭颂 马飞 《计算机应用与软件》 CSCD 北大核心 2013年第8期139-142,共4页
特征选择算法对文本分类系统的精确度有很大影响,传统的信息增益特征选择算法通常会导致在指定类别中很少出现而在其他类别中频繁出现的特征被选择出来。为克服这一缺陷,在对传统算法和相关改进算法深入分析的基础上,引入特征分布差异... 特征选择算法对文本分类系统的精确度有很大影响,传统的信息增益特征选择算法通常会导致在指定类别中很少出现而在其他类别中频繁出现的特征被选择出来。为克服这一缺陷,在对传统算法和相关改进算法深入分析的基础上,引入特征分布差异因子、类内和类间加权因子的改进思路,提出一种基于特征分布加权的信息增益改进算法,并分别采用朴素贝叶斯和支持向量机两种分类算法进行实验。实验结果表明,该算法优于其他改进算法。 展开更多
关键词 文本分类 特征选择 信息增益 特征分布加权
下载PDF
文本分类中互信息特征选择方法的研究与算法改进 被引量:15
15
作者 辛竹 周亚建 《计算机应用》 CSCD 北大核心 2013年第A02期116-118,152,共4页
在深入研究传统互信息特征选择方法的基础上,详细分析了该算法分类精确度不高的原因。针对传统互信息算法中的负相关现象以及倾向于选择低频特征词的问题,提出一种基于互信息的特征优化选择方法。该方法在综合考虑频度、集中度、分散度... 在深入研究传统互信息特征选择方法的基础上,详细分析了该算法分类精确度不高的原因。针对传统互信息算法中的负相关现象以及倾向于选择低频特征词的问题,提出一种基于互信息的特征优化选择方法。该方法在综合考虑频度、集中度、分散度等因素的基础上,通过引入三个调整参数,有效地保证了负相关特征在文本分类中不可忽视的作用,并且提高了高频词汇的选择比重。实验表明,改进的方法可以有效地提高文本分类精度,并且具有更好的稳定性。 展开更多
关键词 文本分类 互信息 特征选择 负相关 频度
下载PDF
数据流分类中的增量特征选择算法 被引量:5
16
作者 李敏 王勇 蔡立军 《计算机应用》 CSCD 北大核心 2010年第9期2321-2323,2328,共4页
概念流动的出现及数据的高维性增加了数据流特征选择的复杂性。信息增益是最有效的特征选择算法之一,但计算量大。对信息增益做了等价替换,提出一种基于改进信息增益的混合增量特征选择(IFS)算法。该算法首先利用与分类器无关的评价函... 概念流动的出现及数据的高维性增加了数据流特征选择的复杂性。信息增益是最有效的特征选择算法之一,但计算量大。对信息增益做了等价替换,提出一种基于改进信息增益的混合增量特征选择(IFS)算法。该算法首先利用与分类器无关的评价函数选出候选特征集合,然后将分类器作用于候选特征集合,利用分类精度作为评价标准去选择特征子集,在遇到概念漂移时重新选择特征子集。通过在超平面数据集和UCI数据集上的实验,表明基于IFS算法的分类器能够很快地适应概念漂移,并且比基于全部特征的分类算法有更高的精度。 展开更多
关键词 数据流分类 信息增益 增量特征选择 概念漂移
下载PDF
多粒度特征关联的分层分类谱特征选择 被引量:1
17
作者 胡敏杰 石杰 +1 位作者 张阳 林肖莹 《闽南师范大学学报(自然科学版)》 2024年第2期8-19,共12页
利用类别的层次信息解决一个特征子集难区分所有类别的问题,同时将特征间的统计相关性引进谱特征选择解决单个特征区分力问题,据此提出基于多粒度特征关联的分层分类谱特征选择算法.该算法首先对样本按类别层次结构自下而上聚合粒化,形... 利用类别的层次信息解决一个特征子集难区分所有类别的问题,同时将特征间的统计相关性引进谱特征选择解决单个特征区分力问题,据此提出基于多粒度特征关联的分层分类谱特征选择算法.该算法首先对样本按类别层次结构自下而上聚合粒化,形成多粒度分层任务集;然后对子任务中的特征空间利用谱图理论设计异类样本间的相似矩阵并构建目标函数迭代地排序出特征关联重要度.最后,在5个数据集上通过该算法与4种基于传统的及3种新颖的分层特征选择算法相比,文中算法具有有效性,尤其是获取少量的特征. 展开更多
关键词 特征关联 特征选择 分层分类 多粒度 谱分析
下载PDF
分类问题的一种可伸缩特征选择算法 被引量:3
18
作者 张巍 邹翔 吴晓如 《计算机学报》 EI CSCD 北大核心 2005年第7期1223-1229,共7页
特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算法StaFSOS,并证明了在类别数为2时,SCD测度满足分支界限法的单... 特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算法StaFSOS,并证明了在类别数为2时,SCD测度满足分支界限法的单调性;给出了StaFSOS的一个完备形式———BBStaFS.在12个标准数据集中,StaFSOS算法得出的结果和目标集几乎一致,而StaFSOS的效率高于其它算法;而在另1个中,BBStaFS算法得出了准确结果.在用1000个样本20个特征的真实数据进行的测试中,StaFSOS运行时间是目前较快的GRSR的1/2,得出的特征集准确有效. 展开更多
关键词 数据挖掘 分类 特征选择
下载PDF
一种基于分类互补性的特征选择算法 被引量:5
19
作者 李立斌 李宁 杨育彬 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第5期486-494,共9页
针对特征选择中Filter与Wrapper方法分别存在的问题,本文提出了一种新的基于分类互补性分析的特征选择算法.该方法将Filter方法与Wrapper方法结合起来.先根据ReliefF评估和对称不确定性评估去除不相关特征,再使用对称不确定性评估去除... 针对特征选择中Filter与Wrapper方法分别存在的问题,本文提出了一种新的基于分类互补性分析的特征选择算法.该方法将Filter方法与Wrapper方法结合起来.先根据ReliefF评估和对称不确定性评估去除不相关特征,再使用对称不确定性评估去除冗余特征,最后使用基于分类互补性分析的Wrapper特征选择算法选出最后的目标子集.实验表明该算法结合了Filter与Wrapper两者的优点,具备了高准确性,同时可以减少时间开销.文章最后在数字乳腺图像肿块的检测中应用了该算法,得到了良好的效果. 展开更多
关键词 特征选择 FILTER WRAPPER 相关性ReliefF 对称不确定性 分类互补性
下载PDF
基于特征选择的Bagging分类算法研究 被引量:8
20
作者 姚明海 赵连朋 刘维学 《计算机技术与发展》 2014年第4期103-106,共4页
为了提高数据的分类性能,提出了一种基于特征选择的Bagging分类算法。通过Fisher准则和互信息的方法给定一种能够直接评价特征区分度和与类别相关性的评价方法,重新构造了计算特征区分度和与类别相关性的计算公式。并将该方法应用到Bagg... 为了提高数据的分类性能,提出了一种基于特征选择的Bagging分类算法。通过Fisher准则和互信息的方法给定一种能够直接评价特征区分度和与类别相关性的评价方法,重新构造了计算特征区分度和与类别相关性的计算公式。并将该方法应用到Bagging分类算法当中。实现了算法迭代过程中的特征选择,使得每个基分类器都是由不同的特征子集训练所得,保证了基分类器的独立性,降低了训练误差。通过理论分析和大量的实验,对文中的方法与经典特征选择方法进行了比较,实验结果显示文中的方法能够得到更高的预测精准度。 展开更多
关键词 数据挖掘 特征选择 集成学习 互信息 BAGGING 分类
下载PDF
上一页 1 2 116 下一页 到第
使用帮助 返回顶部