期刊文献+
共找到2,303篇文章
< 1 2 116 >
每页显示 20 50 100
一种基于FKPCA和AHP的房屋安全大数据特征选择与分类算法
1
作者 尹帮治 田桂丰 +1 位作者 鄢创辉 谭宓 《信息记录材料》 2024年第5期239-242,共4页
快速核主成分分析算法(fast kernel principal component analysis,FKPCA)和层次分析法(analytic hierarchy process,AHP)在房屋安全大数据分析中可以检测异常、预测故障、优化决策等,提供房屋安全管理和风险控制的支持。本文首先针对... 快速核主成分分析算法(fast kernel principal component analysis,FKPCA)和层次分析法(analytic hierarchy process,AHP)在房屋安全大数据分析中可以检测异常、预测故障、优化决策等,提供房屋安全管理和风险控制的支持。本文首先针对房屋安全大数据特征选择与分类问题,提出一种基于快速FKPCA与AHP的算法。其次,通过FKPCA对大数据进行降维,使用AHP方法进行特征权重计算,从而筛选出与房屋安全密切相关的特征,最后,用选定的特征进行优化分析。该算法通过特征选择性能评价和分类模型性能评价两方面进行评估,以提升分类模型的性能和准确性。 展开更多
关键词 房屋安全大数据 特征选择 特征分类 FKPCA AHP
下载PDF
基于集成特征选择的中小微企业信贷风险分类模型研究 被引量:1
2
作者 路佳佳 王国兰 《中央民族大学学报(自然科学版)》 2024年第1期61-67,共7页
文章以客户违约率作为中小微企业信用风险的评价标准,尝试构造基于集成特征选择的中小微企业信用风险分类模型,结合互信息矩阵、基于k折交叉验证的随机森林和支持向量机对模型进行分析。研究表明企业的信誉等级、销项有效率和最高销项... 文章以客户违约率作为中小微企业信用风险的评价标准,尝试构造基于集成特征选择的中小微企业信用风险分类模型,结合互信息矩阵、基于k折交叉验证的随机森林和支持向量机对模型进行分析。研究表明企业的信誉等级、销项有效率和最高销项对信用风险有显著影响,其他因素对信用风险的影响不显著,实验说明基于k折交叉验证的支持向量机具有可靠的信贷风险预测能力,对中小微企业信用风险评估有较强的参考价值。 展开更多
关键词 集成特征选择 分类模型 支持向量机 信贷风险
下载PDF
基于模糊粗糙集的层次分类增量特征选择
3
作者 田秧 折延宏 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第3期561-571,共11页
随着大数据时代的到来,数据的类标签数量急剧增加,对现有的分类任务带来了严峻的挑战。为了解决这个问题,人们通常将标签组织成层次结构,使用结构中所包含的信息来对任务进行学习。考虑样本的不断增加,使用模糊粗糙集信息熵设计了一种... 随着大数据时代的到来,数据的类标签数量急剧增加,对现有的分类任务带来了严峻的挑战。为了解决这个问题,人们通常将标签组织成层次结构,使用结构中所包含的信息来对任务进行学习。考虑样本的不断增加,使用模糊粗糙集信息熵设计了一种面向层次分类的增量特征选择算法。考虑兄弟策略,将现有的λ条件熵推广到了层次分类的情形,设计了一种非增量的层次分类特征选择算法,设计了λ增量条件熵,基于此设计了增量版本的特征选择算法。在实验中,采用了包括非增量版本在内的7种不同的特征选择算法在5个层次数据集上与增量算法进行比较,实验结果验证了2种算法的有效性,并且所设计的增量算法能在不影响性能的情况下加快特征选择的进程。 展开更多
关键词 模糊粗糙集 特征选择 层次分类 增量学习
下载PDF
基于特征交互的层次分类在线流特征选择
4
作者 孔令蔚 蔡林晟 +1 位作者 林少杰 林耀进 《南京师范大学学报(工程技术版)》 CAS 2024年第2期34-42,共9页
在开放动态环境下的分类学习任务中,数据特征空间具有动态性,标记空间存在层次化结构.现有的层次分类在线流特征选择算法可以选择较优的特征子集,但这些算法忽略了特征之间存在的交互作用.基于此,提出了一种基于特征交互的层次分类在线... 在开放动态环境下的分类学习任务中,数据特征空间具有动态性,标记空间存在层次化结构.现有的层次分类在线流特征选择算法可以选择较优的特征子集,但这些算法忽略了特征之间存在的交互作用.基于此,提出了一种基于特征交互的层次分类在线流特征选择算法.首先,设计了一种基于层次邻域依赖度去判断特征交互的计算方法;其次,针对层次化结构数据,根据层次结构中不同节点间的兄弟关系定义邻域粗糙集模型;最后,设计了具有在线重要性分析、在线冗余性分析以及在线交互性分析的层次分类在线流框架,用于选择强相关和存在交互作用的特征子集.在6个层次数据集上的实验验证了所提算法具有较优的综合性能. 展开更多
关键词 在线流特征选择 层次分类 特征交互 兄弟策略 邻域粗糙集
下载PDF
多粒度特征关联的分层分类谱特征选择
5
作者 胡敏杰 石杰 +1 位作者 张阳 林肖莹 《闽南师范大学学报(自然科学版)》 2024年第2期8-19,共12页
利用类别的层次信息解决一个特征子集难区分所有类别的问题,同时将特征间的统计相关性引进谱特征选择解决单个特征区分力问题,据此提出基于多粒度特征关联的分层分类谱特征选择算法.该算法首先对样本按类别层次结构自下而上聚合粒化,形... 利用类别的层次信息解决一个特征子集难区分所有类别的问题,同时将特征间的统计相关性引进谱特征选择解决单个特征区分力问题,据此提出基于多粒度特征关联的分层分类谱特征选择算法.该算法首先对样本按类别层次结构自下而上聚合粒化,形成多粒度分层任务集;然后对子任务中的特征空间利用谱图理论设计异类样本间的相似矩阵并构建目标函数迭代地排序出特征关联重要度.最后,在5个数据集上通过该算法与4种基于传统的及3种新颖的分层特征选择算法相比,文中算法具有有效性,尤其是获取少量的特征. 展开更多
关键词 特征关联 特征选择 分层分类 多粒度 谱分析
下载PDF
结合特征选择的抗噪声网络流分类
6
作者 陈山杉 董育宁 《智能计算机与应用》 2024年第4期238-243,共6页
在现代网络管理中,网络环境愈加复杂,网络流噪声已经成为不可忽视的因素,然而现有的抗噪声流分类方法在实际效果上仍有不尽人意之处。针对这一问题,本文提出了一种结合特征选择的抗噪声网络流分类方法NNTC-FS,该方法采用投票机制判定噪... 在现代网络管理中,网络环境愈加复杂,网络流噪声已经成为不可忽视的因素,然而现有的抗噪声流分类方法在实际效果上仍有不尽人意之处。针对这一问题,本文提出了一种结合特征选择的抗噪声网络流分类方法NNTC-FS,该方法采用投票机制判定噪声并搭建级联结构,实现先过滤再分类的线上任务。在公共数据集上的实验表明,NNTC-FS能实现90%以上的分类正确率,并在分类精度和时间性能上优于文献方法。 展开更多
关键词 网络流分类 抗噪声 投票 特征选择 级联模型
下载PDF
基于特征选择和模糊类支持度的模糊分类关联规则挖掘算法 被引量:2
7
作者 王子恒 李鹏 陈静 《软件》 2023年第8期15-22,共8页
模糊分类关联规则(Fuzzy Classification Association Rules,FCAR)是一种特殊的模糊关联规则,挖掘FCAR对于构建基于规则的分类模型至关重要。传统关联规则挖掘算法挖掘FCAR时可能会包含较多冗余规则,并且在数据集类别不平衡时,挖掘到的... 模糊分类关联规则(Fuzzy Classification Association Rules,FCAR)是一种特殊的模糊关联规则,挖掘FCAR对于构建基于规则的分类模型至关重要。传统关联规则挖掘算法挖掘FCAR时可能会包含较多冗余规则,并且在数据集类别不平衡时,挖掘到的小类规则的数量会急剧减少甚至降为0。为解决上述问题,提出了一种基于特征选择和模糊类支持度-模糊提升度框架(Fuzzy Category Support-Fuzzy Lift Framework,FCS-FLF)的FCAR挖掘算法FSFCS Based FCARMiner(Feature Selection and Fuzzy Category Support-Fuzzy Lift Framework Based FCAR-Miner),基于模糊隶属度矩阵迭代挖掘FCAR。在多个类别不平衡的数据集上的实验结果表明,相比其他算法FSFCS Based FCAR-Miner算法能够避免大量冗余规则的生成,同时也能适应数据类别不平衡的情况,不会出现各类规则数量相差悬殊的情况。 展开更多
关键词 模糊分类关联规则挖掘 特征选择 类别不平衡数据 模糊类支持度
下载PDF
面向特征选择任务的改进蜣螂优化算法
8
作者 李珺 徐秦 《电子测量技术》 北大核心 2024年第1期79-86,共8页
蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:... 蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:精英初始化种群策略、灰狼蜣螂融合策略、运行加速策略,进一步提高蜣螂优化算法在特征选择任务上的性能,并给出了算法整体的伪代码。实验结果表明,比较其他改进型启发式算法,蜣螂灰狼融合优化算法在12个分类数据集中能够得到更高精度、更低维度的特征子集,同时兼备收敛速度、运行速度更快的优点。 展开更多
关键词 特征选择 蜣螂优化算法 分类
下载PDF
融合概率类别特征增强的短文本分类
9
作者 廖列法 李奎 姚秀 《计算机工程与设计》 北大核心 2024年第7期2074-2081,共8页
对短文本所含信息量缺乏而导致分类准确度难以提升的问题进行研究,提出一种融合概率类别特征增强的短文本分类网络模型FT_BDCNN。将N-gram处理后产生的N元词典通过TF-IDF分离出具有概率类别区分度的特征信息(FT模块);将向量化表示后的... 对短文本所含信息量缺乏而导致分类准确度难以提升的问题进行研究,提出一种融合概率类别特征增强的短文本分类网络模型FT_BDCNN。将N-gram处理后产生的N元词典通过TF-IDF分离出具有概率类别区分度的特征信息(FT模块);将向量化表示后的文本信息输入到改进后的特征提取模块中;将两个模块的输出进行特征融合,完成文本分类。实验结果表明,所提模型在THUCNews数据集上的F1值达到91.91%。FT模块可以与现有分类模型进行融合,提升模型的分类性能。 展开更多
关键词 类别特征增强 短文本 双池化 特征融合 统计算法 快速分类 深度学习
下载PDF
基于稀疏矩阵结构的特征选择算法现状研究
10
作者 钟静 方冰 朱江 《信息网络安全》 CSCD 北大核心 2024年第3期352-362,共11页
在信息时代,数据获取方式简单快捷,使得数据量呈指数型增长。然而这些数据往往是多源高维的,增加了模型的复杂度,容易造成模型过拟合,并且数据中存在的冗余特征会降低模型分类精度。特征选择算法旨在通过去除不相关、冗余或嘈杂的特征,... 在信息时代,数据获取方式简单快捷,使得数据量呈指数型增长。然而这些数据往往是多源高维的,增加了模型的复杂度,容易造成模型过拟合,并且数据中存在的冗余特征会降低模型分类精度。特征选择算法旨在通过去除不相关、冗余或嘈杂的特征,从原始特征中选择一小部分最有效特征,达到降维的效果。目前特征选择算法种类繁多,其中,基于稀疏矩阵结构的特征选择算法由于具有模型简单易懂和易求解的特点而被学者们广泛关注。本文归纳总结了基于稀疏矩阵结构的特征选择算法分类,重点介绍了鲁棒特征选择模型和多视图特征选择模型。首先,介绍了基于稀疏矩阵结构的特征选择算法基本框架;然后,介绍了基于稀疏矩阵结构的一般模型、鲁棒特征选择模型、多视图的特征选择模型,比较了它们在解决目前特征选择算法研究难点中存在的优势和不足;最后,对基于稀疏矩阵结构的特征选择算法进行了总结。文章阐明了理论研究中存在的问题和难点,探讨了基于稀疏矩阵结构的特征选择算法发展思路。 展开更多
关键词 稀疏矩阵结构 特征选择 降维 分类
下载PDF
基于SA-PSO算法优化CNN的电能质量扰动分类模型
11
作者 肖白 李道明 +2 位作者 穆钢 高文瑞 董光德 《电力自动化设备》 EI CSCD 北大核心 2024年第5期185-190,共6页
针对传统电能质量扰动分类模型中扰动特征复杂、识别步骤繁琐的问题,提出了一种通过模拟退火(SA)算法与粒子群优化(PSO)算法相结合来优化卷积神经网络(CNN)的电能质量扰动分类模型。将CNN卷积层中的二维卷积核替换成一维卷积核;采用SA... 针对传统电能质量扰动分类模型中扰动特征复杂、识别步骤繁琐的问题,提出了一种通过模拟退火(SA)算法与粒子群优化(PSO)算法相结合来优化卷积神经网络(CNN)的电能质量扰动分类模型。将CNN卷积层中的二维卷积核替换成一维卷积核;采用SA算法对PSO算法进行改进,规避PSO算法陷入局部最优的困境;采用改进后的PSO算法对CNN进行参数寻优;利用优化CNN提取和筛选合适的特征,根据这些特征利用分类器得到最终分类结果。通过算例分析得出,使用基于SA-PSO算法优化的CNN的电能质量扰动分类模型能精确地识别出电能质量扰动信号。 展开更多
关键词 电能质量 扰动分类 卷积神经网络 粒子群优化算法 模拟退火算法 特征提取
下载PDF
利用基因组标记和机器学习算法对中国牛品种的分类准确性研究
12
作者 梁卉 王雪 +1 位作者 司敬方 张毅 《遗传》 CAS CSCD 北大核心 2024年第7期530-539,共10页
品种分类是畜禽品种遗传资源保护和利用的基础,传统分类方法主要依赖于体型外貌特征判断,但因分类指标不易量化,故难以区分相似度较高的品种。机器学习算法在利用基因组信息进行品种分类方面显示出独特优势。为了探索最适合于中国牛品... 品种分类是畜禽品种遗传资源保护和利用的基础,传统分类方法主要依赖于体型外貌特征判断,但因分类指标不易量化,故难以区分相似度较高的品种。机器学习算法在利用基因组信息进行品种分类方面显示出独特优势。为了探索最适合于中国牛品种的分类方法,本研究使用7个地方品种共213头牛的基因组SNP数据,对比了F_(ST)值排序筛选、mRMR、Relief-F三种SNP选择方法和随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、朴素贝叶斯(Naive Byes,NB)三种不同机器学习算法对品种分类准确性的影响。结果表明:1)使用F_(ST)方法筛选1500个以上SNP,或使用mRMR算法筛选1000个以上SNP,SVM分类算法可以达到99.47%以上的分类准确率;2)分类效果最好的算法是SVM算法,其次是NB算法,而最好的SNP选择方法是F_(ST)和mRMR算法,其次是Relief-F;3)品种错误归类情况常出现在相似性较高的品种间。本研究显示机器学习分类模型结合基因组数据是对牛地方品种鉴别的有效方法,为我国牛品种的快速准确分类提供了技术依据。 展开更多
关键词 机器学习 品种分类 特征选择 支持向量机 F_(ST)
下载PDF
改进遗传算法嵌入经典分类算法实现润滑油添加剂微小量多种类同步识别
13
作者 夏延秋 谢培元 +2 位作者 NAY MIN AUNG 张涛 冯欣 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第3期744-750,共7页
在润滑油中加入微少量添加剂就能使润滑油获得某种新的特性或改善润滑油中已有的某些特性的性质。针对机械设备润滑油中微小量添加剂多种类识别问题,基于python语言进行模型建立,采用基础油PAO-10和三种商用润滑油添加剂T321、 T534、 T... 在润滑油中加入微少量添加剂就能使润滑油获得某种新的特性或改善润滑油中已有的某些特性的性质。针对机械设备润滑油中微小量添加剂多种类识别问题,基于python语言进行模型建立,采用基础油PAO-10和三种商用润滑油添加剂T321、 T534、 T307按照不同比例配制了8种不同样本。采用Thermo Scientific Nicolet iS5型傅里叶变换红外光谱仪采集了样本4 000~400 cm^(-1)范围附近的中红外光谱信息,并对样本中红外光谱数据采用Min-Max归一化进行预处理。使用两种经典分类算法,包括一对多支持向量机(OVR SVMs)、随机森林(RF),嵌入遗传算法(GA)实现中红外光谱特征波段筛选。为避免GA收敛过快和易陷入局部最优解,对GA的选择算子进行了改进,形成基于局部搜索算子的遗传算法(LGA),从而建立多类别分类模型的构建方法。结果显示:嵌入GA筛选波段后的新模型的种类识别准确率从利用经典分类算法对原始波长数据的OVR SVMs(83.33%)、 RF(87.50%)提升至OVR SVMs+GA(100%)、 RF+GA(100%);而嵌入LGA的新模型在保持原模型高准确率的情况下,RF+LGA筛选得到的特征区间长度为原光谱数据长度的36.7%,并且与添加剂物质的红外吸收峰有很好的对应情况。新模型不仅适用于只含单一添加剂的情况,对含有两种及两种以上添加剂的同步识别仍然具有近100%的较高识别率。表明所构建模型可以有效实现微小量润滑油添加剂的快速、准确、多种类同步识别。 展开更多
关键词 润滑油添加剂 中红外光谱 经典分类算法 改进遗传算法 特征波段筛选
下载PDF
基于CFS-GA特征选择算法的中文网页自动分类 被引量:2
14
作者 喻春萍 黄晓霞 《上海海事大学学报》 北大核心 2012年第1期77-81,共5页
为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色... 为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色体进行二进制编码;利用CFS启发值作为GA的适应度函数对个体进行评价;CFS值越大的个体遗传到下一代的概率越大.结合GA的全局搜索特性,该算法可保证所得特征子集是全局最优的.利用weka平台,对搜狗实验室提供的中文网页数据集进行实验.结果表明,该算法能有效降低特征空间的维度、提高分类精度。 展开更多
关键词 中文网页分类 特征选择 基于关联的特征选择算法 遗传算法
下载PDF
特征优选的GF-1影像植被遥感精细分类研究
15
作者 葛俊勇 葛俊涛 刘朝霞 《测绘标准化》 2024年第1期42-47,共6页
植被精细化分类对掌握不同植被在维护生态环境安全中的作用具有重要意义。本文选择国产高分一号(GF-1)卫星影像,构建该影像下的基于光谱、纹理、植被指数的多特征空间,并选择ReliefF算法与CFS算法进行特征筛选,最后结合随机森林算法与li... 植被精细化分类对掌握不同植被在维护生态环境安全中的作用具有重要意义。本文选择国产高分一号(GF-1)卫星影像,构建该影像下的基于光谱、纹理、植被指数的多特征空间,并选择ReliefF算法与CFS算法进行特征筛选,最后结合随机森林算法与libsvm模型,研究特征选择对分类精度的影响,并获取植被精细化分类的最佳多特征分类算法模型。结果表明,特征选择能在一定程度上提高分类精度;CFS算法相较于ReliefF算法能更好地简化特征子集的维度,并获取能提高分类精度的更优子集;基于CFS-libsvm的植被精细化分类方法具有较高的分类精度。 展开更多
关键词 植被精细化分类 RELIEFF算法 CFS算法 特征优选
下载PDF
最大相关和最大差异的高维数据特征选择算法
16
作者 孟圣洁 于万钧 陈颖 《计算机应用》 CSCD 北大核心 2024年第3期767-771,共5页
针对高维数据存在冗余信息且维度过高的问题,提出基于信息量的最大相关最大差异特征选择算法(MCD)。首先,利用互信息(MI)度量特征和标签之间的相关性,对特征进行排序,选择互信息最大的特征加入特征子集;然后,引入信息距离度量特征之间... 针对高维数据存在冗余信息且维度过高的问题,提出基于信息量的最大相关最大差异特征选择算法(MCD)。首先,利用互信息(MI)度量特征和标签之间的相关性,对特征进行排序,选择互信息最大的特征加入特征子集;然后,引入信息距离度量特征之间的信息冗余性及差异性,设计评价准则对每个特征进行评价,使特征子集中特征和标签的相关性、特征之间的差异性最大;最后,用前向搜索策略结合评价准则进行属性约简,最优化特征子集。采用2种不同的分类器,在6个数据集上和mRMR(minimal-Redundancy-Maximal-Relevance criterion)、RReliefF等5个经典算法进行对比实验,利用分类精度验证MCD的有效性。在支持向量机(SVM)分类器下,平均分类精度提高了5.67~23.80个百分点;在K-近邻(KNN)分类器下,平均分类精度提高了2.69~25.18个百分点。可见,MCD在绝大多数情况下,能有效去除冗余特征,分类精度有明显提高。 展开更多
关键词 特征选择 高维数据 特征冗余 相关性 分类准确率 降维
下载PDF
基于遗传算法优化支持向量机的船舰目标识别分类
17
作者 杨永平 《舰船科学技术》 北大核心 2024年第4期174-178,共5页
为了实现有效的海上监管和响应,提高舰船监管效率,降低人力成本,提出基于遗传算法优化支持向量机的舰船目标识别分类方法。以HU矩为舰船目标的特征描述子,在舰船目标图像内,提取具备旋转、尺度与平移不变性的舰船目标特征矩;利用遗传算... 为了实现有效的海上监管和响应,提高舰船监管效率,降低人力成本,提出基于遗传算法优化支持向量机的舰船目标识别分类方法。以HU矩为舰船目标的特征描述子,在舰船目标图像内,提取具备旋转、尺度与平移不变性的舰船目标特征矩;利用遗传算法,优化支持向量机的惩罚因子与核参数;在参数优化后的支持向量机内,输入舰船目标特征矩样本,输出舰船目标识别分类结果。实验证明,该方法可有效提取舰船目标特征矩;经过参数优化后的支持向量机,可有效降低计算复杂度,加快检测目标识别分类效率,具备较优的舰船目标识别分类性能。该方法均可精准识别分类舰船目标。 展开更多
关键词 遗传算法 支持向量机 舰船目标 识别分类 HU矩 特征描述子
下载PDF
基于脑结构特征和认知行为特征的阿尔茨海默症分类诊断
18
作者 温森森 陈玉龙 +1 位作者 王瑜 霍京京 《应用数学进展》 2024年第7期3052-3064,共13页
阿尔茨海默症是一种多发于老年人的神经退行性疾病,由于病程不可逆且无法治愈,因而及时发现该病早期阶段并采取针对性的治疗措施具有重要意义。本文基于脑结构特征和认知行为特征,辅以人口统计学特征和生物标志物,对阿尔茨海默症进行三... 阿尔茨海默症是一种多发于老年人的神经退行性疾病,由于病程不可逆且无法治愈,因而及时发现该病早期阶段并采取针对性的治疗措施具有重要意义。本文基于脑结构特征和认知行为特征,辅以人口统计学特征和生物标志物,对阿尔茨海默症进行三分类和五分类诊断。将数据进行预处理后,采用随机森林对特征重要性进行排序,依据排序结果和各特征组合在机器学习模型中的表现,分别选取出15个、21个特征,用于训练随机森林、梯度提升树、CatBoost、LightGBM、XGBoost等机器学习模型。结果显示,LightGBM和XGBoost分别在阿尔茨海默症的三分类和五分类诊断中表现出优异性能,分类准确率分别为99.25%和95.94%,F1-分数分别为99.25%和95.92%。经过五折交叉验证可知,上述模型的性能和稳定性都比较出色。最后,对比两次诊断选取出的特征,为今后阿尔茨海默症的诊断提出部分建议。 展开更多
关键词 阿尔茨海默症 特征选择 机器学习 分类诊断
下载PDF
基于邻域粗糙集的多标记分类特征选择算法 被引量:109
19
作者 段洁 胡清华 +2 位作者 张灵均 钱宇华 李德玉 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期56-65,共10页
多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法... 多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法以应对维数灾难问题,但对于多标记的属性约简和特征选择却鲜有研究.将粗糙集应用于多标记数据的特征选择中,针对多标记分类任务,重新定义了邻域粗糙集的下近似和依赖度计算方法,探讨了这一模型的性质,进而构造了基于邻域粗糙集的多标记分类任务的特征选择算法,并给出了在公开数据上的实验结果.实验分析证明算法的有效性. 展开更多
关键词 多标记分类 特征选择 邻域粗糙集 依赖度
下载PDF
文本分类中基于基尼指数的特征选择算法研究 被引量:38
20
作者 尚文倩 黄厚宽 +3 位作者 刘玉玲 林永民 瞿有利 董红斌 《计算机研究与发展》 EI CSCD 北大核心 2006年第10期1688-1694,共7页
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的... 随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文档数据的关键技术.对于采用矢量空间模型(VSM)的大多数分类器来说,文本预处理成为分类的瓶颈,高维的特征空间对于大多数分类器来说是难以忍受的,因此采用适当的文本特征选择算法降低原始文本特征空间的维数成为文本分类的首要任务.目前也有很多的文本特征选择算法,介绍了另一种新的基于基尼指数的文本特征选择算法,使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的特征选择评估函数.实验表明,基于基尼指数的文本特征选择能进一步提高分类性能,而且计算复杂度小. 展开更多
关键词 文本分类 文本特征选择 基尼指数 文本预处理
下载PDF
上一页 1 2 116 下一页 到第
使用帮助 返回顶部