期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于GBM的特征选择在心脏病预测中的研究 被引量:2
1
作者 刘云龙 周怡君 罗晨 《现代电子技术》 2023年第19期101-106,共6页
心脏病患者的人数逐年增多,死亡率居高不下,因此许多学者对基于机器学习的患病人群识别方法进行了研究,但由于心脏病数据的特征过多,构建的模型参数较多,往往导致训练时间过长。因此提出一种利用梯度提升机算法(GBM)对已有的特征选择算... 心脏病患者的人数逐年增多,死亡率居高不下,因此许多学者对基于机器学习的患病人群识别方法进行了研究,但由于心脏病数据的特征过多,构建的模型参数较多,往往导致训练时间过长。因此提出一种利用梯度提升机算法(GBM)对已有的特征选择算法进行改进,在通过减少特征数量实现缩短训练时间的同时,对心脏病患者的预测准确率也得到了提升。首先,采用遗传算法(GA)和基于相关性的特征选择(CFS)进行特征降维,并选出备选特征子集;其次,提出利用GBM实现对模型预测无关特征的筛除;最后,采用支持向量机(SVM)和K近邻算法(KNN)进行准确率预测。实验表明:当预测模型为SVM时,GBM对GA和CFS的综合评价指标的提升分别达到了9.89%和2.2%;当预测模型为KNN时,GBM对GA和CFS的综合评价指标的提升分别达到了7.7%和2.2%,并且GA+GBM在SVM上的表现最好,达到了84.62%,能够有效地提升医疗诊断的效率。 展开更多
关键词 特征选择 遗传算法 梯度提升机 支持向量机 cfs KNN 心脏病预测 BOOSTING
下载PDF
基于遗传算法的结肠癌基因选择与样本分类 被引量:2
2
作者 何爱香 《计算机工程与应用》 CSCD 北大核心 2007年第18期242-245,共4页
提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS... 提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS方法选择优秀基因子集,并存档记录这些子集。根据存档子集中基因被选择的频率选择进一步搜索的候选子集,最后以结合了遗传算法和SVM的GA/SVM从候选基因子集中选择分类特征子集。把这种GA/CFS-GA/SVM方法应用到结肠癌微阵列数据,实验结果及与文献的比较表明了该方法效果良好。 展开更多
关键词 遗传算法 支持向量机 cfs 基因表达谱
下载PDF
基于特征子集相关度和偏最小二乘法的特征选择策略 被引量:1
3
作者 刘蕾 杜建强 +5 位作者 朱志鹏 聂斌 罗计根 贺佳 喻芳 余日跃 《江西中医药大学学报》 2019年第2期88-91,124,共5页
在中药方剂的量-效关系分析中,需要寻找药理指标(因变量)受哪些血液指标(自变量)影响。本文提出一种基于特征子集相关度和偏最小二乘法的特征选择策略,利用特征子集相关度对药理指标进行评估预选出特征子集,然后将其放入偏最小二乘法中... 在中药方剂的量-效关系分析中,需要寻找药理指标(因变量)受哪些血液指标(自变量)影响。本文提出一种基于特征子集相关度和偏最小二乘法的特征选择策略,利用特征子集相关度对药理指标进行评估预选出特征子集,然后将其放入偏最小二乘法中进行训练,利用训练后得出的残差平方和评估该特征子集是否可取,并结合顺序前向浮动混合搜索策略与顺序后向浮动混合搜索策略,综合评估以分析药理指标受哪些血液指标的影响。分别采用麻杏石甘汤君药止咳数据集及UCI数据集进行分析处理,实验结果表明该特征选择策略能较好寻找一个较优的特征子集。 展开更多
关键词 特征选择 偏最小二乘法 特征子集相关度 Pearson相关系数 中医药信息
下载PDF
基于机器学习的混合式特征选择算法 被引量:7
4
作者 雷海锐 高秀峰 刘辉 《电子测量技术》 2018年第16期42-46,共5页
针对CFS算法中优先选择数量较多的特征属性的问题,引入了信息增益比和对称不确定性的改进CFS算法。同时,为了进一步降低特征维数,提高分类效率,提出一种基于filter-wrapper模型的混合式特征选择方法,先采用改进后的CFS算法过滤无关特征... 针对CFS算法中优先选择数量较多的特征属性的问题,引入了信息增益比和对称不确定性的改进CFS算法。同时,为了进一步降低特征维数,提高分类效率,提出一种基于filter-wrapper模型的混合式特征选择方法,先采用改进后的CFS算法过滤无关特征;再基于精简子集,采用封装式选择中的序列后向搜索算法,结合决策树选取最优子集。仿真实验表明,采用该方法选择的特征子集具有更好的分类能力,同时发现该方法在不同的分类模型中泛化能力也有着不同的表现。 展开更多
关键词 特征选择 信息增益比 对称不确定性 cfs 决策树
下载PDF
An Efficient Ensemble Model for Various Scale Medical Data
5
作者 Heba A.Elzeheiry Sherief Barakat Amira Rezk 《Computers, Materials & Continua》 SCIE EI 2022年第10期1283-1305,共23页
Electronic Health Records(EHRs)are the digital form of patients’medical reports or records.EHRs facilitate advanced analytics and aid in better decision-making for clinical data.Medical data are very complicated and ... Electronic Health Records(EHRs)are the digital form of patients’medical reports or records.EHRs facilitate advanced analytics and aid in better decision-making for clinical data.Medical data are very complicated and using one classification algorithm to reach good results is difficult.For this reason,we use a combination of classification techniques to reach an efficient and accurate classification model.This model combination is called the Ensemble model.We need to predict new medical data with a high accuracy value in a small processing time.We propose a new ensemble model MDRL which is efficient with different datasets.The MDRL gives the highest accuracy value.It saves the processing time instead of processing four different algorithms sequentially;it executes the four algorithms in parallel.We implement five different algorithms on five variant datasets which are Heart Disease,Health General,Diabetes,Heart Attack,and Covid-19 Datasets.The four algorithms are Random Forest(RF),Decision Tree(DT),Logistic Regression(LR),and Multi-layer Perceptron(MLP).In addition to MDRL(our proposed ensemble model)which includes MLP,DT,RF,and LR together.From our experiments,we conclude that our ensemble model has the best accuracy value for most datasets.We reach that the combination of the Correlation Feature Selection(CFS)algorithm and our ensemble model is the best for giving the highest accuracy value.The accuracy values for our ensemble model based on CFS are 98.86,97.96,100,99.33,and 99.37 for heart disease,health general,Covid-19,heart attack,and diabetes datasets respectively. 展开更多
关键词 Electronic health records(EHRs) Random forest(RF) Decision tree(DT) linear model(LR) Multi-layer Perceptron(MLP) MDRL correlation feature selection(cfs)
下载PDF
特征优选下的全极化雷达影像土地覆盖分类
6
作者 范强 霍畅 +1 位作者 张兵 张继超 《测绘科学》 CSCD 北大核心 2023年第8期102-110,共9页
针对极化合成孔径雷达(PolSAR)影像在土地覆盖分类中存在特征利用不充分导致分类精度低的问题,该文提出一种联合ReliefF和相关性的特征选择(CFS)算法的分类方法。首先利用ReliefF算法对极化特征进行特征重要性排序,淘汰无关特征,然后利... 针对极化合成孔径雷达(PolSAR)影像在土地覆盖分类中存在特征利用不充分导致分类精度低的问题,该文提出一种联合ReliefF和相关性的特征选择(CFS)算法的分类方法。首先利用ReliefF算法对极化特征进行特征重要性排序,淘汰无关特征,然后利用CFS算法进行特征优选,最后结合分类回归树(CART)决策树构建分类模型,完成土地覆盖分类。以高分三号(GF-3)两个场景的影像数据进行实验,结果表明,该方法能够有效剔除冗余特征,显著提高分类准确率,适用于PolSAR影像土地覆盖分类。 展开更多
关键词 极化合成孔径雷达 特征选择 RELIEFF算法 cfs算法 土地覆盖分类 CART决策树
原文传递
一种特征选择的全极化雷达影像分类方法 被引量:3
7
作者 张继超 刘宁 +1 位作者 宋伟东 李建飞 《测绘科学》 CSCD 北大核心 2022年第6期127-134,共8页
针对极化合成孔径雷达(PolSAR)影像面向对象分类过程中存在数据冗余、特征维数高导致分类精度降低的问题,该文提出了一种基于信息增益比和基于相关性的特征选择(CFS)算法的分类方法。该方法首先在经典的过滤式CFS算法基础上,引入信息增... 针对极化合成孔径雷达(PolSAR)影像面向对象分类过程中存在数据冗余、特征维数高导致分类精度降低的问题,该文提出了一种基于信息增益比和基于相关性的特征选择(CFS)算法的分类方法。该方法首先在经典的过滤式CFS算法基础上,引入信息增益比评估模型舍弃贡献小的特征。然后采用目前流行的封装式分类回归树(CART)算法做进一步筛选并分类。最后以GF-3不同场景和成像时间的影像数据为例进行实验,将该方法与信息增益比评估模型优化特征集、CFS算法优化特征集、全部特征集的CART分类结果进行对比。结果表明,该方法各项精度评价指标均优于其他对比方法,验证了该方法在PolSAR影像面向对象分类领域的可行性。 展开更多
关键词 极化分解 特征选择 信息增益比 cfs算法 CART分类 POLSAR
原文传递
Hybrid immunizing solution for job recommender system 被引量:3
8
作者 Shaha AL-OTAIBI Mourad YKHLEF 《Frontiers of Computer Science》 SCIE EI CSCD 2017年第3期511-527,共17页
Two traditional recommendation techniques, content-based and collaborative filtering (CF), have been widely used in a broad range of domain areas. Both meth- ods have their advantages and disadvantages, and some of ... Two traditional recommendation techniques, content-based and collaborative filtering (CF), have been widely used in a broad range of domain areas. Both meth- ods have their advantages and disadvantages, and some of the defects can be resolved by integrating both techniques in a hybrid model to improve the quality of the recommendation. In this article, we will present a problem-oriented approach to design a hybrid immunizing solution for job recommen- dation problem from applicant's perspective. The proposed approach aims to recommend the best chances of opening jobs to the applicant who searches for job. It combines the artificial immune system (AIS), which has a powerful explo- ration capability in polynomial time, with the collaborative filtering, which can exploit the neighbors' interests. We will discuss the design issues, as well as the hybridization process that should be applied to the problem. Finally, experimental studies are conducted and the results show the importance of our approach for solving the job recommendation problem. 展开更多
关键词 CONTENT-BASED collaborative filtering cf hy- bridization computational intelligence (CI) artificial im- mune system (AIS) clonal selection correlation-based simi- larity
原文传递
Dielectric spectroscopy coupled with artificial neural network for classification and quantification of sesame oil adulteration
9
作者 Mahmoud Soltani Firouz Mahmoud Omid +1 位作者 Mehrdad Babaei Mahdi Rashvand 《Information Processing in Agriculture》 EI 2022年第2期233-242,共10页
Adulteration using cheap vegetable oils into expensive oils such as sesame oil is a considerable challenge in the edible oil market. To discriminate pure and adulterated sesame oilwith sunflower and canola oils (commo... Adulteration using cheap vegetable oils into expensive oils such as sesame oil is a considerable challenge in the edible oil market. To discriminate pure and adulterated sesame oilwith sunflower and canola oils (commonly used as an adulterant to the high-price oils),dielectric spectroscopy was applied in the range of 40 kHz–20 MHz. The principal component analysis (PCA) plots were able to distinguish the pure sesame oil, while it was impossible to separate the adulterated oils based on the kind of adulteration. The correlationbased feature selection (CFS) method was used to select the more relevant dielectric datawithin the spectrum and to reduce the dimensionality of the input vector belongs to theartificial neural network (ANN). The ANN classifier with topology of 19-5-4 structureshowed a perfect accuracy of 100% in detecting the authentic and the adulterated sesameoil. The regression ANN with the topology of 15-5-1, 21-8-1 and 10-11-1 were the mostrobust models in quantifying the amount of adulteration in sesame oil generated by sun-flower oil, canola oil and sunflower + canola oils, with R2Test of 1, 1 and 0.999 9, respectively.The proposed technique is a powerful and simple method to detect and quantify adulteration of sesame oil. The novelty of this research is capability of used system for authentication of adulterated sesame oil using low frequency. Furthermore, the developed systemhas a good capability for other types of sesame oil adulterations as well as to detect adulteration in other expensive edible oils. 展开更多
关键词 ADULTERATION Artificial neural network CHEMOMETRICS Sesame oil correlation-based feature selection Principal component analysis
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部