期刊文献+
共找到144篇文章
< 1 2 8 >
每页显示 20 50 100
Parameter selection of support vector machine for function approximation based on chaos optimization 被引量:18
1
作者 Yuan Xiaofang Wang Yaonan 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第1期191-197,共7页
The support vector machine (SVM) is a novel machine learning method, which has the ability to approximate nonlinear functions with arbitrary accuracy. Setting parameters well is very crucial for SVM learning results... The support vector machine (SVM) is a novel machine learning method, which has the ability to approximate nonlinear functions with arbitrary accuracy. Setting parameters well is very crucial for SVM learning results and generalization ability, and now there is no systematic, general method for parameter selection. In this article, the SVM parameter selection for function approximation is regarded as a compound optimization problem and a mutative scale chaos optimization algorithm is employed to search for optimal paraxneter values. The chaos optimization algorithm is an effective way for global optimal and the mutative scale chaos algorithm could improve the search efficiency and accuracy. Several simulation examples show the sensitivity of the SVM parameters and demonstrate the superiority of this proposed method for nonlinear function approximation. 展开更多
关键词 learning systems support vector machines (SVM) approximation theory parameter selection optimization.
下载PDF
A Hybrid Approach for Selection in Service Community 被引量:1
2
作者 TANG Chaogang 《China Communications》 SCIE CSCD 2014年第A01期114-120,共7页
Although there have been existing competitions among web service (WS) providers, they still have opportunities to cooperate together for common profits. WS community as a mean to provide an ontological organizati... Although there have been existing competitions among web service (WS) providers, they still have opportunities to cooperate together for common profits. WS community as a mean to provide an ontological organization of WSs that share the same domain of interest has realized this kind of fancy in the sense that providers can work together to compete against others outside the community. Service selection in WS community is different from the traditional service selection, since WS community should take into account its own benefits. Therefore, we propose a hybrid approach to make service selection in WS community. The approach considers the profits of both WS community and the services within it. The experimental evaluation shows that the approach has a great advantage over other approach without consideration of community's benefits. 展开更多
关键词 COMMUNITY service selection PROFITS dominating top-k
下载PDF
基于IT2F-BWM-MABAC方法的应急物流设施选址方案评价 被引量:1
3
作者 周青超 叶春明 耿秀丽 《中国安全科学学报》 CAS CSCD 北大核心 2024年第4期226-231,共6页
针对不确定环境下应急物流设施选址方案评价问题,提出一种基于区间二型模糊集(IT2F)-最优最劣法(BWM)-多属性边界近似区域比较法(MABAC)的应急物流设施选址方案评价方法。首先,针对应急物流设施选址方案评价过程中评价信息的模糊不确定... 针对不确定环境下应急物流设施选址方案评价问题,提出一种基于区间二型模糊集(IT2F)-最优最劣法(BWM)-多属性边界近似区域比较法(MABAC)的应急物流设施选址方案评价方法。首先,针对应急物流设施选址方案评价过程中评价信息的模糊不确定性问题,采用IT2F处理,并利用MABAC对选址方案排序;然后,针对传统的MABAC中属性权重需要从外部获得的问题,采用基于IT2F的BWM确定属性的权重;最后,将所提方法应用于某城市应急物流设施选址方案评价研究,并验证所提选址方法的可行性和有效性。结果表明:所提方法能够解决不确定环境下应急物流设施选址问题,同时能够保证方案评价的质量。 展开更多
关键词 区间二型模糊集(IT2F) 最优最劣法(BWM) 多属性边界近似区域比较法(MABAC) 应急物流设施选址 方案评价
下载PDF
融合Lasso的近似马尔科夫毯特征选择方法
4
作者 刘明 杜建强 +3 位作者 李郅琴 罗计根 聂斌 张梦婷 《计算机工程与应用》 CSCD 北大核心 2024年第8期121-130,共10页
在特征选择问题中,近似马尔科夫毯常用于判断冗余特征,但所得到的冗余特征并不完全相同,因此,在直接使用近似马尔科夫毯删除冗余特征时,存在可能导致信息丢失的情况,影响模型精度。为此,提出一种用于中药代谢组学高维小样本数据的融合La... 在特征选择问题中,近似马尔科夫毯常用于判断冗余特征,但所得到的冗余特征并不完全相同,因此,在直接使用近似马尔科夫毯删除冗余特征时,存在可能导致信息丢失的情况,影响模型精度。为此,提出一种用于中药代谢组学高维小样本数据的融合Lasso的近似马尔科夫毯特征选择方法。方法分为两个阶段,第一阶段,通过最大信息系数对特征的相关度分析过滤无关特征;第二阶段,采用近似马尔科夫毯构建相似特征组,使用Lasso评估相似特征组中特征影响力,迭代去除冗余特征。通过实验对比表明,该算法可以在一定程度上减少有用信息丢失,去除无关特征和冗余特征,提高模型精度和稳定性。 展开更多
关键词 近似马尔科夫毯 Lasso 特征选择 高维小样本 中医药信息
下载PDF
结合语义相似度分析的Web数据库Top-K典型化查询方法 被引量:4
5
作者 孟祥福 张霄雁 +1 位作者 唐延欢 毕崇春 《小型微型计算机系统》 CSCD 北大核心 2016年第8期1692-1696,共5页
当前的Web数据库查询系统返回的top-k个查询结果之间在内容上通常非常相似,而现实中用户希望看到彼此有一定差异且具有代表性的查询结果.提出一种基于元组之间语义相似度的top-k典型化查询方法,该方法在离线阶段首先根据属性值的关联信... 当前的Web数据库查询系统返回的top-k个查询结果之间在内容上通常非常相似,而现实中用户希望看到彼此有一定差异且具有代表性的查询结果.提出一种基于元组之间语义相似度的top-k典型化查询方法,该方法在离线阶段首先根据属性值的关联信息评估不同属性值之间的耦合关系;然后根据属性值之间的耦合关系,评估不同元组之间的语义相似度.当查询到来时,根据结果元组之间的语义距离,利用概率密度估计方法评估每个元组的典型程度,然后利用top-k近似选取算法从中获取top-k个典型元组返回给用户.实验结果与分析表明,提出的元组典型程度分析方法具有较高的用户满意度,提出的top-k典型元组近似选取方法具有较高的准确性和执行效率,能够有效适用于大规模查询结果集的top-k典型化查询. 展开更多
关键词 WEB数据库 耦合关系 高斯核函数 典型程度分析 top-k近似选取
下载PDF
基于博弈论赋权的改进物元可拓机型选择模型
6
作者 叶燊 乐美龙 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第4期476-484,共9页
为科学合理地对各主流民航机型进行综合评价,并为航空公司飞机选型提供一定参考,提出了基于博弈论组合赋权的改进物元可拓机型选择模型.从航空公司、局方、旅客及社会角度出发,以经济性、技术性、舒适性及环境性4个方面,构建机型选择综... 为科学合理地对各主流民航机型进行综合评价,并为航空公司飞机选型提供一定参考,提出了基于博弈论组合赋权的改进物元可拓机型选择模型.从航空公司、局方、旅客及社会角度出发,以经济性、技术性、舒适性及环境性4个方面,构建机型选择综合评价指标体系.将改进层次分析法得出的主观权重与熵权法得出的客观权重运用博弈论的思想进行组合得到综合权重.采用改进物元可拓模型对机型选择综合评价指标体系进行实际评估,并与逼近理想解排序法、模糊综合评价法的结果以及实际机型订单数进行对比.研究结果表明,构建的指标体系能够准确真实地反映某机型的综合等级水平,并且该模型评估结果更为准确更贴近实际情况,具有准确性与实用性. 展开更多
关键词 机型选择 评价指标体系 博弈论组合赋权 改进物元可拓模型 逼近理想解排序法 模糊综合评价法
下载PDF
多阶段均值—标准差投资组合时间一致性策略研究
7
作者 张鹏 崔淑琳 《华南师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期91-99,共9页
文章运用标准差度量投资组合的风险,考虑交易成本、借贷约束和阈值约束等情况,提出了具有Vasicek随机利率和风险偏好的多阶段均值-标准差投资组合模型(V-M-SD)。基于博弈论的方法,将该模型转化为时间一致的动态优化问题,并使用离散近似... 文章运用标准差度量投资组合的风险,考虑交易成本、借贷约束和阈值约束等情况,提出了具有Vasicek随机利率和风险偏好的多阶段均值-标准差投资组合模型(V-M-SD)。基于博弈论的方法,将该模型转化为时间一致的动态优化问题,并使用离散近似迭代法求解满足时间一致性的最优投资组合。最后,实证分析借贷约束、阈值约束和风险规避系数对V-M-SD模型的最优时间一致性策略的影响。研究发现,当其他约束条件保持不变时,在一定的阈值范围内,投资组合的终期财富分别与借贷约束、阈值约束、风险规避系数正相关、正相关、负相关;投资组合的单位风险水平分别与借贷约束、阈值约束、风险规避系数负相关、负相关、正相关。 展开更多
关键词 多阶段投资组合 均值-标准差 时间一致性策略 Vasicek随机利率 离散近似迭代法
下载PDF
基于信息熵变权区间组合和边界逼近的短期光伏功率区间预测 被引量:2
8
作者 杨国清 李建基 +2 位作者 王德意 张凯 刘菁 《太阳能学报》 EI CAS CSCD 北大核心 2023年第2期381-390,共10页
针对现有的区间预测在满足高覆盖率的同时区间宽度存在过宽的问题,提出一种基于信息熵变权区间组合和边界逼近的短期光伏功率区间预测方法。首先,对历史天气数据特征进行特征重组,并基于套索交叉的递归特征消除(LassoCV-RFE)算法对重组... 针对现有的区间预测在满足高覆盖率的同时区间宽度存在过宽的问题,提出一种基于信息熵变权区间组合和边界逼近的短期光伏功率区间预测方法。首先,对历史天气数据特征进行特征重组,并基于套索交叉的递归特征消除(LassoCV-RFE)算法对重组后的特征进行筛选。然后,采用动态贝叶斯网络模型和基于卷积长短期记忆网络的改进分位数回归模型(CNNLSTM-QH)分别预测光伏出力的置信区间,根据信息熵进行区间变权组合。最后,结合区间覆盖率和区间宽度指标,构建边界逼近函数和惩罚边界,对两个预测结果加权组合后的区间进行边界逼近。仿真结果表明:相比于一般的单一模型方法,所提方法能在95%、90%和85%的置信水平下分别减小21.86%、16.67%和14.93%的平均区间宽度,同时区间覆盖率也能满足对应的置信度要求。 展开更多
关键词 光伏功率 特征选取 自适应权重 组合预测 边界逼近 区间预测
下载PDF
基于样本重叠与近似马尔可夫毯的特征选择算法 被引量:2
9
作者 王大志 季焱晶 +2 位作者 陈彦桦 王洪峰 黄敏 《计算机应用研究》 CSCD 北大核心 2023年第3期725-730,共6页
随着信息技术的快速发展,数据中的高维特征极大地增加了产生冗余特征的可能性,冗余特征不仅导致搜索空间增大,而且影响了分类的准确率。针对现有的特征选择算法难以解决高维特征选择问题,提出了基于样本重叠与近似马尔可夫毯的特征选择... 随着信息技术的快速发展,数据中的高维特征极大地增加了产生冗余特征的可能性,冗余特征不仅导致搜索空间增大,而且影响了分类的准确率。针对现有的特征选择算法难以解决高维特征选择问题,提出了基于样本重叠与近似马尔可夫毯的特征选择算法(samples overlapping based modified Markov blanket, SOMMB)。该算法首先融合最大信息系数与改进强近似马尔可夫毯去除冗余特征;其次采用样本重叠策略指导前向搜索的过程,选取相关特征。该算法在10个公开数据集上与目前流行的PGVNS、FCBF-MIC、CFS、mRMR、RF、CBFS、ReliefF以及FFSG算法进行对比实验,SOMMB算法的平均准确率为82.519%,对比FFSG获得的最高准确率提升了4.214%,表明SOMMB算法可以提高分类精度。 展开更多
关键词 特征选择 最大信息系数 改进强近似马尔可夫毯 样本重叠 前向搜索
下载PDF
基于近似贝叶斯计算的包装件模型选择和参数估计 被引量:1
10
作者 朱大鹏 曹兴潇 《振动与冲击》 EI CSCD 北大核心 2023年第23期253-259,共7页
准确构建包装件模型是进行运输包装安全评价的基础,构建包装件模型包括模型类型选择和模型参数估计。考虑到包装件模型的不确定性和误差,需在贝叶斯推断框架下构建包装件的参数不确定模型,由于在计算似然函数中存在着一系列困难,利用传... 准确构建包装件模型是进行运输包装安全评价的基础,构建包装件模型包括模型类型选择和模型参数估计。考虑到包装件模型的不确定性和误差,需在贝叶斯推断框架下构建包装件的参数不确定模型,由于在计算似然函数中存在着一系列困难,利用传统贝叶斯推断估计模型参数存在着计算效率低,计算误差大的缺点;结合序贯蒙特卡洛和重要性采样,采用近似贝叶斯计算替代传统的贝叶斯推断,该方法可避免似然函数的计算,随着阈值的减小,在多种备选模型中优选出最佳模型,同时模型参数收敛至参数真值附近。对包装件进行随机振动试验,对试验数据进行分析,结果表明,Bouc-Wen模型(n=2)是最佳包装件模型,该模型可准确预测包装件的振动响应。 展开更多
关键词 运输包装 模型选择 包装件模型参数估计 近似贝叶斯计算 序贯蒙特卡洛
下载PDF
一种融合近似马尔科夫毯的随机森林优化算法 被引量:1
11
作者 罗计根 熊玲珠 +3 位作者 杜建强 聂斌 熊旺平 李郅琴 《计算机工程与应用》 CSCD 北大核心 2023年第20期77-84,共8页
特征的相关和冗余,会直接影响随机森林随机抽取特征的质量,导致随机森林的收敛性减弱,降低随机森林模型的准确度、泛化能力及性能。基于此,提出一种融合近似马尔科夫毯的随机森林优化算法,该算法利用近似马尔科夫毯构建相似特征组,再从... 特征的相关和冗余,会直接影响随机森林随机抽取特征的质量,导致随机森林的收敛性减弱,降低随机森林模型的准确度、泛化能力及性能。基于此,提出一种融合近似马尔科夫毯的随机森林优化算法,该算法利用近似马尔科夫毯构建相似特征组,再从每个相似组中按比例抽取特征形成单棵决策树的特征子集,重复上述过程直至达到随机森林规模。该算法可以在保证随机森林特征的多样性前提下,利用近似马尔科夫毯消除特征间的相关性和冗余性,提高随机抽取特征的质量。通过在12组不同维度UCI数据集实验对比表明:融合近似马尔科夫毯的随机森林在一定程度上可以消除特征相关性和冗余性,提高模型的各项评价指标,泛化能力增强,更适用于高维数据。 展开更多
关键词 随机森林 近似马尔科夫毯 特征选择 高维样本
下载PDF
基于随机傅里叶特征空间的高斯核近似模型选择算法 被引量:2
12
作者 张凯 门昌骞 王文剑 《数据采集与处理》 CSCD 北大核心 2023年第3期616-628,共13页
核方法是一种把低维空间的线性不可分问题转化为高维空间中线性可分问题的方法,其广泛应用于多种学习模型。然而现有的核模型选择方法在大规模数据中计算效率较低,时间成本很大。针对这一问题,本文引入随机傅里叶特征变换,将原始核特征... 核方法是一种把低维空间的线性不可分问题转化为高维空间中线性可分问题的方法,其广泛应用于多种学习模型。然而现有的核模型选择方法在大规模数据中计算效率较低,时间成本很大。针对这一问题,本文引入随机傅里叶特征变换,将原始核特征空间转换为另一个相对低维的显式随机特征空间,并给出核近似误差上界理论分析以及在核近似的随机特征空间中训练学习模型的误差上界,得到核近似的收敛一致性和误差上界与核近似参数之间的关系。基于随机傅里叶特征空间选择出最优模型参数,避免了对最优原始高斯核模型参数的大规模搜索,从而大幅降低原始高斯核模型选择所需的时间成本。实验表明,本文给出的误差上界确由核近似参数控制,核近似选择的最优模型相较于原始高斯核模型有较高的准确率,并且模型选择时间相对网格搜索法大幅减小。 展开更多
关键词 核方法 高斯核 傅里叶变换 核近似 模型选择
下载PDF
基于交互信息的两阶段特征选择算法 被引量:1
13
作者 刘强 降爱莲 《计算机工程与设计》 北大核心 2023年第1期125-132,共8页
针对传统特征选择中只考虑了特征的相关性和冗余性而忽略了特征间交互作用的问题,提出一种基于交互信息的两阶段特征选择算法(SAMBFC)。通过对称不确定性和强近似马尔可夫毯原理进行无关特征和冗余特征的筛选;利用特征间交互增益和基于... 针对传统特征选择中只考虑了特征的相关性和冗余性而忽略了特征间交互作用的问题,提出一种基于交互信息的两阶段特征选择算法(SAMBFC)。通过对称不确定性和强近似马尔可夫毯原理进行无关特征和冗余特征的筛选;利用特征间交互增益和基于相关性特征选择算法构建一种特征间互补性评价方法,选取具有交互作用的冗余特征。在9个不同维度的标准数据集上与8种典型算法进行对比实验和分析,其结果表明,SAMBFC算法所选特征的分类性能以及综合表现明显优于其它算法。 展开更多
关键词 特征选择 两阶段 强近似马尔可夫毯 对称不确定性 相关性 冗余性 互补性
下载PDF
基于邻域近似误差率的多标记特征选择 被引量:1
14
作者 潘思远 刘园奎 +1 位作者 毛煜 林耀进 《南京师范大学学报(工程技术版)》 CAS 2023年第1期66-74,共9页
多标记学习可以同时处理与一组标记相关的数据,多标记学习的研究对于多义性对象的学习建模具有十分重要的意义.与传统的单标记学习一样,数据的高维性是多标记学习的阻碍,因此数据降维是一项十分重要的工作,而特征选择是一种有效的数据... 多标记学习可以同时处理与一组标记相关的数据,多标记学习的研究对于多义性对象的学习建模具有十分重要的意义.与传统的单标记学习一样,数据的高维性是多标记学习的阻碍,因此数据降维是一项十分重要的工作,而特征选择是一种有效的数据降维技术.提出了基于邻域近似误差率的多标记特征选择算法.首先,在邻域粗糙集理论的基础上,引入实例的边界来对所有实例进行粒度化.其次,基于邻域决策误差率提出了邻域近似误差率的策略来评价特征.最后,在公开的数据集上进行了大量的实验,结果表明所提算法的有效性. 展开更多
关键词 多标记学习 特征选择 邻域近似误差率
下载PDF
Approximate Continuous Top-k Query over Sliding Window 被引量:2
15
作者 Rui Zhu Bin Wang +2 位作者 Shi-Ying Luo Xiao-Chun Yang Guo-Ren Wang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期93-109,共17页
Continuous top-k query over sliding window is a fundamental problem in database, which retrieves k objects with the highest scores when the window slides. Existing studies mainly adopt exact algorithms to tackle this ... Continuous top-k query over sliding window is a fundamental problem in database, which retrieves k objects with the highest scores when the window slides. Existing studies mainly adopt exact algorithms to tackle this type of queries, whose key idea is to maintain a subset of objects in the window, and try to retrieve answers from it. However, all the existing algorithms are sensitive to query parameters and data distribution. In addition, they suffer from expensive overhead for incremental maintenance, and thus cannot satisfy real-time requirement. In this paper, we define a novel query named (ε, δ)-approximate continuous top-κ query, which returns approximate answers for top-κ query. In order to efficiently support this query, we propose an efficient framework, named PABF (Probabilistic Approximate Based Framework), to support approximate top-κ query over sliding window. We firstly maintain a self-adaptive pruning value, which could filter out newly arrived objects who have a probability less than 1 - 5 of being a query result. For those objects that are not filtered, we combine them together, if the score difference among them is less than a threshold. To efficiently maintain these combined results, the framework PABF also proposes a multi-phase merging algorithm. Theoretical analysis indicates that even in the worst case, we require only logarithmic complexity for maintaining each candidate. 展开更多
关键词 continuous top-k query approximate sliding window
原文传递
基于SAX及空间信息熵的谐振接地系统单相接地故障选线方法 被引量:1
16
作者 田业 刘轩 +3 位作者 姚雪松 冯培磊 赵玉 李琰 《南方电网技术》 CSCD 北大核心 2023年第7期103-114,共12页
针对含多电缆谐振接地系统健全线路零序电流相似性减弱以及单相高阻接地因故障信息微弱且易被干扰而使选线正确率下降的问题,提出一种基于符号化聚合近似(symbolic aggregate approximation,SAX)及空间信息熵的选线方法。首先通过FIR滤... 针对含多电缆谐振接地系统健全线路零序电流相似性减弱以及单相高阻接地因故障信息微弱且易被干扰而使选线正确率下降的问题,提出一种基于符号化聚合近似(symbolic aggregate approximation,SAX)及空间信息熵的选线方法。首先通过FIR滤波器提取暂态低频零序电流并标准化,然后将所得电流序列及其差值序列在多尺度域上符号化,通过最长公共子序列校验后生成三维故障空间并定义空间信息熵,最后比较线路间熵值差异度完成选线。仿真结果表明,所述选线方法灵敏度高,硬件要求低,能够克服采样不同步、三相不平衡等困难。 展开更多
关键词 谐振接地系统 单相接地故障选线 符号化聚合近似 空间信息熵 最长公共子序列
下载PDF
具有基数约束的多阶段均值-半方差可信性投资组合优化
17
作者 张鹏 崔淑琳 李璟欣 《运筹与管理》 CSSCI CSCD 北大核心 2023年第12期138-143,I0022-I0025,共10页
文章探讨了一个多阶段模糊收益的投资组合优化问题。考虑交易成本、借贷约束、阈值约束和基数约束等现实约束,提出了一种新的多阶段均值-半方差可信性投资组合模型。在该模型中,本文分别运用可信性期望值和半方差来度量投资组合收益和... 文章探讨了一个多阶段模糊收益的投资组合优化问题。考虑交易成本、借贷约束、阈值约束和基数约束等现实约束,提出了一种新的多阶段均值-半方差可信性投资组合模型。在该模型中,本文分别运用可信性期望值和半方差来度量投资组合收益和风险。基于可信性理论,将该模型转化为一个动态优化问题。由于存在交易成本和基数约束,该模型是具有路径依赖性的混合整数动态优化问题。本文提出了一种新的离散近似迭代方法进行求解,并证明其线性收敛性。最后,文章运用了具体的算例以验证算法和模型的有效性。 展开更多
关键词 多阶段投资组合 可信性测度 均值-半方差 基数约束 离散近似迭代法
下载PDF
RPA:一种内存高效的度量空间recall@R近似最近邻搜索索引
18
作者 江润本 陈家颖 毛睿 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2023年第6期640-648,共9页
现有的度量空间的近似最近邻搜索(approximate nearest neighbor search, ANNS)方法通常依赖于预选择的支撑点构成的序列,序列中的支撑点按照到数据元素的距离升序排列.然而,大多数现有的度量空间ANNS方法由于索引结构复杂、支撑点过多... 现有的度量空间的近似最近邻搜索(approximate nearest neighbor search, ANNS)方法通常依赖于预选择的支撑点构成的序列,序列中的支撑点按照到数据元素的距离升序排列.然而,大多数现有的度量空间ANNS方法由于索引结构复杂、支撑点过多或者未能充分利用距离信息导致搜索时内存开销巨大.为此,提出精简排列阵(reduced permutation array, RPA)的度量空间recall@R近似最近邻搜索方法.对于全体数据元素,RPA预先选择k个支撑点,对每个数据元素仅存储离该数据元素最近的l个(l<<k),并将所有元素的支撑点序列构建为一个数组结构.在搜索过程中,利用一种得分函数,该函数基于查询对象到各个支撑点的距离来近似计算数据元素到查询对象的距离.同时,维护一个有界最小堆,以保存R个候选结果数据元素.RPA具有结构简单、内存效率高和可扩展性强等特点.实验结果表明,在相同召回率的情况下,与排列索引(permutation-based index, P-index)相比,RPA平均具有高达3倍的内存压缩比.研究结果可在内存资源有限的单机环境下提供一种有效的针对海量数据的ANNS方法. 展开更多
关键词 计算机科学与技术 近似最近邻搜索 度量空间 索引结构 支撑点选择 支撑点序列 内存高效
下载PDF
基于最大信息系数和近似马尔科夫毯的特征选择方法 被引量:49
19
作者 孙广路 宋智超 +2 位作者 刘金来 朱素霞 何勇军 《自动化学报》 EI CSCD 北大核心 2017年第5期795-805,共11页
最大信息系数(Maximum information coefficient,MIC)可以对变量间的线性和非线性关系,以及非函数依赖关系进行有效度量.本文首先根据最大信息系数理论,提出了一种评价各维特征间以及每维特征与类别间相关性的度量标准,然后提出了基于... 最大信息系数(Maximum information coefficient,MIC)可以对变量间的线性和非线性关系,以及非函数依赖关系进行有效度量.本文首先根据最大信息系数理论,提出了一种评价各维特征间以及每维特征与类别间相关性的度量标准,然后提出了基于新度量标准的近似马尔科夫毯特征选择方法,删除冗余特征.在此基础上提出了基于特征排序和近似马尔科夫毯的两阶段特征选择方法,分别对特征的相关性和冗余性进行分析,选择有效的特征子集.在UCI和ASU上的多个公开数据集上的对比实验表明,本文提出的方法总体优于快速相关滤波(Fast correlation-based filter,FCBF)方法,与Relief F,FAST,Lasso和RFS方法相比也具有优势. 展开更多
关键词 特征选择 最大信息系数 近似马尔科夫毯 特征相关性 特征冗余性
下载PDF
面向非完备决策表的正向近似特征选择加速算法 被引量:26
20
作者 钱宇华 梁吉业 王锋 《计算机学报》 EI CSCD 北大核心 2011年第3期435-442,共8页
正向近似是刻画目标概念组成结构的一种有效方法.文中针对非完备决策表现有特征选择算法计算耗时过大的缺陷,提出了一种基于正向近似的通用特征选择加速算法.该算法不仅对候选属性具有保序性,而且通过在特征选择过程中减少样本数据的规... 正向近似是刻画目标概念组成结构的一种有效方法.文中针对非完备决策表现有特征选择算法计算耗时过大的缺陷,提出了一种基于正向近似的通用特征选择加速算法.该算法不仅对候选属性具有保序性,而且通过在特征选择过程中减少样本数据的规模来降低计算耗时,加速特征选择过程.实验结果进一步验证了加速算法的有效性和高效性.特别指出的是,随着属性的增多和数据量的增大,加速算法的性能通常会更好,可有效应用于海量数据的特征选择. 展开更多
关键词 特征选择 非完备决策表 粗糙集 正向近似
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部