期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于嵌入式特征选择的垃圾邮件过滤模型 被引量:13
1
作者 闫鹏 郑雪峰 +1 位作者 朱建勇 肖赟泓 《小型微型计算机系统》 CSCD 北大核心 2009年第8期1616-1620,共5页
垃圾邮件自身的特点决定了消极学习型的文本分类算法更加适合于垃圾邮件过滤问题.但是,以k-NN为代表的消极型文本分类算法却存在着运行效率偏低等诸多缺点,不便于实际使用.为此,该文在向量余弦相似性公式的基础上,提出了一种新的"... 垃圾邮件自身的特点决定了消极学习型的文本分类算法更加适合于垃圾邮件过滤问题.但是,以k-NN为代表的消极型文本分类算法却存在着运行效率偏低等诸多缺点,不便于实际使用.为此,该文在向量余弦相似性公式的基础上,提出了一种新的"嵌入式特征选择垃圾邮件过滤模型"和基于此模型的消极学习型垃圾邮件过滤算法.与一些经典算法相比,新算法在显著降低运算开销的同时,巧妙地避免了由此而引起的信息丢失问题,因而在性能与效率两个方面都有明显提高,具有非常高的实际价值. 展开更多
关键词 垃圾邮件过滤 机器学习 余弦相似性 嵌入式特征选择
下载PDF
基于嵌入式特征选择算法下的抗乳腺癌药物分子活性预测 被引量:1
2
作者 叶丹 胡二琴 《电脑知识与技术》 2022年第34期8-10,共3页
文章提出在嵌入式特征选择算法背景下,通过对比正则化模型和树模型两种筛选方法下的重要性权重选取出对生物活性最具有显著影响的20个分子描述符,并分别建立预测模型。结果表明树模型下的随机森林方法真实值与预测值相对平均误为0.0167... 文章提出在嵌入式特征选择算法背景下,通过对比正则化模型和树模型两种筛选方法下的重要性权重选取出对生物活性最具有显著影响的20个分子描述符,并分别建立预测模型。结果表明树模型下的随机森林方法真实值与预测值相对平均误为0.0167,相较于正则化方法和树模型方法下的梯度提升决策树更优,证实基于该方法下筛选的模型具有预测误差小、预测精度更高的优点。 展开更多
关键词 抗乳腺癌 嵌入式特征选择 重要性权重选择特征 生物活性预测
下载PDF
基于可固定用户自定义特征子集的特征选择新算法
3
作者 郑列 任秀伟 罗幼喜 《湖北工业大学学报》 2018年第2期115-120,共6页
高通量生物技术的应用产生了大量的高维小样本生物数据。在生物医学"大数据"领域中,特征选择算法是解决维数灾难的有效方法之一。基于此提出一种新的特征选择算法(记为Sub(filter)Lasso)。实验结果表明:对于现有特征选择算法... 高通量生物技术的应用产生了大量的高维小样本生物数据。在生物医学"大数据"领域中,特征选择算法是解决维数灾难的有效方法之一。基于此提出一种新的特征选择算法(记为Sub(filter)Lasso)。实验结果表明:对于现有特征选择算法,分类性能表现较差的两个生物数据集ALL2和CNS,新算法的分类性能显著提高;新算法选出了具有非常好分类性能的特征子集,在不同的分类器上取得了稳健的分类效果;对15个数据集进行比较实验的结果表明,Sub(filter)Lasso是表现更好的算法,显著提高了分类准确性。 展开更多
关键词 Sub(filter)Lasso 特征排序算法 嵌入式特征选择 生物大数据
下载PDF
降维技术与方法综述 被引量:28
4
作者 张煜东 霍元铠 +1 位作者 吴乐南 董正超 《四川兵工学报》 CAS 2010年第10期1-7,共7页
为了更好地对数据实现降维,讨论了特征选择与特征变换两种技术。对于特征选择,按照特征子集的形成方法可分为穷举法、启发式方法、随机方法、智能优化方法等;按照评价函数的类别可分为筛选式、封装式、嵌入式。对于特征变换,传统的方法... 为了更好地对数据实现降维,讨论了特征选择与特征变换两种技术。对于特征选择,按照特征子集的形成方法可分为穷举法、启发式方法、随机方法、智能优化方法等;按照评价函数的类别可分为筛选式、封装式、嵌入式。对于特征变换,传统的方法采用线性降维方法,主要有非负矩阵分解、因子分析、主成份分析、奇异值分解、独立成分分析等;目前的方法是非线性降维方法,以流形学习为代表。对各种不同方法详细探讨其原理与流程,并进行了性能比较。 展开更多
关键词 特征选择 特征变换 嵌入式特征选择 流形学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部