-
题名基于混合遗传算法与互信息分析的高维小样本特征选择
被引量:6
- 1
-
-
作者
姚树春
刘正
张强
-
机构
苏州工业园区服务外包职业学院信息工程学院
苏州大学电子信息学院
苏州迈科网络安全技术股份有限公司
-
出处
《计算机应用与软件》
北大核心
2020年第1期247-255,共9页
-
基金
国家自然科学基金项目(61876117)
苏州工业园区服务外包职业学院教改项目(JG-201706)
江苏高校“青蓝工程”项目
-
文摘
针对高维小样本数据特征选择冗余度高和过拟合的问题,提出一种基于混合遗传算法与互信息分析的高维小样本特征选择算法。对互信息理论与特征选择问题进行深入分析,利用互信息消除特征冗余度能力强的优点,推理出基于互信息的目标函数和优化的边界条件;设计混合的遗传算法来充分利用高维小样本数据集不同角度的属性数据,混合遗传算法设立主种群和次种群,在每次迭代中利用次种群的结果引导主种群的演化,从而缓解小样本数据带来的过拟合问题。基于医学数据集的对比实验结果表明,该算法有效地增强了遗传算法的稳定性和鲁棒性,并且实现了较好的特征选择效果。
-
关键词
高维小样本数据
特征选择
互信息
遗传算法
过拟合问题
微阵列数据
-
Keywords
High dimensional and small sample size data
Feature selection
Mutual information
Genetic algorithmOverfitting problem
Microarray data
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于非迭代训练层次循环神经网络的快速文本分类算法
被引量:1
- 2
-
-
作者
方自远
-
机构
河南农业职业学院
-
出处
《计算机应用与软件》
北大核心
2021年第7期310-316,331,共8页
-
文摘
基于神经网络的文本分类算法需要较长的训练时间,难以满足在线文本分类的需求。针对这种情况,提出基于非迭代训练层次循环神经网络的快速文本分类算法。为循环神经网络设计了对抗训练模型,缓解层次注意力网络的过拟合问题。给出一种循环神经网络的非迭代训练算法,对激活函数进行线性逼近,快速地学习网络连接的权重。实验结果表明,在英文和中文文本的情况下,采用该算法均获得了理想的分类准确率,并且大幅度地减少了训练时间。
-
关键词
循环神经网络
层次注意力
文本分类
过拟合问题
非迭代训练
对抗训练
-
Keywords
Recurrent neural network
Hierarchical attention
Documental classification
Overfitting problem
Non-iterative training
Adversarial training
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-