-
题名基于互信息的多标记特征选择
被引量:1
- 1
-
-
作者
李闪闪
潘正高
-
机构
宿州学院信息工程学院
-
出处
《宿州学院学报》
2019年第5期61-67,共7页
-
基金
2017年宿州市科技计划项目(SZ2017GG39)
-
文摘
为了解决多标记学习中的维度灾难问题,提升分类算法的精度,利用特征集合之间的相似度评估特征的重要程度,提出一种改进的基于互信息的多标记特征选择方法。一则通过Intersection相似度计算特征间的冗余程度,二则通过特征与标记集合的互信息计算其相关程度,最终将二者有效融合,选择出一组具有“强相关且低冗余”性能的特征序列。基于8个公开数据集的对比实验结果,表明了该算法能有效提升多标记数据的分类性能,进而验证了算法的可行性。
-
关键词
多标记特征选择
分类性能
Intersection相似度
互信息
-
Keywords
Multi-label feature selection
Classification performance
Intersection similarity
Mutual information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双空间模糊邻域相似关系的多标记特征选择
被引量:4
- 2
-
-
作者
徐久成
申凯丽
-
机构
河南师范大学计算机与信息工程学院
河南师范大学智慧商务与物联网技术河南工程实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2022年第9期805-815,共11页
-
基金
国家自然科学基金项目(No.61976082,62076089,62002103)资助。
-
文摘
针对基于粗糙集的大部分多标记特征选择方法存在的忽略样本的模糊性和邻域关系、手动设置邻域半径、从单一的样本空间度量属性重要度等问题,文中利用模糊邻域粗糙集弥补经典粗糙集的不足,并在此基础上从特征空间和标记空间出发,提出基于双空间模糊邻域相似关系的多标记特征选择算法.首先,设计自适应邻域半径的计算方法,构建特征空间下样本的模糊邻域相似矩阵.再根据模糊邻域相似关系,得出特征空间下的样本相似度及标记空间下的样本相似度.然后,通过权重将特征空间和标记空间上的样本相似度进行融合,基于融合后的度量计算属性重要度.最后,运用前向贪心算法构建多标记特征选择算法.在12个多标记数据集上的对比实验验证文中算法的有效性.
-
关键词
多标记特征选择
模糊邻域相似关系
模糊邻域粗糙集
自适应邻域半径
不确定性度量
-
Keywords
Multi-label Feature Selection
Fuzzy Neighborhood Similarity Relation
Fuzzy Neighborhood Rough Set
Adaptive Neighborhood Radius
Uncertainty Measurement
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于多标记特征选择的英语词汇语义预测方法
- 3
-
-
作者
田烨
-
机构
咸阳师范学院外国语学院
-
出处
《信息技术》
2023年第11期87-91,98,共6页
-
基金
陕西省教育厅2020年度一般专项科学研究计划(20JK0432)。
-
文摘
为了精准预测大学生英语词汇语义掌握程度,提出基于多标记特征选择的英语词汇语义预测方法,通过多标记特征选择方法计算词汇样本相似度,构建样本相似矩阵,获取词汇样本特征,同时依靠特征参数对英语词汇的分布函数与几率密度函数进行计算,凭借计算结果优化极大似然算法,计算英语词汇语义预测的参数下线,以此确保预测的准确度,使用云计算方法对英语词汇之间的特征迭代计算。实验结果表明,所提方法能够精确预测出大学生所掌握的英语词汇语义,并且还能够分析大学生在不同语法的词汇语义掌握状况。
-
关键词
多标记特征选择
英语词汇语义
几率密度后汉书
相似度
特征提取
-
Keywords
multi-label feature selection
English lexical semantics
probability density post Chinese dictionary
similarity
feature extraction
-
分类号
TP315
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于分类规则挖掘的数据多标记特征分层识别
被引量:3
- 4
-
-
作者
朱方娥
郭建方
曹丽娜
-
机构
石家庄铁道大学四方学院
-
出处
《计算机仿真》
北大核心
2021年第4期310-314,共5页
-
文摘
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法。利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别。结果表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴。
-
关键词
分类规则挖掘
多标签数据
数据降维处理
多标记特征选择
分层识别方法
免疫算法
-
Keywords
Classification rule mining
Multi-label data
Data dimension reduction
Multi-label feature selection
Hierarchical recognition method
Immune algorithm
-
分类号
TP184.66
[自动化与计算机技术—控制理论与控制工程]
-