-
题名融合标记独有属性特征的k近邻多标记分类新算法
被引量:8
- 1
-
-
作者
蒋芸
肖潇
侯金泉
陈莉
-
机构
西北师范大学计算机科学与工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第3期513-519,共7页
-
基金
国家自然科学基金(61163036)
甘肃省科技计划资助自然科学基金(1606RJZA047)
+2 种基金
2012年度甘肃省高校基本科研业务费专项资金
甘肃省高校研究生导师项目(1201-16)
西北师范大学第三期知识与创新工程科研骨干项目(nwnu-kjcxgc-03-67)
-
文摘
在多标记学习系统中,每个样本同时与多个类别标记相关,却均由一个属性特征向量描述。大部分已有的多标记分类算法采用的共同策略是使用相同的属性特征集合预测所有的类别标记,但它并非最佳选择,原因在于每个标记可能与其自身独有的属性特征相关性最大。针对这一问题,提出了融合标记独有属性特征的k近邻多标记分类算法—IML-kNN。首先对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后基于得到的属性特征使用改进后的ML-kNN算法进行分类。实验结果表明,IML-kNN算法在yeast和image数据集上的性能明显优于ML-kNN算法以及其他3种常用的多标记分类算法。
-
关键词
多标记学习
多标记k近邻
标记独有特征
标记相关性
-
Keywords
multi-label learning
ML-kNN
label specific feature
label correlation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于标记特定特征和相关性的ML-KNN改进算法
被引量:2
- 2
-
-
作者
李永
许鹏
-
机构
北京工业大学软件学院
-
出处
《计算机系统应用》
2021年第2期125-131,共7页
-
文摘
目前大部分已经存在的多标记学习算法在模型训练过程中所采用的共同策略是基于相同的标记属性特征集合预测所有标记类别.但这种思路并未对每个标记所独有的标记特征进行考虑.在标记空间中,这种标记特定的属性特征对于区分其它类别标记和描述自身特性是非常有帮助的信息.针对这一问题,本文提出了基于标记特定特征和相关性的ML-KNN改进算法MLF-KNN.不同于之前的多标记算法直接在原始训练数据集上进行操作,而是首先对训练数据集进行预处理,为每一种标记类别构造其特征属性,在得到的标记属性空间上进一步构造L_(1)-范数并进行优化从而引入标记之间的相关性,最后使用改进后的ML-KNN算法进行预测分类.实验结果表明,在公开数据集image和yeast上,本文提出的算法MLF-KNN分类性能优于ML-KNN,同时与其它另外3种多标记学习算法相比也表现出一定的优越性.
-
关键词
多标记学习
标记特定特征
标记相关性
多标记k近邻
L_(1)-范数
-
Keywords
multi-label learning
label specific features
label correlation
ML-kNN
L_(1)-norm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名结合TF-IDF的歌曲情感多标记分类
被引量:4
- 3
-
-
作者
孙向琨
邓伟
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第19期189-190,197,共3页
-
文摘
提出一种结合词频-逆向文件频率(TF-IDF)规则与多标记分类的歌曲情感分析方法。对歌曲中基于声学特征的音乐内容,用带向量夹角的多标记k近邻算法进行分类,将TF-IDF规则用于歌词内容,以计算歌词情感分数,并将其作为情感特征。采用该方法对歌词内容分类错误的类别标记进行修正。选用396首英文歌曲对该算法进行测试,结果表明,与其他方法相比,该方法能使分类精确度从69%提高到74%。
-
关键词
多标记分类
歌曲情感分类
多标记k近邻算法
词频-逆向文件频率
-
Keywords
multi-label classification
song emotion classification
multi-label k-Nearest Neighbor(kNN) algorithm
Term Frequency-Inverse Document Frequency(TF-IDF)
-
分类号
N945
[自然科学总论—系统科学]
-