基于邻域粗糙集的主动学习方法被引量：3

Algorithm for active learning based on neighbor rough set theory

下载PDF

导出

摘要主动学习是机器学习领域的重要研究方向。现有主动学习方法通常选择不确定性的或具有代表性的样本供专家打标,然后添加到已标记的数据集中供分类器学习,但没能充分利用数据的分布信息,并且在野点采集问题上有待改进。结合邻域粗糙集理论,提出了一种基于邻域粗糙集的主动学习方法(neighhbor rough set active learning,NRS-AL)。实验结果表明,在加州大学数据集(university of California Irvine,UCI)上,该算法充分利用了数据的分布信息,同时结合样本的不确定性和代表性计算,处理了野点的选择,是一种能有效解决主动学习样本选择问题的算法,在accuracy,受试者工作特征(receiver operating characteristic curve,ROC)曲线下面的面积(area under curve,AUC)指标上优于文献中的主动学习算法。 Active learning is one of the major research directions of machine learning.Most active learning approaches select uncertain or representative unlabeled samples to query their labels,and then add them into labeled data sets for classifier learning.However,these approaches have not fully utilized data distribution information,and not processed outlier acquisition problem well enough,too.With neighbor rough set theory,an algorithm named NRS-AL is proposed.The experiment results have shown that in UCI data set,combined with uncertainty and representative calculation of samples,the proposed algorithm in this paper has solved the previous problems,and is effective in solving sample choosing problems in active learning,which shows better accuracy and AUC performances than others in the literatures.

作者胡峰周耀王蕾

机构地区重庆邮电大学计算智能重庆市重点实验室

出处《重庆邮电大学学报（自然科学版）》 CSCD 北大核心 2017年第6期776-784,共9页 Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)

基金国家自然科学基金(61309014) 教育部人文社科规划项目(15XJA630003) 重庆市教委科学技术研究项目(KJ1500416) 重庆市基础与前沿研究计划项目(cstc2013jcyj A40063)~~

关键词邻域粗糙集主动学习基于池的样本选择 neighborhood rough set active learning pool-based sample selection

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1王国胤,苗夺谦,吴伟志,梁吉业.不确定信息的粗糙集表示和处理[J].重庆邮电大学学报（自然科学版）,2010,22(5):541-544. 被引量：13
2李华雄,刘盾,周献中.决策粗糙集模型研究综述[J].重庆邮电大学学报（自然科学版）,2010,22(5):624-630. 被引量：29

二级参考文献31

1李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20. 被引量：1246
2赵文清,朱永利,高伟华.一个基于决策粗糙集理论的信息过滤模型[J].计算机工程与应用,2007,43(7):185-187. 被引量：15
3PAWLAK Z. Rough sets [ J ]. International Journal of Computer and Information Science, 1982, 11 (5) : 341-356.
4PAWLAK Z. Rough Sets: Theoretical Aspects of Reasoning about Data [ M ]. Boston : Kluwer Academic Publishers Press, 1991:90-166.
5苗夺谦,李道国.粗糙集理论、算法及应用[M].北京:清华大学出版社,2008:176-235.
6YAO Y Y. Decision-theoretic rough set models [ C]// YAO J,Lingras P, Wu W Z, et al. Proceedings of the 2nd International Conference on Rough Sets and Knowledge Technology 2007, Lecture Notes in Computer Science 4481. Heidelberg: Springer, 2007 : 1-12.
7YAO Y Y, WONG S K M. A decision theoretic framework for approximating concepts [ J ]. International Journal of Man-machine Studies, 1992, 37(6) : 793-809.
8YAO Y Y, WONG S K M, LINGRAS P. A decision-theoretic rough set model [ C ]//RAS Z W, ZEMANKOVA M, EMRICHM M L. Proceedings of the 5th International Symposium on Methodologies for Intelligent Systems 1990. North-Holland : [ s. n. ] , 1990 : 17-25.
9YAO Y Y. Probabilistic approaches to rough sets [ J ]. Expert Systems, 2003, 20 : 287-297.
10AN Qiu-sheng,ZHU You-hong. Rough relational database and its development[ J]. Journal of Chongqing Universiey of Posts and Telecommunications (natural science edition) ,2009,21 (4) :474-478.

共引文献40

1万仁霞,赵杰.基于毕达哥拉斯模糊集与Bayes决策粗糙集的二人零和博弈模型[J].模糊系统与数学,2023,37(5):133-142.
2胡卉颖,罗锦坤,刘阿宁.三枝决策粗糙集模型属性约简研究[J].软件导刊,2012,11(2):20-22. 被引量：1
3蔡正琦,曹永春.基于半半序关系的集值不完备信息系统的属性约简[J].甘肃科技,2012,28(4):17-19.
4闵孝忠,戴国洪.云端装配知识发现系统的设计与实现[J].江苏技术师范学院学报,2012,18(2):12-17.
5张清华,王国胤,刘显全.基于最大粒的规则获取算法[J].模式识别与人工智能,2012,25(3):388-396. 被引量：23
6刘盾,李天瑞,李华雄.区间决策粗糙集[J].计算机科学,2012,39(7):178-181. 被引量：16
7刘盾,李天瑞,梁德翠.模糊数决策粗糙集[J].计算机科学,2012,39(12):25-29. 被引量：9
8赵春生,冯林,蒋劢,李聪.一种基于DTRS模型与α-正域的邮件过滤方法[J].重庆邮电大学学报（自然科学版）,2013,25(1):126-131.
9许昌林,王国胤.实现稳定双向认知映射的逆向云变换算法[J].模式识别与人工智能,2013,26(7):634-642. 被引量：13
10苏国振,何娟.基于粗糙集的银行存货质押业务投资决策研究[J].河北工业科技,2013,30(6):414-420. 被引量：2

同被引文献28

1肖瑞,胡冯菊,裴卫.基于BiLSTM-CRF的中医文本命名实体识别[J].世界科学技术-中医药现代化,2020,22(7):2504-2510. 被引量：31
2徐章艳,杨炳儒,宋威.基于简化的二进制差别矩阵的快速属性约简算法[J].计算机科学,2006,33(4):155-158. 被引量：16
3杨红颖,王向阳.一种新的按位块分段快速排序算法[J].微电子学与计算机,2006,23(8):136-139. 被引量：4
4吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.词形还原方法及实现工具比较分析[J].现代图书情报技术,2012(3):27-34. 被引量：12
5桑妍丽,钱宇华.一种悲观多粒度粗糙集中的粒度约简算法[J].模式识别与人工智能,2012,25(3):361-366. 被引量：36
6刘康,钱旭,王自强.主动学习算法综述[J].计算机工程与应用,2012,48(34):1-4. 被引量：25
7张艳芹.模糊多粒度粗糙集约简方法研究[J].武汉理工大学学报,2014,36(8):133-137. 被引量：2
8张明,程科,杨习贝,唐振民.基于加权粒度的多粒度粗糙集[J].控制与决策,2015,30(2):222-228. 被引量：38
9孟慧丽,马媛媛,徐久成.基于信息量的悲观多粒度粗糙集粒度约简[J].南京大学学报（自然科学版）,2015,51(2):343-348. 被引量：13
10娄亮,周安民.基于主动学习CRF的信息安全领域命名实体识别研究[J].通信与信息技术,2016(1):61-63. 被引量：1

引证文献3

1王必晴,梁昌勇,齐平,黄永青.基于压缩决策表的乐观多粒度粗糙集粒度约简算法[J].重庆邮电大学学报（自然科学版）,2019,31(2):270-278.
2彭嘉毅,方勇,黄诚,刘亮,姜政伟.基于深度主动学习的信息安全领域命名实体识别研究[J].四川大学学报（自然科学版）,2019,56(3):457-462. 被引量：25
3尚福华,马宁,解红涛.基于主动学习的试油气井控领域命名实体识别模型[J].计算技术与自动化,2022,41(2):178-183.

二级引证文献25

1郑雷,孔祥伟.新形势下国企信息安全保密管理工作综述[J].科学与信息化,2019,0(20):147-148.
2赵颖.基于转移学习的小样本数据深度学习研究[J].长江工程职业技术学院学报,2019,36(3):14-17. 被引量：1
3蔡皎洁.AI中的文本信息抽取方法进展研究[J].湖北工程学院学报,2019,39(6):65-72. 被引量：3
4黄炜,黄建桥,李岳峰.基于BiLSTM-CRF的涉恐信息实体识别模型研究[J].情报杂志,2019,38(12):149-156. 被引量：24
5赵容梅,熊熙,琚生根,李中志,谢川.基于混合神经网络的中文隐式情感分析[J].四川大学学报（自然科学版）,2020,57(2):264-270. 被引量：20
6刘彤,魏静,倪维健,陈思源.基于半监督学习与CRF的应急预案命名实体识别[J].软件导刊,2020,19(3):35-38. 被引量：1
7董光芹,夏文秀.基于Top-k查询算法的图书自整合信息快速检索方法[J].吉林大学学报（理学版）,2020,58(3):666-670. 被引量：6
8吕晋,吴进军,朱宇宏,聂军刚.基于Bi-LSTM-CRF模型的焊接专利新词发现[J].黄河科技学院学报,2020,22(5):47-52. 被引量：1
9赵翠镕,黄建军,孙鹏,方勇,祝鹏程.社交网络中网络空间安全用户挖掘模型研究[J].现代计算机,2020,26(12):4-8. 被引量：1
10余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：18

1王颖锋.Java教学中结合案例激发学生主动学习方法的探索[J].科技风,2017(20):29-29.
2胡军,王凯.基于邻域粗糙集的连续值分布式数据属性约简[J].重庆邮电大学学报（自然科学版）,2017,29(6):785-791. 被引量：3
3卢红洋,魏仲民.基于多特征的高光谱遥感影像主动学习方法研究[J].科技创新与应用,2017,7(33):77-78. 被引量：1
4王润奇,李雪莉,黄玉丽,何彬,关毅.中文电子病历命名实体识别的主动学习方法研究[J].中国数字医学,2017,12(10):51-53.
5宇文.数据衍生新业务模式[J].IT经理世界,2017,0(22):14-15.
6李志超,周科平,林允.基于RS-云模型的硫化矿石自燃倾向性综合评价[J].中国安全生产科学技术,2017,13(9):126-131. 被引量：9
7钱伯章.美国农业部支持生物基基础油装置建设[J].润滑油与燃料,2016,0(4):38-39.
8纪卫华,张军,于晓岩,刁敬军.新生儿呼吸窘迫综合征对降钙素原在早产儿早发感染中诊断价值的影响[J].国际儿科学杂志,2017,44(10):723-726. 被引量：4

重庆邮电大学学报（自然科学版）

2017年第6期

浏览历史

内容加载中请稍等...

基于邻域粗糙集的主动学习方法被引量：3

参考文献2

二级参考文献31

共引文献40

同被引文献28

引证文献3

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于邻域粗糙集的主动学习方法 被引量：3

参考文献2

二级参考文献31

共引文献40

同被引文献28

引证文献3

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于邻域粗糙集的主动学习方法被引量：3