基于生成模型的Q-learning二分类算法被引量：1

Q-learning algorithm based on generative model for binary classification

下载PDF

导出

摘要对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度。设计实验对比了BGQ-learning算法与三种经典分类器以及一种新颖的分类器的分类性能,在UCI数据库七个数据集上的测试结果表明,该算法有着优良的稳定性以及良好的分类精确度。 For binary classification problems,the classifier based on the discriminant model usually searches for an optimal decision boundary,which is susceptible to data fluctuations.This paper proposed a Q-learning algorithm based on the generative model for binary classification(BGQ-learning),which coded state and action separately and obtained corresponding decision functions,increasing the flexibility of decision space.And then it combined least squares temporal-difference(TD)algorithm and semi-gradient descent for parameter optimization,accelerating parameter convergence speed.This paper designed experiments to compare the performance of the proposed algorithm with three classical classifiers and a novel classifier.The test results on 7 data sets of the UCI database show that the proposed algorithm has excellent stability and classification accuracy.

作者尚志刚徐若灏乔康加杨莉芳李蒙蒙 Shang Zhigang;Xu Ruohao;Qiao Kangjia;Yang Lifang;Li Mengmeng(School of Electrical Engineering,Zhengzhou University,Zhengzhou 450001,China;Henan Key Laboratory of Brain Science&Brain-Computer Interface Technology,Zhengzhou 450001,China)

机构地区郑州大学电气工程学院河南省脑科学与脑机接口技术重点实验室

出处《计算机应用研究》 CSCD 北大核心 2020年第11期3326-3329,3333,共5页 Application Research of Computers

基金国家自然科学基金资助项目(U1304602)。

关键词 Q-LEARNING 生成模型二分类最小二乘时序差分算法半梯度下降法 Q-learning generative model binary classification least squares temporal-difference algorithm semi-gradient descent

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1马骋乾,谢伟,孙伟杰.强化学习研究综述[J].指挥控制与仿真,2018,40(6):68-72. 被引量：41

二级参考文献2

1魏亮,黄韬,张娇,王泽南,刘江,刘韵洁.基于强化学习的服务链映射算法[J].通信学报,2018,39(1):90-100. 被引量：17
2陈希亮,曹雷,何明,李晨溪,徐志雄.深度逆向强化学习研究综述[J].计算机工程与应用,2018,54(5):24-35. 被引量：18

共引文献40

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：35
2蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.
3崔立,宋玉,张进.基于自适应DDPG方法的复杂场景下AUV动动对接[J].船舶工程,2023,45(8):8-14.
4赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
5杨薛钰.基于Q-Learning算法的电气故障检测模型[J].电脑知识与技术,2020,16(5):258-260.
6刘暾东,陈馨,吴晓敏,邵桂芳.工业机器人运动规划研究进展[J].自动化博览,2020,37(4):56-61.
7陈鹏,王子磊.融合深度学习与搜索的实时策略游戏微操方法[J].计算机工程,2020,46(6):50-59.
8孙嘉浩,陈劲杰.基于强化学习的无人驾驶仿真研究[J].农业装备与车辆工程,2020,58(6):102-106.
9孙鹏,孙若莹,李佳慧.基于强化学习的生鲜产品库存成本控制模型[J].计算机仿真,2020,37(8):192-195. 被引量：2
10张延华,杨乐,李萌,吴文君,杨睿哲,司鹏搏.基于Q-learning的工业互联网资源优化调度[J].北京工业大学学报,2020,46(11):1213-1221. 被引量：3

同被引文献12

1汪欣,吴薇,曾照.基于视频的人脸检测算法研究[J].电子科技,2020,33(2):25-31. 被引量：9
2贾小硕,曾上游,潘兵,周悦.基于改进MTCNN网络的目标人脸快速检测[J].计算机工程与科学,2020,42(7):1262-1266. 被引量：11
3杨思燕,苗凯彬,王锋,苗启广.视频图像中人脸自动检测与统计算法[J].电子科技,2020,33(8):1-9. 被引量：3
4张子昊,王蓉.基于MobileFaceNet网络改进的人脸识别方法[J].北京航空航天大学学报,2020,46(9):1756-1762. 被引量：9
5白子轶,毛懿荣,王瑞平.视频人脸识别进展综述[J].计算机科学,2021,48(3):50-59. 被引量：10
6薛晨,宁志刚.复杂光照场景下基于MTCNN的人脸检测[J].南华大学学报（自然科学版）,2021,35(3):70-74. 被引量：3
7张宏丽,白翔宇.利用优化剪枝GoogLeNet的人脸表情识别方法[J].计算机工程与应用,2021,57(19):179-188. 被引量：12
8王子超,崔荣成,温蜜,张凯,何蔚.自适应跟踪与多特征融合的目标跟踪算法[J].计算机工程与设计,2021,42(10):2844-2851. 被引量：2
9黄新,高雷,宋博源,郭晓敏.基于MTCNN与改进Camshift相结合的人脸检测算法[J].桂林电子科技大学学报,2021,41(3):205-211. 被引量：1
10冉光金,李震,李良荣.基于灵敏度分析的FPGM剪枝算法研究[J].计算机应用研究,2022,39(1):141-145. 被引量：2

引证文献1

1赵杰.基于深度学习的人脸识别算法在视频监控的应用研究[J].电子设计工程,2023,31(13):182-186. 被引量：5

二级引证文献5

1彭之军.人脸识别技术进展综述[J].信息与电脑,2023,35(15):168-171. 被引量：2
2朱磊,赵涵,王伟丽.基于新型特征增强与融合的雾天目标检测方法[J].西安工程大学学报,2023,37(6):106-113.
3张琪立,马民生,薛艳芬.基于深度学习技术的人脸识别算法优化与应用研究[J].信息记录材料,2023,24(12):146-148.
4齐伟强.人脸识别技术在电力营销现场作业平台的应用[J].农村电气化,2024(2):50-54.
5林超楠,周文欣,霍瑛.面向安全认证的人脸识别系统设计与实现[J].信息与电脑,2024,36(4):159-162.

1张秦浩,敖百强,张秦雪.Q-learning强化学习制导律[J].系统工程与电子技术,2020,42(2):414-419. 被引量：21
2韩存鸽.FP-growth算法的研究与改进[J].龙岩学院学报,2020,38(5):8-13. 被引量：3
3卢捷,李峰.基于初始值和背景值改进的GM(1,1)模型优化与应用[J].运筹与管理,2020,29(9):27-33. 被引量：17
4吴爽.城市轨道交通线路曲线组合优化方法研究[J].铁道勘察,2020,46(5):101-104.

计算机应用研究

2020年第11期

浏览历史

内容加载中请稍等...

基于生成模型的Q-learning二分类算法被引量：1

参考文献1

二级参考文献2

共引文献40

同被引文献12

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于生成模型的Q-learning二分类算法 被引量：1

参考文献1

二级参考文献2

共引文献40

同被引文献12

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于生成模型的Q-learning二分类算法被引量：1