期刊文献+

采用增强学习算法的排课模型 被引量:14

Arranging model of university timetable based on reinforcement learning
下载PDF
导出
摘要 时间表问题是典型的组合优化和不确定性调度问题。课表问题是时间表问题的一种形式。分析了排课 问题的数学模型,并研究了用增强学习(Reinforcement Learning)算法中的Q学习(Q-Learning)算法和神经网络 技术结合解决大学课表编排问题,给出了一个基于该算法的排课模型,并对其排课效果进行了分析和探讨。 The University timetable arranging problem is an important task for Academic Affairs Office. Our previous work on formulating this task for solution by the reinforcement learning algorithm Q-learning is summarized. The mathematics model of curriculum arrangement is analyzed and how to extend the BP neural network architecture to apply it to estimate the value of timetable status is shown. Results are presented applying this approach to a gym course arranging based on reinforcement learning.
作者 郭方铭 钟珞
机构地区 武汉理工大学
出处 《计算机工程与设计》 CSCD 2003年第11期125-128,共4页 Computer Engineering and Design
关键词 排课模型 增强学习算法 课程表 高校 组合优化 数学模型 不确定性调度问题 reinforcement learning Q-learning neural network curriculum arrangement mathematics model
  • 相关文献

参考文献8

  • 1唐勇,唐雪飞,王玲.基于遗传算法的排课系统[J].计算机应用,2002,22(10):93-94. 被引量:94
  • 2TomMMitchell.机器学习[M].北京:机械工业出版社,2003..
  • 3熊伟清,魏平,赵杰煜.用遗传算法求解时间表问题[J].微电子学与计算机,2001,18(5):29-31. 被引量:8
  • 4MartinTHagan.神经网络设计[M].北京:机械工业出版社,2002.197-235.
  • 5TomMMitchell.机器学习[M].北京:机械工业出版社,2003.263-276.
  • 6黄干平,姚自珍,张轶静.使用模拟退火算法解课表问题[J].武汉大学学报(自然科学版),2000,46(5):559-563. 被引量:26
  • 7Zhang W. High-performance job-shop sche-duling with a timedelay TD(λ) network[R]. In D S Touretzky, M C Mozer,& M E Hasselmo(Eds.),Advances in Neural InformationProcessing Systems. 1996.
  • 8MartinTHagan.神经网络设计[M].北京:机械工业出版社,2002.197-235.

二级参考文献3

共引文献236

同被引文献64

引证文献14

二级引证文献32

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部