-
题名基于增强学习的半导体测试调度研究
被引量:2
- 1
-
-
作者
张智聪
郑力
翁小华
-
机构
广东东莞理工学院工业工程系
清华大学工业工程系
南佛罗里达大学工业与管理系统工程系
-
出处
《工业工程与管理》
北大核心
2009年第4期38-44,59,共8页
-
基金
国家自然科学基金(70771058)
国家自然科学基金(50375082)
国家863计划资助项目(2008AA04Z102)
-
文摘
采用Sarsa(λ,k)学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数把调度问题转化为增强学习问题,并把Sarsa(λ,k)算法和梯度下降径向基神经网络函数泛化器结合使用。实验验证了Sarsa(λ,k)算法解决半导体测试调度问题的有效性。Sarsa(λ,k)算法通过反复解决调度问题来调整调度策略,能克服单个行为策略短视的缺点,综合利用各个行为策略的优点,从而找到较优的调度方案。
-
关键词
调度
半导体测试
增强学习
多资源约束
-
Keywords
scheduling
semiconductor test
reinforcement learning
resource constraint
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-