学术文章

仿真环境下库存策略的深度强化学习方法


在这项工作中,研究人员采取了一种根本原因,使供应商管理库存绩效衡量方法分配责任的不良表现。此外,提出了一种基于强化学习的解决方法,以确定在VMI设置下的最优补货策略。采用仿真模型作为培训环境,根据英飞凌科技公司提供的真实数据生成不同的需求场景,并根据关键性能指标进行比较。

Baidu