供应商管理库存(VMI)是一种主流的供应链协作模式。VMI一词通常被认为是一种战略,其中库存补充决策转移到供应商。
在这项工作中,研究人员采取了一个根本原因,使VMI绩效测量方法分配的责任,表现不佳。此外,本文还提出了一种基于强化学习用于确定VMI设置中的最佳补充策略。使用仿真模型作为训练环境的真实数据,生成不同的需求场景英飞凌科技有限公司并根据关键绩效指标进行比较。
对于VMI应用程序以及何时违反定义的最小/最大库存限制,定义明确的职责分配非常重要。因此,概述并进一步开发了一个指标来监测库存违规情况并分配责任。
开发这样一个度量的过程始于对底层VMI配置的分析。
合作从客户向供应商提供需求预测开始。考虑到当前的库存信息,供应商计划并交付补货,客户可以在任何时间点从库存中提取补货。值得一提的是,供应商没有收到任何关于需求预测生成的信息。
根据目前的设置,供应商将对失败的交付负责。这就要求使用一种根本原因支持VMI绩效测量方法,它可以充分分配任何类型的库存违规的责任。
强化学习和模拟环境
本文建立了绩效评估模型AnyLogic.将仿真模型进一步扩展为奖励函数、状态(观察)空间和动作空间,使其在外部集成开发环境(IDE) IntelliJ IDEA中作为强化学习训练环境。
仿真模型被导出为Java独立应用程序并导入到IntelliJ中。利用Java强化学习(RL4J)库使代理学习策略。训练后的模型被导入AnyLogic仿真模型作为测试平台。在那里,扩展模型被用作一个环境,教学习代理采取适当的行动以达到所需的状态。
在AnyLogic离散事件仿真环境中验证了VMI性能测量方法。使用不同的参数测试了所开发方法的敏感性,这些参数包括预测信息、每日补充和853天的实际需求(拉)。
结果
在本文中,VMI的根本原因性能测量方法被扩展到测量不良性能的责任。它是通过考虑合作伙伴之间相互同意的需求预测准确性来执行的。
通过对一组公司数据的模拟,对该方法进行了测试和验证。从供应商的角度考虑库存违规减少的空间,在仿真环境下,采用深度强化学习算法研究并实现了补货策略的优化。