核心内容摘要
Atelier of Light and Shadow在GitHub项目中的协作开发指南
核心思想与背景农产品冷链物流需求预测具有典型的季节性、波动性、多影响因素性等特点。
单一的预测模型往往只能捕捉数据的部分模式存在局限性Shapley组合模型 借鉴了博弈论中夏普利值Shapley Value的思想将多个预测模型视为合作的“参与者”通过计算每个模型对最终预测“联盟”的边际贡献来分配权重从而形成一个更优的组合预测模型。
其核心优势在于公平性权重分配基于科学的数学公理避免了主观赋权。
协同性有效集成了不同模型的优势。
稳定性降低了单一模型预测失误带来的风险。
阶段一数据获取与预处理数据源宏观经济节假日春节、国庆、电商促销日
双11。
市场与价格农产品批发市场价格、替代品价格。
天气气候温度、湿度、极端天气事件。
供应链相关冷库容量、燃油价格、物流运力指数。
社会事件疫情、大型展会等。
历史需求数据过去几年的农产品分品类如肉类、果蔬、乳制品冷链运输量/订单量。
外部影响因素数据预处理清洗处理缺失值、异常值。
对齐将不同频率的数据日度、周度统一为预测所需频率。
特征工程构建滞后特征、滑动窗口统计特征如过去7天平均需求量、节假日虚拟变量等。
阶段二构建基础预测模型库选择3个MLP、GMII、ARIMA具有代表性的、原理各异的预测模型进行训练和调优。
这是最核心的步骤。
假设我们有 M 个基础模型。
阶段五应用与迭代部署将训练好的Shapley组合模型部署到生产系统进行滚动预测。
监控与更新定期如每月/每季度用新数据重新计算Shapley权重以捕捉模型性能的动态变化。
当市场环境发生重大变化时重新训练基础模型。