<  Retour au portail Polytechnique Montréal

Conception d'outils d'aide à la décision visant à améliorer l'efficacité opérationnelle de la chaîne d'approvisionnement dans un contexte de modernisation technologique

Zineb Aboutalib

Thèse de doctorat (2025)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (5MB)
Afficher le résumé
Cacher le résumé

Résumé

Face aux défis contemporains tels que les perturbations des chaînes d’approvisionnement mondiales, la volatilité des marchés et la pression concurrentielle, les entreprises recherchent activement des solutions innovantes pour optimiser leurs opérations logistiques. L’émergence de technologies basées sur les données offre de nouvelles perspectives pour résoudre des problématiques logistiques traditionnellement abordées par des méthodes analytiques classiques. Cette thèse s’inscrit dans cette dynamique en proposant des méthodologies qui exploitent intelligemment les données pour créer des outils décisionnels adaptés aux réalités complexes des chaînes d’approvisionnement modernes. La performance logistique repose sur l’optimisation simultanée de multiples composantes interconnectées formant un système cohérent. Notre recherche aborde trois défis majeurs qui, ensemble, déterminent l’efficacité opérationnelle globale de la chaîne d’approvisionnement : la consolidation de marchandises, l’allocation des articles pour l’exécution des commandes (OFA), et le contrôle d’inventaire. Pour chacun de ces domaines, nous développons des approches novatrices qui tirent parti des avancées en fouille de données et en apprentissage automatique, en choisissant systématiquement l’outil méthodologique le mieux adapté à la nature spécifique de chaque problème. Notre première contribution présente une méthodologie novatrice de consolidation de marchandises basée sur la fouille de données. La consolidation (un processus consistant à regrouper plusieurs petits envois en unités plus importantes) représente un levier essentiel pour la réduction des coûts logistiques. Contrairement aux modèles traditionnels qui s’appuient généralement sur des données agrégées, notre approche exploite les règles d’association pour identifier des patterns cachés dans des données non agrégées et intermittentes. Cette méthode comprend l’extraction automatique de règles d’associations, qui sont ensuite sélectionnées selon des critères de proximité spatiale et de force d’association. Appliquée à un cas d’étude sur la consolidation de produits retournés, notre méthodologie surpasse les approches classiques d’optimisation, démontrant une réduction significative des coûts totaux tout en offrant une flexibilité accrue face aux fluctuations de la demande. Un avantage majeur de notre contribution réside dans sa capacité à traiter efficacement des volumes de données considérables sans compromettre la finesse de l’analyse, rendant la solution particulièrement pertinente pour les environnements logistiques actuels caractérisés par l’abondance informationnelle. Notre deuxième contribution élargit le cadre conceptuel en intégrant la consolidation spatiale à l’allocation des items pour l’exécution des commandes (OFA). Cette problématique, centrale dans les centres de distribution, consiste à déterminer quelles commandes prioriser et satisfaire lorsque les stocks sont limités. Nous développons une méthodologie multi-objectifs qui équilibre deux impératifs souvent contradictoires : la minimisation des coûts d’expédition et l’optimisation du taux de remplissage des commandes pondéré (WOFR), indicateur clé du respect des niveaux de service client. L’innovation centrale de cette contribution est un modèle de programmation linéaire en nombres entiers mixtes—WOFR-EC (Weighted Order Fill Rate Encouraging Consolidation)—qui intègre explicitement la consolidation spatiale dans son architecture décisionnelle. Ce modèle introduit un mécanisme de pénalisation proportionnel au nombre de points de collecte visités, encourageant ainsi le regroupement géographique des livraisons sans compromettre les niveaux de service client. La méthodologie intègre également une version améliorée de l’approche par règles d’association de notre première contribution, avec l’ajout d’un algorithme de sélection automatique des règles. Les expérimentations sur données réelles démontrent l’efficacité de notre approche : pour un niveau de service équivalent, notre méthodologie permet une réduction jusqu’à 21% du nombre d’arrêts dans les itinéraires de livraison comparativement aux méthodes conventionnelles. Cette contribution représente une avancée significative vers l’intégration des objectifs souvent contradictoires d’optimisation des coûts logistiques et de satisfaction client.Notre troisième contribution, d’une portée technique et méthodologique plus étendue, aborde la problématique fondamentale du contrôle d’inventaire dans des environnements complexes. Nous développons un système novateur qui intègre l’apprentissage par renforcement multi-agents (MARL) avec des prévisions par quantiles et de la programmation linéaire en nombres entiers mixtes. Cette approche hybride répond aux limitations des modèles traditionnels de gestion des stocks qui reposent souvent sur des hypothèses simplificatrices concernant la distribution de la demande et les structures de coûts. Notre système adresse directement les complexités des environnements de distribution réels : multiples unités de gestion des stocks (Stock Keeping Units, SKUs) avec des profils de demande interdépendants, accords de niveau de service (SLA) hiérarchisés avec différentes exigences de priorité, demandes non-stationnaires et intermittentes, et délais d’approvisionnement dynamiques. Cette architecture permet d’optimiser des fonctions objectifs personnalisées directement alignées sur les priorités opérationnelles : respect des SLAs, minimisation des coûts d’inventaire et réduction des retards de livraison.Pour établir une base comparative rigoureuse, nous avons d’abord développé et optimisé une heuristique sophistiquée incorporant des prévisions par quantiles et une gestion explicite des contraintes multi-SLA. Notre système basé sur l’apprentissage par renforcement démontre une amélioration normalisée de 9% par rapport à cette référence déjà optimisée, réalisée principalement grâce à une réduction de 16% des coûts de détention d’inventaire tout en maintenant les niveaux de service contractuels. Le système excelle particulièrement dans l’équilibrage des objectifs concurrents entre différents niveaux de SLA, les groupes de priorité inférieure bénéficiant d’améliorations dépassant 75% pour certaines métriques, tout en préservant la performance pour les catégories prioritaires. Cette approche représente une avancée significative par rapport aux méthodes traditionnelles car elle permet d’adapter dynamiquement les décisions d’inventaire en fonction des conditions changeantes du marché, sans nécessiter de récalibration manuelle des paramètres comme c’est souvent le cas pour les modèles statiques. Notre travail se distingue en proposant une combinaison judicieuse d’outils méthodologiques, chacun choisi pour ses forces spécifiques face au problème considéré. Pour les décisions d’OFA quotidiennes, nous privilégions la programmation mathématique car ces problèmes présentent des caractéristiques favorables : cadre bien délimité, absence de besoin de mémoire à long terme, et espace d’états relativement restreint (commandes actives et stocks disponibles). À l’inverse, pour le contrôle d’inventaire, l’apprentissage par renforcement s’avère supérieur grâce à sa capacité à incorporer la mémoire des événements passés, à s’adapter aux environnements changeants, et à gérer des espaces d’états volumineux tout en anticipant les conséquences à long terme des décisions actuelles. Cette approche reflète notre conviction qu’il n’existe pas de méthode universelle, mais plutôt un éventail d’outils dont l’efficacité dépend fondamentalement de la structure inhérente au problème traité. Les applications pratiques de nos contributions offrent des bénéfices tangibles aux entreprises confrontées aux défis logistiques contemporains. La méthodologie de consolidation basée sur les règles d’association permet d’optimiser les stratégies de transport et de réduire les coûts opérationnels liés à la livraison, particulièrement dans des contextes où la demande présente une forte variabilité et intermittence. Le modèle WOFR-EC fournit aux centres de distribution un outil permettant de réduire substantiellement les coûts logistiques tout en respectant rigoureusement les niveaux de service établis avec les clients, grâce à l’intégration intelligente de la consolidation spatiale dans les décisions quotidiennes d’allocation des stocks. Quant au système de contrôle d’inventaire basé sur l’apprentissage par renforcement, il constitue une solution complète qui permet d’optimiser simultanément les niveaux de stock, la synchronisation des réapprovisionnements avec la demande anticipée, et l’allocation équilibrée des ressources entre différentes catégories de clients selon leurs priorités contractuelles, le tout en s’adaptant dynamiquement aux fluctuations du marché sans intervention manuelle récurrente. Cette thèse démontre comment l’utilisation ciblée des technologies basées sur les données peut considérablement améliorer l’efficacité opérationnelle de la chaîne d’approvi-sionnement. Les méthodologies développées constituent des outils décisionnels qui répondent aux besoins concrets des entreprises modernes, leur permettant de naviguer avec agilité dans un environnement commercial exigeant. Au-delà des contributions méthodologiques, notre travail ouvre de nouvelles perspectives pour la recherche en logistique, notamment vers le développement de systèmes encore plus intégrés qui orchestrent les différentes composantes de la chaîne d’approvisionnement, et l’exploration de méthodes d’apprentissage hybrides combinant les forces des différentes approches algorithmiques pour résoudre des problèmes logistiques de complexité croissante.

Abstract

In the face of contemporary challenges such as global supply chain disruptions, market volatility, and competitive pressure, companies are actively seeking innovative solutions to optimize their logistics operations. The emergence of data-driven technologies offers new perspectives for addressing logistics problems traditionally approached through classical analytical meth-ods. This thesis aligns with this dynamic by proposing methodologies that intelligently leverage data to create decision-support tools adapted to the complex realities of modern supply chains. Logistics performance relies on the simultaneous optimization of multiple interconnected components forming a coherent system. Our research addresses three major challenges that together determine the overall operational efficiency of the supply chain: freight consolidation, order fulfillment allocation (OFA), and inventory control. For each of these domains, we develop innovative approaches that take advantage of advances in data mining and machine learning, systematically selecting the methodological tool best suited to the specific nature of each problem. Our first contribution presents a novel methodology for freight consolidation based on data mining. Consolidation, the process of grouping multiple small shipments into larger units, represents a key lever for reducing logistics costs. Unlike traditional models that typically rely on aggregated data, our approach exploits association rules to uncover hidden patterns in non-aggregated and intermittent data. This method includes the automatic extraction of association rules, which are then selected based on criteria of spatial proximity and association strength. Applied to a case study on the consolidation of returned products, our methodology outperforms classical optimization approaches, demonstrating a significant reduction in total costs while offering increased flexibility in the face of demand fluctuations. A major advantage of our contribution lies in its ability to efficiently handle large volumes of data without compromising analytical granularity, making the solution particularly relevant for modern logistics environments characterized by data abundance. Our second contribution expands the conceptual framework by integrating spatial consolidation into the order fulfillment allocation (OFA) process. This issue, central in distribution centers, involves determining which orders to prioritize and fulfill when inventory is limited. We develop a multi-objective methodology that balances two often conflicting imperatives: minimizing shipping costs and optimizing the weighted order fill rate (WOFR), a key in-dicator of customer service level adherence. The core innovation of this contribution is a mixed-integer linear programming model—WOFR-EC (Weighted Order Fill Rate Encour-aging Consolidation)—which explicitly incorporates spatial consolidation into its decision-making architecture. This model introduces a penalty mechanism proportional to the number of pickup points visited, thereby encouraging the geographic grouping of deliveries without compromising customer service levels. The methodology also includes an enhanced version of the association rule-based approach from our first contribution, with the addition of an automatic rule selection algorithm. Real-world data experiments demonstrate the effective-ness of our approach: for an equivalent service level, our methodology achieves up to a 21%reduction in the number of delivery stops compared to conventional methods. This contri-bution represents a significant advancement toward integrating the often-conflicting goals of logistics cost optimization and customer satisfaction. Our third contribution, broader in technical and methodological scope, addresses the fun-damental issue of inventory control in complex environments. We develop an innovative system that integrates multi-agent reinforcement learning (MARL) with quantile forecast-ing and mixed-integer linear programming. This hybrid approach addresses the limitations of traditional inventory management models, which often rely on simplifying assumptions regarding demand distribution and cost structures. Our system directly tackles the complex-ities of real-world distribution environments: multiple SKUs with interdependent demand profiles, hierarchical service level agreements (SLAs) with varying priority requirements, non-stationary and intermittent demand, and dynamic lead times. This architecture en-ables the optimization of custom objective functions aligned with operational priorities: SLA compliance, inventory cost minimization, and reduction of delivery delays. To establish a rigorous comparative baseline, we first developed and optimized a sophisticated heuristic incorporating quantile forecasts and explicit multi-SLA constraint management. Our reinforcement learning-based system demonstrates a normalized improvement of 9% over this already optimized reference, achieved primarily through a 16% reduction in inventory holding costs while maintaining contractual service levels. The system excels particularly in balancing competing objectives across different SLA tiers, with lower-priority groups experiencing performance improvements exceeding 75% for certain metrics, all while preserving outcomes for high-priority categories. This approach represents a significant advancement over traditional methods, as it allows inventory decisions to be dynamically adapted to changing market conditions without requiring manual recalibration of parameters, as is often the case with static models. Our work stands out by offering a judicious combination of methodological tools, each chosen for its specific strengths in addressing the problem at hand. For daily OFA decisions, we favor mathematical programming due to the favorable characteristics of these problems: well-defined boundaries, absence of long-term memory requirements, and a relatively limited state space (active orders and available inventory). Conversely, for inventory control, rein-forcement learning proves superior due to its ability to incorporate memory of past events, adapt to changing environments, and manage large state spaces while anticipating the long-term consequences of current decisions. This approach reflects our belief that no universal method exists, but rather a spectrum of tools whose effectiveness fundamentally depends on the inherent structure of the problem being addressed. The practical applications of our contributions offer tangible benefits to companies facing contemporary logistics challenges. The association rule-based consolidation methodology optimizes transportation strategies and reduces operational delivery costs, particularly in contexts where demand is highly variable and intermittent. The WOFR-EC model provides distribution centers with a tool to substantially reduce logistics costs while rigorously meeting established customer service levels, through the intelligent integration of spatial consolida-tion in daily stock allocation decisions. As for the reinforcement learning-based inventory control system, it constitutes a comprehensive solution that simultaneously optimizes stock levels, aligns replenishment timing with forecasted demand, and balances resource allocation across different customer categories according to contractual priorities—all while dynamically adapting to market fluctuations without requiring ongoing manual intervention. This thesis demonstrates how the targeted use of data-driven technologies can significantly enhance the operational efficiency of the supply chain. The developed methodologies consti-tute decision-support tools that address the concrete needs of modern enterprises, enabling them to navigate a demanding commercial environment with agility. Beyond methodological contributions, our work opens new perspectives for logistics research, particularly toward the development of more integrated systems that orchestrate the various components of the supply chain, and the exploration of hybrid learning methods combining the strengths of different algorithmic approaches to solve increasingly complex logistics problems.

Département: Département de mathématiques et de génie industriel
Programme: Doctorat en génie industriel
Directeurs ou directrices: Bruno Agard
URL de PolyPublie: https://publications.polymtl.ca/71010/
Université/École: Polytechnique Montréal
Date du dépôt: 20 févr. 2026 13:41
Dernière modification: 20 févr. 2026 17:52
Citer en APA 7: Aboutalib, Z. (2025). Conception d'outils d'aide à la décision visant à améliorer l'efficacité opérationnelle de la chaîne d'approvisionnement dans un contexte de modernisation technologique [Thèse de doctorat, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/71010/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document