<  Retour au portail Polytechnique Montréal

Estimation des coûts de constructions de routes en utilisant l'apprentissage automatique explicable

Rosanne Larocque

Mémoire de maîtrise (2022)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (1MB)
Afficher le résumé
Cacher le résumé

Résumé

L'estimation préalable des coûts est une étape cruciale lors de la réalisation d'un projet de construction d'infrastructures de transports. Une estimation de qualité assure une meilleure planification de projet, une gestion des fonds adéquate et une prise de décision éclairée. En effet, il est commun de sélectionner une solution à un projet routier via la publication d'appels d'offres. Généralement, un projet regroupe différentes tâches et un appel d'offres sera émis pour chacune d'entre elles. Une compétition émerge entre les différents soumissionnaires. Cette compétition étant publique, elle peut potentiellement influencer les coûts suggérés. Ainsi, avant toute prise de décision, les chargés de projet doivent anticiper le coût raisonnable attendu pour un certain appel d'offres. Si le coût suggéré par les soumissionnaires est estimé à la baisse, le service offert risque d'être d'une qualité médiocre. À l'inverse, un coût surestimé se traduirait par une mauvaise gestion des fonds publics. Bref, on cherche à accepter un prix qui serait des plus justes. Les chargés de projet doivent également justifier leur choix de soumissionnaire de manière objective et compréhensible. Offrir une estimation préalable des coûts claire et justifiée représente un défi pour ces derniers. Au ministère des Transports du Québec, l'approche utilisée combine une analyse statistique des coûts historiques et l'avis d'experts en estimation. Or, le Vérificateur Général du Québec a soulevé des doutes quant à l'exactitude de ces estimations. De plus, ce dernier soulève son manque de transparence. Des approches plus modernes utilisent l'intelligence artificielle pour accomplir cette même tâche. Plus particulièrement, l'apprentissage automatique supervisé est fort utile pour faire de telles prédictions en présence de données numériques historiques. Toutefois, la conception d'un modèle d'apprentissage automatique étant à la fois performant et explicable est un défi dans l'état de l'art. Un autre défi lié à l'utilisation de l'apprentissage automatique est qu'un modèle entraîné à prédire les coûts pour une tâche en particulier ne sera pas forcément approprié pour une tâche tierce. La solution proposée affronte ces différents défis. D'abord, ce mémoire propose un pipeline d'optimisation de la performance des modèles d'apprentissage automatique. Les premières étapes de ce pipeline visent à améliorer la qualité des données en vue de son utilisation avec le modèle étudié. Pour ce faire, on propose différentes techniques de mise à l'échelle des données, on procède à une sélection de variables rigoureuse via un algorithme d'élimination récursive des variables et on effectue une détection automatique des valeurs aberrantes. L'étape finale du pipeline d'optimisation permet de sélectionner les meilleurs hyperparamètres du modèle. Au travers de ce processus, chaque étape valide sa configuration à l'aide d'une validation croisée adaptée à notre problème.

Abstract

Preliminary cost estimation is a predominant factor for the success of a road construction project. It supports the project planning, proper funds management and the decision-making process. The decision-making process usually goes by independent calls for tenders for each sub-task associated with a project. From this call emerges a competition between the various subcontractors. This competition being public, it impacts the price suggested by the several submissions. Prior to making a decision, project planners need to anticipate the fair price expected for a project. If the price given is too low, we risk having poor quality of service. Conversely, we risk paying an unnecessary amount if prices are higher than expected. Moreover, project planners need to justify their acceptance of a certain bidder to stakeholders in an objective and clear manner. This transparency is paramount to avoid illegal collusion. It also helps to identify the most influential factors in a project's cost. Having an estimation that is both of quality and transparent is a challenge for a project executive. In Quebec's Ministry of Transportation (MTQ), the task is carried out by a combination of an analysis of historical cost and expert knowledge. The latter method was however the object of doubts and questions regarding both its transparency and its correctness by the Auditor General of Quebec. A modern approach is to use a model based on artificial intelligence, and more precisely supervised learning. Having a supervised learning model that is both explainable and precise is nonetheless a challenge in literature. Another challenge is that a model trained to forecast cost for a specific sub-task may not be suitable for another sub-task. Our approach tackles those challenges. First, we propose a full pipeline for optimizing performance of six machine learning models (decision tree, random forest, XGBoost, CatBoost, neural networks, and ensemble voters). The pipeline presents methods for enhancing data quality. In particular, we use scaling techniques, rigorous feature selection through the algorithm of recursive feature elimination and automatic outliers' detection. Besides, the final step of the pipeline ensures an optimal configuration of the model by tuning hyperparameters. Throughout this process, the quality of the model is ensured using a customized cross-validation based technique. Each one of the six models is independently trained and optimized for each sub-task of the experiment. Second, we use a method based on Shapley Additive Explanations to justify any of the prediction made by our models. Two types of visual explanations are provided. The first one describes the impact that each feature had for a specific estimation. The second one compares the impact of the features with one another among all the predictions.

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Quentin Cappart
URL de PolyPublie: https://publications.polymtl.ca/10502/
Université/École: Polytechnique Montréal
Date du dépôt: 06 févr. 2023 14:48
Dernière modification: 08 avr. 2024 10:23
Citer en APA 7: Larocque, R. (2022). Estimation des coûts de constructions de routes en utilisant l'apprentissage automatique explicable [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10502/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document