<  Back to the Polytechnique Montréal portal

Optimizing Machine Learning Techniques to Better Understand Sustainability in Transportation Planning

Hamed Naseri

Ph.D. thesis (2023)

[img] Restricted to: Repository staff only until 11 March 2025
Terms of Use: All rights reserved
Show abstract
Hide abstract

Abstract

The transportation sector significantly affects social, environmental, and economic development. This sector is a component in trying to combat climate change as it represents roughly 25% of fossil fuel consumption, a third of global energy consumption, and 23% of worldwide greenhouse gas (GHG) emissions. Hence, it is vital to investigate methods capable of enhancing sustainability in the transportation sector. Previous investigations on travel behavior have mostly used conventional statistical analysis. However, new Artificial Intelligence (AI) approaches exist that could significantly improve the accuracy of such analysis. Nonetheless, these AI techniques have some deficiencies: • Their accuracy is sensitive to inappropriate variables being used in the modeling; • They are often black-box tools and hard to interpret, making it difficult or impossible for policymakers and planners to interpret them; • They are highly sensitive to “hyperparameters” that must be chosen by the analyst/modeler. The conventional techniques for tuning “hyperparameters” (i.e., regularization techniques) can not optimize hyperparameters, and there is no guarantee that they can detect the best values for hyperparameters; • They need additional data observations, called testing data, to evaluate the prediction power of the model, but it is not clear what is the optimal percentage of testing data. To address these issues, this thesis proposes methods to overcome these weaknesses in the context of individual travel behavior choices and how they relate to sustainability. To address the problem of inappropriate variables, a common technique used outside of transportation research in such circumstances is the application of feature selection techniques. However, the application of feature selection techniques has not received much attention in transportation studies. Conventional feature selection techniques cannot obtain the highest prediction accuracy, and most of them cannot present a set of optimal features. Accordingly, first, a new feature selection method is developed to optimize the features employed in prediction models. The results of this study showed that these processes increased model accuracy considerably and avoid presenting inaccurate predictions. Then, machine learning techniques contain some parameters, called hyperparameters, that should be tuned. The performance of machine learning techniques is highly sensitive to these parameters. Therefore, a new method is introduced to tune hyperparameters considering multiple performance indicators using a multi-objective metaheuristic optimization framework. Subsequently, a practical question related to how best to split the training and testing data is examined. A new technique based on a metaheuristic optimization algorithm is developed that automatically determines the split that leads to the greatest prediction accuracy.»

Résumé

Le secteur des transports a une incidence importante sur le développement social, environnemental et économique. Ce secteur est une composante de la lutte contre le changement climatique puisqu'il représente environ 25 % de la consommation d'énergies fossiles, un tiers de la consommation mondiale d'énergie et 23 % des émissions mondiales de gaz à effet de serre (GES). Par conséquent, il est essentiel d'étudier des méthodes capables d'améliorer la durabilité dans le secteur des transports. Par le passé, l'analyse des enquêtes de déplacement a principalement été réalisée à l’aide de méthodes statistiques conventionnelles. Cependant, de nouvelles approches d'intelligence artificielle (IA) permettent aujourd’hui d'améliorer la précision de ces analyses. Néanmoins, ces approches de modélisations et d’analyse par IA présentent certaines lacunes : Leur précision est sensible aux variables inappropriées utilisées dans la modélisation. • Elles sont de type boîte noire, ce qui rend leur interprétation difficile, voire impossible, pour les décideurs et les planificateurs. • Elles sont très sensibles aux « hyperparamètres » qui doivent être choisis par l'analyste/modélisateur. Les techniques conventionnelles de réglage des « hyperparamètres » (c'est-à-dire les techniques de régularisation) ne peuvent pas optimiser les hyperparamètres, et il n'y a aucune garantie qu'elles puissent détecter les meilleures valeurs pour les hyperparamètres. • Elles ont besoin d'observations de données supplémentaires, appelées données de test, pour évaluer la puissance de prédiction du modèle, mais le pourcentage optimal de données de test à utiliser n'est pas clair. Pour résoudre ces problèmes, cette thèse propose des méthodes pour surmonter ces faiblesses dans le contexte des comportements de mobilité des individus et de leur lien avec la durabilité. Une autre question abordée dans la recherche sur les comportements de mobilité est le grand nombre de variables explicatives potentielles (ou caractéristiques) qui sont, peuvent ou ont été prises en compte dans l’analyse des comportements de déplacement. Une technique couramment utilisée dans d’autres domaines de recherche dans de telles circonstances est l'application de techniques de sélection de variables. Cependant, l'application de ces techniques n'a pas reçu beaucoup d'attention dans l’étude des comportements de transport. De plus, les techniques conventionnelles de sélection de variables ne peuvent pas obtenir la précision de prédiction la plus élevée, et la plupart d'entre elles ne peuvent pas présenter un ensemble de variables optimales. Pour pallier ces lacunes, une nouvelle méthode de sélection des variables est développée pour optimiser la sélection de celles employées dans les modèles de prédiction. Ces processus peuvent augmenter considérablement la précision du modèle et éviter de présenter des solutions inexactes.»

Department: Department of Civil, Geological and Mining Engineering
Program: Génie civil
Academic/Research Directors: Owen Waygood and Zachary Patterson
PolyPublie URL: https://publications.polymtl.ca/54849/
Institution: Polytechnique Montréal
Date Deposited: 11 Mar 2024 10:36
Last Modified: 13 Apr 2024 06:11
Cite in APA 7: Naseri, H. (2023). Optimizing Machine Learning Techniques to Better Understand Sustainability in Transportation Planning [Ph.D. thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/54849/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item