<  Back to the Polytechnique Montréal portal

Regroupement par algorithme hiérarchique et k-means des profils d'usage des bornes de recharge publiques de véhicules électrique et analyse des facteurs d'usage liés à leur environnement

Ismail Zejli

Master's thesis (2021)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (6MB)
Show abstract
Hide abstract

Abstract

Concerns over the increasing levels of CO2 emissions has led countries to meet every year for the Conference of the Parties (COP) to discuss problems and solutions to save our planet. While agreements have been signed to push countries to reduce their carbon footprint such as the Paris agreement, countries' approach to abide by them have differed. A similar approach followed by many has however been to encourage the adoption of Electric Vehicles (EVs) by their population as the transportation sector represents 14% of the global greenhouse emissions. While in many countries, government incentives, technological advancement, and the growing offer of EVs have led to a spike in EV sales, their growing adoption has introduced many challenges that need to be tackled. Of the many challenges is the efficient planning and operation of Electric Vehicle Charging Stations (EVCSs). Indeed, the inconsideration of the infrastructure for EV charging represents not only a barrier to the consistent growth of EV sales but also a concern for electricity providers and EVCS operators. On one hand, lack of an optimal deployment of EVCSs in the roads can lead to a spike in EV users' range anxiety and fear of finding no available EVCS or having to wait long hours for one to become available. This in turn can dissuade many from switching to the use of an EV. On the other hand, operators need to be aware of the demand of installed and potential EVCSs to ensure profit from their installation and maintenance investments. Similarly, electricity providers' access to this information can be crucial for better investment on the power grid and to prevent peak loads through services like vehicle-to-grid (V2G). Many articles have already been presented in the literature covering these challenges and offering different approaches to tackle them. However, only a few have used historical data to better represent the demand for EVCSs, whereas many have sought to simulate the demand through vehicle traffic. The present research seeks to use historical data on the use of EVCSs in the city of Montreal to better understand the demand and offer more reliable insight on their use. This data is leveraged in a two-stage approach used to not only analyze the use of EVCSs but also understand external factors most relevant in predicting their demand profiles. The results are then used to better advise operators and electricity providers on the demand profile of currently installed EVCSs and of different potential locations. The two-stage approach sets itself apart from other articles not just by the analysis done but also by the methods it uses. First, each EVCS is represented by a set of its daily connection profiles from all its ports' data between 2019 to 2020. These are 24-hour sequences for which a 1 is set to a specific hour if a vehicle is connected to the EVCS and 0 otherwise. This data is then first used in a hierarchical clustering algorithm using the Dynamic Time Warping (DTW) distance to not only better understand how diverse the connection profiles of the di˙erent EVCSs are but also to reduce the number of profiles analyzed in the next step. Using the centroids produced in the previous section, another hierarchical clustering algorithm using the DTW distance is executed to compare the profiles of the di˙erent EVCSs. Finally, a KNN classification model is used to predict the profiles of the di˙erent EVCSs given input data such as points of interests at most 500 meters away from the station and socio-economic data on the population living close to the EVCS. Various conclusions were made through the di˙erent steps followed. First, EVCSs' connec-tion profiles are very diverse leading to the idea that their use is very stochastic and can be thought of as hard to predict. This observation was made through the clustering of individual profiles which resulted in a very high number of optimal clusters in certain cases. Moreover, clustering profiles all together showed that there exists a high proportion (41%) of daily connection profiles for which no use is recorded during the day. Other clusters on the other hand, particularly those for which a connection is recorded between 8am and 3pm (19%), and in the afternoon and at night have very high proportions amongst other profiles. Associating the different clusters to EVCSs' daily profiles showed that unpopular clusters were prominent in isolated stations located in the airport for instance. Finally, the SHAP analysis completed on the k-NN classification model showed that points of interests were most relevant in predicting the connection profiles of and EVCS. More specifically, locations offering financial, transportation and educational services as well as places of worship and arts and entertainment venues had the greatest impact on the final model. The SHAP analysis however also showed that attributes' relevance di˙ered depending on the connection profile of the EVCS.

Résumé

Le réchauffement climatique représentant un danger important pour la protection des générations à venir, plusieurs initiatives ont été lancées pour réduire l'émission de gaz à effet de serre. L'une de ces initiatives a été la promotion de l'adoption des véhicules éclectiques (VEs) par la population puisque le transport terrestre représente plus de 14% des émissions de CO2 dans le monde. L'introduction et le développement rapide des véhicules électriques a cependant introduit plusieurs défis. Parmi ces défis figure le problème du déploiement et de gestion des bornes de recharge de véhicules électriques (BRVEs) dans nos routes. En effet, les BRVEs représentent non seulement une barrière pour la vente exponentielle de VEs mais aussi un aspect important à considérer dans la gestion du réseau électrique. En premier lieu, l'angoisse liée à l'autonomie des VEs étant une préoccupation majeure chez les propriétaires de VEs, le manque ou l'expansion inefficace des BRVEs pourrait mener à un ralentissement des ventes de VEs. Cette angoisse est non seulement liée à la crainte de ne pas trouver de BRVEs à proximité où recharger, mais aussi qu'elles soient toutes occupé ou que l'attente soit trop longue pour qu'une devienne disponible. En deuxième lieu, les BRVEs présentent un défi majeur chez les opérateurs qui doivent assurer une demande constante pour maintenir un profit étant donné leur investissement important lors de l'installation et la maintenance des BRVEs. Enfin, les distributeurs d'électricité doivent prendre en compte l'utilisation des BRVEs installées et potentielles pour non seulement mieux planifier l'expansion et l'investissement sur le réseau électrique mais aussi pour prévenir des charges de pointe. Plusieurs études ont déjà été menées pour non seulement optimiser la planification des BRVEs mais aussi leur opération. Peu d'articles ont cependant exploité les données pour développer leur solution en raison du manque de base de données libres d'accès. Cette recherche se sert donc de données récupérées d'Hydro-Québec pour développer une approche à deux étapes qui a pour but de non seulement analyser l'utilisation des BRVEs installées mais aussi d'étudier les facteurs externes pertinents qui affectent l'utilisation des BRVEs. Cette approche vise principalement à conseiller les opérateurs sur l'utilisation des bornes déjà installées et potentielles. L'approche utilisée se démarque d'autres articles par sa structure et ses méthodes employées. En premier lieu, chaque BRVE est représentée par tous ses profils de connexion journalier datant de 2019 à 2020. Ces profils de connexion sont représentatifs de l'utilisation des BRVEs dans une période de 24 heures où une valeur de 1 est représentative d'une utilisation de la borne et 0, de la disponibilité de la borne. Ensuite, les profils de connexion journalier de chaque borne sont regroupés grâce à un algorithme de regroupement hiérarchique en utilisant la mesure de distance Dynamic Time Warping (DTW). Le regroupement est exécuté de façon à préserver la granularité des données et donc de sorte à généraliser le moins possible les profils de connexion des bornes. Cette étape sert principalement à étudier la diversité des profils de connexion des différentes stations ainsi que de réduire le nombre de profils de connexion à étudier pour la prochaine étape. En effet, les centroïdes générés par cette étape sont ensuite utilisés pour pouvoir comparer les profils de connexion de toutes les BRVEs. Pour compléter cette étape, un regroupement hiérarchique utilisant le DTW est utilisé pour regrouper les centroïdes de manière à produire le moins de regroupements possible. Cette étape permet non seulement de comparer les stations mais aussi d'offrir une analyse complète sur les profils de connexion types observés dans les BRVEs de l'île de Montréal. Enfin, ces résultats sont utilisés pour le développement d'un modèle KNN de classification permettant de comprendre la pertinence d'attributs sur l'utilisation des BRVEs à partir d'une analyse SHAP. Plus précisément, des attributs tels que les points d'intérêts avoisinant les BRVEs et le profil socio-économique de la population autour des BRVEs sont évaluées. Plusieurs conclusions ont pu être tirées de ces étapes. En premier lieu, le regroupement des profils de connexion de chaque borne a permis de mieux comprendre la diversité de l'usage des bornes. D'un côté, l'hypothèse que l'âge de la borne pourrait avoir un impact sur la variété des profils a été rejeté, cependant il existe une légère corrélation entre le nombre de jour où la borne a été utilisée et la variété de ses profils de connexion. En deuxième lieu, l'étude des profils de connexion de toutes les bornes a présenté plusieurs résultats sur le profil de connexion général des différentes bornes. D'un côté, plus de 41% des profils de toutes les bornes considérées représente une utilisation nulle durant toute la journée. D'un autre côté, les autres profils généraux de connexion journaliers les plus populaires sont ceux pour lesquels l'utilisation est répandue durant la journée (entre 8h et 15h), et l'après-midi et le soir. Une étude plus accrue sur les proportions des profils généraux de connexion des différentes bornes a ensuite révélé que certains profils de connexion sont plus populaires dans certaines régions, tels que l'aéroport, que d'autres. Enfin, le modèle de classification a démontré que les attributs les plus important pour l'explication des profils de connexion d'une borne sont la proximité de la borne à des services financiers, des stations de métro ou de location de bicyclette, des endroits religieux et des endroits de divertissement et d'arts, parmi plusieurs autres attributs. L'analyse SHAP a aussi démontré que l'importance des attributs diffère selon le profil d'usage de la borne.

Department: Department of Mathematics and Industrial Engineering
Program: Maîtrise recherche en mathématiques appliquées
Academic/Research Directors: Hanane Dagdougui and Martin Trépanier
PolyPublie URL: https://publications.polymtl.ca/9914/
Institution: Polytechnique Montréal
Date Deposited: 25 Apr 2022 15:22
Last Modified: 27 Apr 2023 21:47
Cite in APA 7: Zejli, I. (2021). Regroupement par algorithme hiérarchique et k-means des profils d'usage des bornes de recharge publiques de véhicules électrique et analyse des facteurs d'usage liés à leur environnement [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/9914/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item