Mémoire de maîtrise (2024)
|
Libre accès au plein texte de ce document Conditions d'utilisation: Tous droits réservés Télécharger (1MB) |
Résumé
Les prévisions météorologiques précises restent un enjeu majeur aux applications variées, allant de la planification des activités quotidiennes à l’agriculture en passant par le transport, et la préparation aux catastrophes. Les techniques de prévision traditionnelles, basées sur des méthodes statistiques et des modèles physiques, rencontrent des difficultés à intégrer la complexité inhérente des systèmes atmosphériques, notamment la nature multidimensionnelle, la non-linéarité, et la variabilité régionale. Avec la croissance des données et les avancées des capacités de calcul, les approches d’apprentissage automatique (ML), en particulier l’apprentissage profond (DL), sont de plus en plus explorées pour la prévision météorologique. Cependant, de nombreux modèles de pointe en DL pour la prévision météorologique reposent sur l’agrégation et l’entraînement centralisés des données, ce qui pénalise les régions présentant une rareté de données ou sous-représentées. De plus, étant donné la diversité des types de climat à travers le monde, le modèle peut rencontrer des difficultés d’adaptation à certaines régions. Ainsi, une approche d’apprentissage fédéré (FL), qui permet l’entraînement du modèle sur des sources de données décentralisées tout en respectant la localité et la confidentialité des données, offre une solution prometteuse pour améliorer la précision des prévisions sans agrégation centralisée des données. Cette recherche se penche sur l’utilisation de l’apprentissage fédéré pour améliorer les prévisions météorologiques à travers un modèle distribué respectant la nature décentralisée des données météorologiques collectées dans diverses régions géographiques. Plus précisément, nous examinons et comparons plusieurs méthodes d’agrégation FL, incluant FedAvg, Fed- Prox, et SCAFFOLD, pour déterminer laquelle capture le mieux les variations atmosphériques régionales essentielles pour des prévisions précises. L’objectif principal est d’améliorer les prévisions des variables atmosphériques proches de la surface, en utilisant un ensemble de données hétérogène couvrant trois régions distinctes : l’hémisphère Nord, les tropiques et l’hémisphère Sud. Nous visons à établir un cadre capable d’améliorer les prévisions météorologiques à court et moyen termes en mettant l’accent sur la capacité du modèle à capturer les variations régionales et en adaptant les stratégies d’agrégation pour optimiser les performances dans différentes régions geographiques. Pour évaluer la performance de chaque méthode d’agrégation, nous utilisons le coefficient de corrélation des anomalies (ACC) et l’erreur quadratique moyenne (RMSE). Le RMSE fournit une mesure de la précision absolue des prévisions, tandis que l’ACC évalue la capacité du modèle à capturer les motifs d’anomalies par rapport à la climatologie. En nous concentrant sur ces métriques, nous visons à quantifier à la fois la précision des prévisions et la capacité du modèle à prédire les écarts par rapport aux conditions climatiques normales, une compétence essentielle pour anticiper les événements extrêmes et les anomalies climatiques. De plus, nous appliquons ces métriques pour évaluer la robustesse du modèle sur des intervalles de prévision étendus, en analysant le comportement du modèle non seulement pour des prévisions immédiates (à t+Δt) mais aussi pour des prévisions à plusieurs étapes (jusqu’à t+2Δt), ce qui est essentiel pour les applications pratiques de la prévision météorologique. Nos résultats indiquent que certaines techniques d’agrégation surpassent l’approche standard FedAvg, en particulier dans les régions avec une forte hétérogénéité des données, comme les tropiques. SCAFFOLD, avec son mécanisme de correction pour gérer la dérive des clients, montre des améliorations considérables en termes de vitesse de convergence et de précision des prévisions dans les distributions de données non-IID, tandis que les stratégies d’agrégation personnalisées donnent les meilleurs résultats dans les régions présentant des comportements atmosphériques uniques comme dans les tropiques. Ces résultats montrent que l’apprentissage fédéré aide le modèle à mieux s’adapter aux données hors distribution (par exemple, les changements soudains) en raison, par exemple, du changement climatique. En résumé, cette étude contribue à la littérature croissante à l’intersection de l’apprentissage fédéré et de la prévision météorologique en répondant aux principaux défis de confidentialité des données, d’hétérogénéité régionale, et d’efficacité computationnelle. En améliorant les méthodologies d’apprentissage fédéré pour la prévision météorologique décentralisée, ce travail ouvre la voie à l’utilisation de modèles de prévision précis et respectueux de la confidentialité, capables d’opérer à travers des stations météorologiques distribuées ou des agences météorologiques locales sans compromettre la propriété des données. Les méthodes et résultats présentés ici non seulement soutiennent l’amélioration des prévisions météorologiques, mais offrent également une perspective pour des applications plus larges de l’apprentissage fédéré dans les sciences environnementales, où les données décentralisées et la coopération interrégionale sont primordiales.
Abstract
Accurate weather forecasting remains a crucial endeavor with widespread applications, from daily human activity planning to risk management in agriculture, transportation, and disaster preparedness. Traditional forecasting techniques, which have relied on statistical methods and physics-based models, face challenges in accounting for the inherent complexities of atmospheric systems, such as high-dimensional data, non-linearity, and regional variability. With the surge in big data and advancements in computational capabilities, machine learning (ML) approaches—particularly deep learning (DL)—have gained increasing attention for weather prediction. However, many state-of-the-art DL models for weather forecasting rely on centralized data aggregation and training, penalizing regions with data sparsity and underrepresented regions. Also, given the diversity of climate types across the world, the model could struggle to adapt to some regions. Consequently, a federated learning (FL) approach, which enables model training on distributed data sources while preserving data locality and privacy, offers a promising solution to enhance forecast accuracy without central data aggregation. This research focuses on leveraging federated learning to enhance weather forecasting through a distributed model that respects the decentralized nature of weather data collected across various geographic regions. Specifically, we investigate and compare multiple FL aggregation methods, including FedAvg, FedProx, and SCAFFOLD, to determine which method best captures regional atmospheric variations critical for accurate forecasting. The primary objective is to improve the forecasting of near-surface atmospheric variables, using a heterogeneous data setup spanning three distinct regions: Northern Hemisphere, Tropics, and Southern Hemisphere. By emphasizing the model’s ability to catch regional variations and adjusting aggregation strategies to optimize performance across distinct atmospheric zones, we aim to define a framework that could enhance both short and medium-term weather predictions. To evaluate the performance of each aggregation method, we employ several metrics, the Anomaly Correlation Coefficient (ACC) and the Root Mean Squared Error (RMSE). RMSE provides a measure of absolute forecast accuracy, while ACC assesses the model’s skill in capturing anomaly patterns relative to climatology. By focusing on these metrics, we aim to quantify both the forecast accuracy and the model’s ability to predict variations from normal weather patterns, an essential capability for anticipating extreme events and climate anomalies. Additionally, we apply these metrics to evaluate the model’s robustness over extended forecast intervals, analyzing the model’s behavior not only in immediate predictions (at t+Δt) but also in multi-step forecasts (up to t+2Δt), a crucial requirement for practical weather forecasting applications. Our findings indicate that certain aggregation techniques outperform the standard FedAvg approach, particularly in regions with high data heterogeneity, such as the tropics. SCAFFOLD, with its correction mechanism to handle client drift, shows significant improvements in forecast accuracy across non-IID data distributions, while personalized aggregation strategies yield the best results in regions with unique atmospheric behaviors such as the tropics. These results demonstrate that federated learning helps the model to better adapt to out-ofdistribution (i.e., sudden change) data due to climate change for example. In summary, this thesis contributes to the growing body of research at the intersection of FL and weather forecasting by addressing key challenges of data privacy, regional heterogeneity, and computational efficiency. By advancing FL methodologies for decentralized weather forecasting, this work opens avenues for deploying accurate, privacy-preserving forecasting models that can operate across distributed weather stations or local meteorological agencies without compromising data ownership. The methods and results presented here not only support enhanced weather forecasting but also provide a pathway for broader applications of FL in environmental sciences, where decentralized data and cross-regional cooperation are paramount.
| Département: | Département de génie informatique et génie logiciel |
|---|---|
| Programme: | Génie informatique |
| Directeurs ou directrices: |
Foutse Khomh |
| URL de PolyPublie: | https://publications.polymtl.ca/61856/ |
| Université/École: | Polytechnique Montréal |
| Date du dépôt: | 16 juin 2025 15:26 |
| Dernière modification: | 30 juil. 2025 19:35 |
| Citer en APA 7: | Nanda Assobjio, B. Y. (2024). Towards Using Federated Learning to Improve Generalization in Weather Forecasting [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/61856/ |
|---|---|
Statistiques
Total des téléchargements à partir de PolyPublie
Téléchargements par année
Provenance des téléchargements
