<  Retour au portail Polytechnique Montréal

Game-Theoretic Client Selection Mechanisms for Fairness, Incentives, and Security in Federated Learning with Non-IID Data

Sarhad Arisdakessian

Thèse de doctorat (2025)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (3MB)
Afficher le résumé
Cacher le résumé

Résumé

L’apprentissage fédéré (FL) s’est imposé comme un paradigme prometteur permettant l’entraînement collaboratif de modèles de machine learning à travers des silos de données décentralisés, offrant aux organisations la possibilité de bénéficier d’une intelligence collective tout en préservant la confidentialité des données. Malgré ce potentiel, l’efficacité et la durabilité du FL dans des déploiements réels restent limitées par plusieurs défis critiques. Ceux-ci incluent la participation peu fiable ou malhonnête des clients, les déséquilibres en matière de ressources disponibles, l’absence de mécanismes d’incitation transparents, ainsi que des hypothèses irréalistes concernant la distribution des données. Cette thèse s’attaque à ces limitations au moyen de quatre cadres indépendants mais complémentaires, chacun abordant une dimension particulière de l’écosystème FL : la gestion de la confiance, l’inclusivité fondée sur les coalitions, les marchés incitatifs compatibles, et le benchmarking réaliste. Plusieurs de ces cadres s’appuient sur des modèles de théorie des jeux, notamment les jeux de coalition, de Stackelberg et les enchères inversées. Le premier cadre introduit un mécanisme de sélection des clients fondé sur la confiance, modélisé à travers le prisme des jeux de coalition et des jeux hédoniques. Dans ce contexte, les clients forment implicitement des coalitions avec l’agrégateur, où la valeur de l’adhésion dépend à la fois de la fiabilité individuelle (confiance objective) et de la perception de la fiabilité des pairs (confiance subjective). En combinant un suivi basé sur les ressources avec des préférences guidées par la réputation, ce cadre capture la nature hédonique de la formation des coalitions : les clients préfèrent participer lorsqu’ils sont regroupés avec des pairs fiables, tandis que les participants malhonnêtes ou de faible qualité sont exclus. Cette interprétation par la théorie des jeux met en évidence la manière dont des coalitions stables peuvent être soutenues par les dynamiques de confiance, réduisant ainsi l’impact des passagers clandestins. Les expériences montrent que l’intégration d’un raisonnement coalitionnel fondé sur la confiance améliore non seulement la convergence, mais renforce également l’équité et la robustesse dans des conditions hétérogènes et adversariales. Le deuxième cadre, StackFed, traite les inégalités structurelles dans la participation des clients. Dans de nombreux systèmes FL, les clients limités en ressources sont marginalisés, ce qui restreint à la fois l’inclusivité et la diversité des données contribuant à l’entraînement. Pour contrer ce phénomène, StackFed emploie une approche de jeu de Stackelberg, dans laquelle des clients riches en ressources jouent le rôle de leaders et forment des coalitions avec des clients plus faibles, dits suiveurs. Les leaders définissent les conditions de coalivi tion, tandis que les suiveurs choisissent stratégiquement leurs alignements, créant ainsi des coalitions stables de type leader–suiveur qui démocratisent l’accès à l’entraînement. Cette conception favorise l’équité en évitant l’exclusion des clients faibles et améliore l’efficacité de l’apprentissage en équilibrant les charges computationnelles. Les résultats expérimentaux montrent que StackFed accroît non seulement l’inclusivité, mais améliore aussi la capacité de généralisation en intégrant les données de clients qui seraient autrement sous-utilisés. Le troisième cadre présente une architecture de marché pour l’apprentissage fédéré, qui formalise les interactions économiques entre les Propriétaires de Tâches, les Propriétaires de Réseau et les Clients. Dans ce modèle, les Propriétaires de Tâches définissent les exigences des modèles ainsi que les budgets, les Propriétaires de Réseau orchestrent l’entraînement, et les Clients entrent en compétition pour contribuer aux mises à jour. Le marché emploie des mécanismes d’enchères inversées pour allouer les tâches et intègre un système de réputation dynamique afin d’assurer une responsabilité à long terme. Les Clients sont récompensés proportionnellement à la qualité de leur contribution, les Propriétaires de Tâches bénéficient de mises à jour fiables et rentables, et les Propriétaires de Réseau soutiennent leurs opérations grâce à des commissions équitables. Ce cadre montre comment les dimensions économiques et techniques peuvent être unifiées pour garantir la durabilité. Les expériences valident que ce marché atteint une meilleure efficacité et une plus grande équité comparé à des systèmes d’incitation ad hoc, tout en décourageant la participation malhonnête ou à faible effort. Enfin, le quatrième cadre propose une stratégie de partitionnement hiérarchique basée sur Dirichlet à deux niveaux, sensible aux caractéristiques, pour le benchmarking des distributions non-IID. Les méthodes de partitionnement traditionnelles échouent souvent à capturer l’hétérogénéité complexe des ensembles de données réels, limitant ainsi la validité externe des expériences FL. La méthode proposée introduit deux niveaux de contrôle distributionnel : (i) un Dirichlet au niveau des clusters, qui partitionne les données en fonction de regroupements de caractéristiques latentes, et (ii) un Dirichlet au niveau des classes, qui régule l’allocation des étiquettes au sein des clusters. Cette approche hiérarchique génère des ensembles de données clients à la fois synthétiques et réalistes, reflétant à la fois la rareté inter-clients et l’asymétrie intra-client. En s’appuyant sur ce cadre de benchmarking, les chercheurs peuvent tester plus précisément les algorithmes FL dans des conditions reflétant l’hétérogénéité réelle. Les expériences sur divers ensembles de données montrent que le Dirichlet à deux niveaux reproduit mieux le caractère non-IID du monde réel que le partitionnement Dirichlet classique à un seul niveau. Pris ensemble, ces cadres font progresser l’apprentissage fédéré selon quatre dimensions : la confiance, l’inclusivité, l’alignement incitatif et le réalisme. Bien que chaque contribution ait une valeur indépendante, elles forment collectivement une feuille de route pour surmonter les vii principales limitations du FL. La thèse démontre qu’en s’attaquant à ces défis systémiques, le FL peut évoluer d’un concept prometteur à un paradigme pratique et durable.

Abstract

Federated learning (FL) has emerged as a promising paradigm for enabling collaborative machine learning across decentralized data silos, allowing organizations to benefit from collective intelligence while preserving data privacy. Despite this potential, the effectiveness and sustainability of FL deployments remain constrained by critical challenges. These include unreliable or dishonest client participation, imbalances in resource availability, and the absence of transparent incentive mechanisms. This thesis tackles these limitations through four independent but complementary frameworks, each addressing a distinct dimension of the FL ecosystem: trust management, coalition-based inclusivity, incentive-compatible marketplaces, and realistic benchmarking. Several of these frameworks are grounded in gametheoretic models, including coalitional, Stackelberg, and reverse auction games. The first framework introduces a trust-aware client selection mechanism modeled through the lens of coalitional and hedonic games. In this setting, clients implicitly form coalitions with the aggregator, where the value of joining a coalition depends both on individual trustworthiness (objective trust) and the perceived reliability of peers (subjective trust). By blending resource-based monitoring with reputation-driven preferences, the framework captures the hedonic nature of coalition formation: clients prefer to participate when they are grouped with trusted peers, while low-quality participants are excluded. This game-theoretic interpretation highlights how stable coalitions can be sustained through trust dynamics, mitigating the impact of selfish clients. Experiments demonstrate that incorporating such trust-aware coalitional reasoning, not only improves convergence but also enhances fairness during the FL process. The second framework addresses the structural inequalities in client participation. In many FL systems, resource-constrained clients are marginalized, limiting both the inclusivity and the diversity of contributed data. To counter this, the approach employs a Stackelberg gametheoretic approach, in which resource-rich leader clients form coalitions with less-resourceful follower clients. Leaders set coalition terms, while followers strategically choose alignments, creating stable leader–follower coalitions that democratize access to training epochs or training process. This design improves fairness by ensuring less-resourceful clients are not excluded, while also improving learning efficiency. Experimental results show that the proposed approach not only enhances inclusivity but also leads to stronger generalization performance by incorporating data from clients who would otherwise remain underutilized. The third framework presents a federated learning marketplace architecture that formalizes ix economic interactions among different stakeholders. In this setting, Task Owners specify model requirements and budgets, Network Owners orchestrate training, and Clients compete to contribute updates. The marketplace employs reverse auction mechanisms to allocate tasks and integrates a dynamic reputation system to ensure long-term accountability. Clients are rewarded for their contribution, Task Owners receive cost-effective and reliable updates, and Network Owners sustain operations through fair commissions. This framework demonstrates how economic and technical dimensions can be unified to ensure sustainability. Experiments validate that the marketplace achieves higher efficiency and fairness compared to ad hoc incentive schemes, while discouraging dishonest or low-effort participation. Finally, the fourth framework contributes a feature-aware two-level Dirichlet partitioning strategy for benchmarking non-IID data distributions. Traditional partitioning methods often fail to capture the complex heterogeneity of real-world datasets, limiting the external validity of FL experiments. The proposed method introduces two levels of distributional control: (i) a cluster-level Dirichlet that partitions data by latent feature clusters, and (ii) a class-level Dirichlet that governs the allocation of labels within clusters. This hierarchical approach generates synthetic yet realistic client datasets that reflect both inter-client sparsity and intra-client skewness. By benchmarking against this framework, researchers can more accurately stress-test FL algorithms under conditions that mirror real-world heterogeneity. Experiments across datasets highlight that the two-level Dirichlet produces distributions that better capture non-IIDness compared to single-level Dirichlet partitioning. Together, these frameworks advance federated learning along the dimensions of trust, inclusivity, incentive alignment, democratization, and realism. While each contribution stands independently, together they form a holistic agenda for overcoming limitations in FL. The thesis demonstrates that by addressing such systemic challenges, FL can evolve into a practical and sustainable paradigm.

Département: Département de génie informatique et génie logiciel
Programme: génie informatique
Directeurs ou directrices: Omar Abdul Wahab
URL de PolyPublie: https://publications.polymtl.ca/71046/
Université/École: Polytechnique Montréal
Date du dépôt: 20 févr. 2026 13:42
Dernière modification: 20 févr. 2026 13:42
Citer en APA 7: Arisdakessian, S. (2025). Game-Theoretic Client Selection Mechanisms for Fairness, Incentives, and Security in Federated Learning with Non-IID Data [Thèse de doctorat, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/71046/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document