Mémoire de maîtrise (2025)
|
Libre accès au plein texte de ce document Conditions d'utilisation: Tous droits réservés Télécharger (3MB) |
Résumé
À l’heure actuelle, le diagnostic et le suivi de la progression de nombreuses maladies neurodégénératives représentent un défi médical majeur, largement attribuable à l’absence de biomarqueurs fiables. L’identification de nouveaux biomarqueurs repose majoritairement sur de longues et coûteuses expériences en laboratoire. Ces expériences, qui visent à quantifier la phosphorylation des acides aminés au sein des protéines, pourraient être optimisées. Les approches computationnelles offrent une solution prometteuse en permettant de cibler en amont les acides aminés les plus susceptibles d’être phosphorylés, guidant ainsi plus efficacement la recherche expérimentale et réduisant les ressources consacrées à l’étude de biomarqueurs à faible potentiel. Dans ce contexte, l’objectif principal de ce mémoire est de développer un modèle de prédiction de la phosphorylation d’acides aminés à la fois plus performant que les approches existantes et offrant un meilleur niveau d’interprétabilité, un critère fondamental pour son adoption par la communauté scientifique. Pour atteindre notre objectif, nous avons adopté une approche systématique d’apprentissage machine, au sein de laquelle nous avons intégré trois contributions originales visant à surmonter les limitations des modèles actuels. Premièrement, nous avons développé une méthode de modélisation tridimensionnelle robuste qui caractérise plus finement l’environnement spatial des sites de phosphorylation. Deuxièmement, nous avons conçu une stratégie d’échantillon-nage novatrice pour adresser à la fois le fort déséquilibre des classes et l’incertitude inhérente aux données disponibles. Finalement, nous avons mis au point une méthode de sélection de variables qui explore efficacement l’espace des caractéristiques pour identifier les combinai-sons les plus performantes, tout en conservant une interprétabilité biologique. L’intégration de ces contributions a mené à la création d’un modèle final dont les performances surpassent celles des modèles de référence recensés dans la littérature. Pour valider notre approche sur un cas concret, nous avons appliqué le modèle à l’identification de biomarqueurs potentiels pour la maladie de Huntington, une maladie neurodégénérative pour laquelle notre participation à une étude scientifique connexe a motivé notre choix. Cette application a permis de générer une liste hiérarchisée d’acides aminés de la protéine tau, offrant des cibles prioritaires pour de futures investigations expérimentales et illustrant le potentiel de notre outil pour accélérer la découverte de biomarqueurs.
Abstract
At present, diagnosing and monitoring the progression of many neurodegenerative diseases represents a major medical challenge, largely due to the lack of reliable biomarkers. The identification of new biomarkers relies mainly on long and costly laboratory experiments. These experiments, which aim to quantify the phosphorylation of amino acids within proteins, could be optimized. Computational approaches offer a promising solution by enabling upstream targeting of the amino acids most likely to be phosphorylated, thus guiding experimental research more effectively and reducing the resources devoted to studying biomarkers with low potential. In this context, the main aim of this thesis is to develop a phosphorylation prediction model that not only outperforms existing approaches, but also offers a better level of interpretability, a fundamental criterion for its adoption by the scientific community. To achieve our goal, we have adopted a systematic machine learning approach, within which we have integrated three original contributions aimed at overcoming the limitations of current models. Firstly, we developed a robust three-dimensional modeling method that more finely characterizes the spatial environment of phosphorylation sites. Secondly, we designed an innovative sampling strategy to address both the strong class imbalance and the uncertainty inherent in the available data. Finally, we developed a variable selection method that intelligently explores the feature space to identify the best performing combinations, while retaining biological interpretability. The integration of these contributions has led to the creation of a final model whose performance surpasses that of reference models in the literature. To demonstrate the practical usefulness of our approach, we applied this model to the identification of potential biomarkers for Huntington’s disease, a neurodegenerative disorder for which our participation in a related scientific study motivated this choice. This application generated a hierarchical list of amino acids in the tau protein, offering priority targets for future experimental investigations and illustrating the potential of our tool to accelerate biomarker discovery.
| Département: | Département de mathématiques et de génie industriel |
|---|---|
| Programme: | Maîtrise recherche en mathématiques appliquées |
| Directeurs ou directrices: |
Richard Labib |
| URL de PolyPublie: | https://publications.polymtl.ca/68170/ |
| Université/École: | Polytechnique Montréal |
| Date du dépôt: | 11 févr. 2026 10:20 |
| Dernière modification: | 11 févr. 2026 10:41 |
| Citer en APA 7: | Manseau-Pérez, U. (2025). Modèle de prédiction de la phosphorylation d'acides aminés pour l'identification de biomarqueurs associés aux maladies neurodégénératives [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/68170/ |
|---|---|
Statistiques
Total des téléchargements à partir de PolyPublie
Téléchargements par année
Provenance des téléchargements
