Waleed Sayed Ahmed Fathy Gharib
Thèse de doctorat (2025)
|
Libre accès au plein texte de ce document Conditions d'utilisation: Tous droits réservés Télécharger (14MB) |
Résumé
La prédiction des réadmissions en unité de soins intensifs (USI, ICU) est un défi majeur, car les retours non planifiés signalent souvent une récupération incomplète, une fragilité particulière, et un risque de délais dans la prise en charge, qui résultent en un risque accru de mortalité et des coûts de santé plus élevés. La réadmission en USI pédiatrique (USIP, PICU) est particulièrement peu étudiée en raison de la rareté de grandes bases de données publiques et de la variabilité physiologique propre aux différents groupes d’âge pédiatriques. La plupart des études sur la réadmission en soins intensifs portent sur des adultes, alors que cette thèse met en lumière les défis propres au contexte pédiatrique, nécessitant la prise en compte de caractéristiques spécifiques au domaine et des stratégies de modélisation adaptées. Cette thèse examine s’il est possible de développer un modèle à la fois performant et interprétable pour prédire la réadmission en USIP à partir d’ensembles de données cliniques de taille limitée et de distribution non équilibrée collectées sur l’ensemble du séjour du patient. Nous proposons une approche en deux étapes. Dans un premier temps, nous concevons une procédure prédictive complète sur la base publique adulte MIMIC-III (ICU), permettant d’évaluer systématiquement les stratégies de prétraitement, la modélisation des caractéristiques multimodales (statistiques, provenant de connaissances à priori du domaine et de techniques de traitement de signal), la sélection de caractéristiques discriminantes et l’implémentation de différentes familles de modèles. Dans un second temps, nous étendons et optimisons cette procédure pour le jeu de données pédiatrique du CHU Sainte-Justine (CathyDB) via des étapes adaptées à la pédiatrie : extraction d’informations additionnelles (p. ex. scores pédiatriques), imputations spécifiques selon la variable, filtrage des signes vitaux en deux étapes à l’aide du filtre de Kalman et une transformation par ondelettes, représentations catégorielles dépendantes de l’âge (normal/bas/élevé avec écart aux normes pédiatriques), extraction de caractéristiques basées sur des connaissances à priori du domaine plus puissantes, et sélection des caractéristiques les plus discriminantes par information mutuelle et coefficients LASSO, complétée par une recherche à l’aide d’une « enveloppe » bidirectionnelle (arrière–avant). Sur le banc d’essai adulte, un modèle de type Light Gradient Boosting Machine (LightGBM) a atteint une aire sous la courbe ROC (AUROC) de 78.6% pour la réadmission après 3 jours, montrant une bonne discrimination dans un contexte hétérogène et soulignant l’intérêt des caractéristiques sélectionnées. Le classement des variables a mis en évidence des descripteurs du domaine fréquentiel (p. ex. coefficients FFT, transformations angulaires) ainsi que des représentations vectorielles des diagnostics (charge de comorbidités). Les résumés des signes vi vitaux (fréquence cardiaque, fréquence respiratoire), les marqueurs biologiques (taux d’urée sanguine, numération leucocytaire) et les indicateurs thérapeutiques (adrénaline) figuraient parmi les facteurs de risque cliniques les plus marquants. Cette distribution des variables les plus discriminantes confirme la nécessité d’une approche multimodale intégrant les informations diagnostiques, physiologiques, biologiques et thérapeutiques. Pour la prédiction en USIP, un modèle de régression logistique (LR) entraîné sur un sousensemble multimodal sélectionné a fourni les performances les plus constantes entre jeux de données (AUROC test : 87.8%), surpassant d’autres modèles linéaires, des ensembles d’arbres et des modèles profonds. Cela montre qu’un modèle simple comme le LR peut dépasser des approches plus complexes lorsque les variables sont bien choisies. Les méthodes à base d’arbres ont obtenu de très bons scores d’entraînement mais ont sur-appris et se sont dégradées sur la détection de la classe minoritaire, faute d’exemples positifs. Malgré l’usage des seules 24 dernières heures de séries temporelles et l’exclusion de données statiques (p. ex. biologie), les modèles profonds (BiLSTM avec attention et Transformer) sont restés compétitifs (AUROC 79.2% et 78.5%), laissant entrevoir des gains potentiels avec des bases de données d’entrainement plus grandes. Notre modèle LR interprétable a nettement dépassé les prédicteurs de réadmission en USIP publiés auparavant, atteignant 87.8% d’AUROC test contre 64–70% dans les études antérieures. Nous avons démontré la cohérence du modèle prédictif proposé avec le protocole utilisé en clinique via des méthodes d’explicabilité globales (coefficients LR, SHAP) et des études d’ablations. Les analyses d’interprétabilité montrent que les caractéristiques basées sur les connaissances à priori du domaine et celles issues du traitement des signaux physiologiques sont les contributions majeures dans la prédiction—rendant leur extraction explicite essentielle. Sur le plan clinique, elles incluent les anomalies des signes vitaux, certains paramètres biologiques, l’équilibre hydrique, les scores de sédation et l’usage de médicaments spécifiques comme indicateurs clés de risque de réadmission. Les études d’ablations confirment le caractère indispensable de plusieurs variables (p. ex. acide acétylsalicylique, digoxine, anomalies du débit urinaire), suggérant des pistes de prise de décision pour les cliniciens. Dans l’ensemble, nos résultats montrent qu’une prédiction précise et interprétable de la réadmission en USIP est réalisable avec des ensembles de données de taille limitée et de distribution non équilibrée, en s’appuyant sur un prétraitement rigoureux, des représentations spécifiques à la pédiatrie et une sélection de modèles fondée sur des métriques spécifiques. De surcroît, en combinant des techniques avancées de traitement de signal avec des variables basées sur des connaissances à priori du domaine, cette étude contribue à réduire l’écart entre la performance prédictive et l’applicabilité clinique. vii D’un point de vue global, cette étude contribue à l’avancement des modèles prédictifs en soins intensifs pédiatriques en conciliant précision et interprétabilité. Contrairement aux travaux antérieurs reposant sur des approches de type « boîte noire » ou sur des données adultes, notre approche montre comment une modélisation et une sélection rigoureuse de caractéristiques permet de prendre en compte l’hétérogénéité pédiatrique. Les résultats prometteurs laissent entrevoir, après une validation plus exhaustive sur des ensembles de données provenant d’autres institutions , l’évolution vers un système d’aide à la décision clinique en temps réel, capable d’identifier les patients à haut risque de réadmission et d’expliquer les facteurs sous-jacents. Une telle interprétabilité offre aux cliniciens un appui pour orienter leur décision de prescrire la sortie du patient de l’USI, de prolonger le séjour si nécessaire ou assurer une surveillance renforcée après la sortie de l’USI, contribuant ainsi à réduire les réadmissions évitables et à améliorer la qualité des soins critiques pédiatriques.
Abstract
Intensive Care Unit (ICU) readmission prediction is a critical challenge in critical care medicine, as unplanned returns often indicate incomplete recovery, particular frailty, and a risk of delays in care, resulting in increased mortality risk, and higher healthcare costs. Pediatric Intensive Care Unit (PICU) readmission prediction is particularly underexplored due to the scarcity of large, publicly available datasets and the unique physiological variability across pediatric age groups. While most ICU readmission studies focus on adult populations, our thesis highlights the unique challenges in PICU readmission prediction, where pediatric heterogeneity requires tailored feature engineering and modeling strategies. This thesis investigates whether a highperforming and interpretable model can predict pediatric PICU readmission using limited, imbalanced data collected over the full length of stay. We propose a two-stage approach. First, we design a complete predictive pipeline on the public adult ICU database MIMICIII, enabling systematic evaluation of preprocessing, multimodal feature engineering (statistical, medical knowledge-based, and signal-processing descriptors), feature selection, and model families. Second, we extend and optimize this pipeline to the CHU Sainte-Justine PICU dataset (CathyDB) with pediatric-aware steps: Extracting more data such as pediatric score, using category-aware imputation, a two-stage Kalman–wavelet denoising of vital signs, age-aware categorical state representations (normal/low/high with deviation from pediatric norms), Extracting more powerful clinical meaningful features and feature selection via mutual information and LASSO coefficients plus bidirectional (backward–forward) wrapper search. On the adult benchmark, a Light Gradient Boosting Machine (LightGBM) achieved an Area Under the Receiver Operating Characteristic (AUROC) curve of 78.6% for 3-day readmission, showing strong discrimination in a heterogeneous setting and highlighting the value of medical knowledge-based and frequency-domain features. Feature ranking highlighted medical knowledge-based features and frequency-domain descriptors (e.g., FFT coefficients, angle-based transforms) as the most predictive, alongside diagnosis embeddings (comorbidity burden). Vital-sign summaries (heart and respiratory rates), laboratory markers (blood urea nitrogen difference, white blood cell count), and medications (epinephrine) were the most significant clinical risk factors. This distribution of top-ranked features underscores the need for a multimodal approach that integrates diagnostic, physiologic, laboratory, and therapeutic information. ix For PICU prediction, a Logistic Regression (LR) model trained on a selected multimodal subset delivered the most consistent performance (test AUROC 87.8%), outperforming other linear baselines, tree ensembles, and deep learning models. This shows that even a simple model like LR can outperform more complex models when features are well-selected. Tree-based methods attained high training scores but overfit and degraded on minority-class detection due to the lack of training positive samples. Despite using only last-24h time series and excluding some important static data such as lab results, deep learning models (Bidirectionl Long Short Time Memory (BiLSTM) with attention and Transformer) remained competitive (AUROC 79.2% and 78.5%), suggesting headroom with richer inputs. Our interpretable LR model significantly outperformed the previously published PICU readmission predictors, achieving a test AUROC of 87.8%, compared to 64–70% in earlier studies. We aligned model predictions with clinical reasoning by applying global explainability methods— including LR coefficients, Shapley Additive exPlanations (SHAP), and ablation analysis— at both the feature-engineering and clinical-variable levels. To complement this, we employed Local Interpretable Model-agnostic Explanations (LIME) to provide case-specific insights into individual predictions. Feature engineering interpretability analyses showed that medical knowledge-based and signal-processing based features are the strongest contributors— making their explicit extraction essential. Clinically, it identifies vital-sign abnormalities, lab values, fluid balance measures, sedation scores, and specific medication usage as key indicators of readmission risk. Feature ablation confirmed the indispensability of several variables (e.g., Acide acetylsalicylique, Digoxine administration, urine output abnormalities), suggesting actionable insights for clinicians. In addition, we applied local interpretability methods to identify the key risk factors driving the model’s prediction for each individual patient. Overall, the results show that accurate, interpretable PICU readmission prediction is feasible with limited, imbalanced data when supported by rigorous preprocessing, pediatricspecific representations, and principled model selection. In addition, by integrating advanced signal-processing with clinically interpretable features, this study bridges the gap between predictive performance and clinical usability. From a broader perspective, this study advances the development of predictive models in pediatric critical care by combining accuracy with interpretability. Unlike prior works that often rely on black-box methods or adult ICU data, our framework demonstrates how targeted feature engineering can address the unique heterogeneity of pediatric patients. The promising findings suggest that, with further extension and refinement, this model could evolve into a real-time clinical decision support system capable of flagging high-risk patients and explaining the underlying factors driving readmission risk. Such interpretability empowers clinicians to make more informed discharge decisions, prolonging stays when needed, or prix oritize monitoring of key risks after discharge. Ultimately, this could help reduce preventable readmissions and improve the overall quality of pediatric critical care.
| Département: | Département de génie informatique et génie logiciel |
|---|---|
| Programme: | génie informatique |
| Directeurs ou directrices: |
Farida Cheriet |
| URL de PolyPublie: | https://publications.polymtl.ca/70097/ |
| Université/École: | Polytechnique Montréal |
| Date du dépôt: | 10 févr. 2026 10:54 |
| Dernière modification: | 10 févr. 2026 11:40 |
| Citer en APA 7: | Gharib, W. S. A. F. (2025). Interpretable Predictive Modeling for Patient Readmission in Intensive Care Units [Thèse de doctorat, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/70097/ |
|---|---|
Statistiques
Total des téléchargements à partir de PolyPublie
Téléchargements par année
Provenance des téléchargements
