Master's thesis (2022)
Open Access document in PolyPublie |
|
Open Access to the full text of this document Terms of Use: All rights reserved Download (9MB) |
Abstract
The placenta is a central organ in the development of the fetus. Despite the published guidelines stressing the importance of having more systematic analysis of the placentas, this organ is often discarded and only roughly examined after birth. This is mainly due to the time consuming task of manual analysis and the required level of skills to perform such a task. Advances made in the fields of digital pathology using deep learning enabled the use of computers in the processing and diagnosis of histology slides in many applications such as the breast and prostate cancer. Very few publications exist for the placenta using deep learning due to the lack of annotated data. The large amount of healthy class images and the rarity of the diseased class make the anomaly detection paradigm a promising avenue for computer assisted diagnosis of the placenta. This study proposes firstly a method to segment the villi region in each Whole Slide Images and to generate patch images and patchlevel annotations at higher resolution which are more adapted for deep learning and machine learning architectures. Second, we propose a deep features extraction method using a pretext classification task. Finally, we trained a deep anomaly detection model only on normal images and used the aggregated anomaly score to detect pathological slides. We obtained a ROC AUC of 67% and deemed the anomaly scores to not be statistically significant for differentiating between the normal and abnormal classes. We observed that the inherent variability of the villi tissue overpowers the subtle differences between normal and abnormal villi. Despite our inconclusive results, for the anomaly detection task, we believe this study brings significant contributions to the research on the placenta. We were largely successful in automatically segmenting the villi region at a low resolution with very few annotations, reaching a dice score of 93.1%. We generated a high resolution dataset within the villi and the chorionic class of more than 13,000 patch images of dimensions 512 × 512 which can be used for future studies. We also compared the only existing deep learning feature extractor for histology images, the KimiaNet to a ResNet18 for the classification task. Both models were modified to output 200 features and the ResNet18 outperformed the KimiaNet with an f1 score of 95.0% compared to 88.5% respectively. Additionally, we developed a tool to help visualize and interpret the deep features of the various data images and have found a tendency for data points with the same villi maturation level and the same villi density to form highly populated neighborhoods in the extracted feature space. Finally we proposed a baseline for the anomaly detection model for future works.
Résumé
Le placenta est un organe central dans le développement du foetus. Malgré les directives soulignant l’importance d’avoir une analyse plus systématique des placentas, cet organe n’est que grossièrement examiné après la naissance. Ceci est principalement dû à la longue tâche d’analyse manuelle et le niveau de compétences requis pour effectuer une telle tâche. Les avancées réalisées dans les domaines de la pathologie numérique à l’aide des techniques d’apprentissage profond, ont permis l’utilisation des ordinateurs dans le traitement et le diagnostic des lames d’histologie et ceci dans de nombreuses applications comme le cancer du sein et de la prostate. Il existe très peu de publications sur le placenta qui utilisent l’apprentissage profond. La principale raison est le manque de données annotées pour les classes de pathologies qui sont plus rares que les données de tissus sains. Le paradigme de détection des anomalies est une voie prometteuse pour le diagnostic assisté par ordinateur des pathologies du placenta. Cette étude propose d’abord une méthode pour segmenter la région des villosités dans chaque image de microscope. Ensuite, nous proposons une méthode afin de générer des sous-imagettes à très haute résolution à l’intérieur du tissu placentaire; ces imagettes ayant une résolution plus adaptée aux modèles d’apprentissage machine et d’apprentissage profond. Deuxièmement, nous proposons une méthode d’extraction des caractéristiques profondes en utilisant une tâche connexe de classification. Enfin, nous avons entraîné un modèle profond de détection d’anomalies uniquement sur des images obtenues à partir de tissus sains et nous avons utilisé le score d’anomalie combiné pour détecter les lames pathologiques. Nous avons obtenu une aire sous la courbe ROC de 67%. Le score d’anomalie n’était pas statistiquement significatif pour distinguer entre la classe normale et la classe anormale. Nous avons attribué ceci à la variabilité inhérente du tissu villositaire en raison de l’hétérogeniété du placenta qui continue à évoluer tout au long d’une grossesse. Cette variabilité est plus significative que les subtiles différences entre le tissu sain et pathologique. Malgré nos résultats peu concluants pour la détection d’anomalies, nous pensons que cette étude apporte des contributions significatives à la recherche sur le placenta. L’un des apport est la segmentation automatique de la région des villosités à basse résolution et ce en utilisant très peu d’annotations. En effet, nous avons atteint un score DICE de 93,1% qui est du même ordre de grandeur que la variabilité inter opérateurs. Nous avons généré une base de données de sous-imagettes à haute résolution dans la région des villosités ainsi qu’à l’intérieur de la région de la plaque choriale. Cette base contient plus de 13 000 imagettes de dimensions 512 × 512 qui pourraient être utilisées pour de futures études. Nous avons également comparé différents extracteurs de représentation sur cette base de données, le KimiaNet et le ResNet18. Le ResNet18 proposé dans cette étude a surpassé le KimiaNet avec un score F1 de 95,0 % contre 88,5% respectivement dans une tâche de classification des imagettes villositaires versus choriales. De plus, nous avons développé un outil pour la visualisation et l’interprétation de l’espace des caractéristiques profondes extraites à l’aide de ces modèles. Nous avons découvert une tendance de regroupement des imagettes partagant des densités et des niveaux de maturation des villosités dans la même région dans l’espace de représentation.
Department: | Department of Computer Engineering and Software Engineering |
---|---|
Program: | Génie informatique |
Academic/Research Directors: | Lama Séoud and Dorothée Bouron-Dal Soglio |
PolyPublie URL: | https://publications.polymtl.ca/10767/ |
Institution: | Polytechnique Montréal |
Date Deposited: | 17 Jul 2023 11:41 |
Last Modified: | 22 Jul 2024 12:13 |
Cite in APA 7: | Badawy, Y. (2022). Weakly Supervised Anomaly Detection Pipeline for Histology Images of Placental Villi [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10767/ |
---|---|
Statistics
Total downloads
Downloads per month in the last year
Origin of downloads