<  Back to the Polytechnique Montréal portal

Apprentissage de représentations pour la classification d'images biomédicales

William Thong

Master's thesis (2015)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (6MB)
Show abstract
Hide abstract

Abstract

The growing accessibility of medical imaging provides new clinical applications for patient care. New clinically relevant features can now be discovered to understand, describe and represent a disease. Traditional algorithms based on hand-engineered features usually fail in biomedical applications because of their lack of ability to capture the high variability in the data. Representation learning, often called deep learning, tackles this challenge by learning multiple levels of representation. The hypothesis of this master's thesis is that representation learning for biomedical image classification will yield additional information for the physician in his decision-making process. Therefore, the main objective is to assess the feasibility of representation learning for two different biomedical applications in order to learn clinically relevant structures within the data. First, a non-supervised learning algorithm extracts discriminant features to describe spine deformities that require a surgical intervention in patients with adolescent idiopathic scoliosis. The sub-objective is to propose an alternative to existing scoliosis classifications that only characterize spine deformities in 2D whereas a scoliotic is often deformed in 3D. 915 spine reconstructions from 663 patients were collected. Stacked auto-encoders learn a hidden representation of these reconstructions. This low-dimensional representation disentangles the main factors of variation in the geometrical appearance of spinal deformities. Sub-groups are clustered with the k-means++ algorithm. Eleven statistically significant sub-groups are extracted to explain how the different deformations of a scoliotic spine are distributed. Secondly, a supervised learning algorithm extracts discriminant features in medical images. The sub-objective is to classify every voxel in the image in order to produce kidney segmentations. 79 contrast-enhanced CT scans from 63 patients with renal complications were collected. A convolutional network is trained on a patch-based training scheme. Simple modifications to the architecture of the network, without modifying the parameters, compute the kidney segmentations on the whole image in a small amount of time. Results show high scores on the metrics used to assess the segmentations. Dice scores are 94.35% for the left kidney and 93.07% for the right kidney. The results show new perspectives for the diseases addressed in this master's thesis. Representation learning algorithms exhibit new opportunities for an application in other biomedical tasks as long as enough observations are available.

Résumé

La disponibilité croissante d'images médicales ouvre la porte à de nombreuses applications cliniques qui ont une incidence sur la prise en charge du patient. De nouveaux traits caractéristiques cliniquement pertinents peuvent alors être découverts pour expliquer, décrire et représenter une maladie. Les algorithmes traditionnels qui se basent sur des règles d'association manuellement construits font souvent défaut dans le domaine biomédical à cause de leur incapacité à capturer la forte variabilité au sein des données. L'apprentissage de représentations apprend plusieurs niveaux de représentations pour mieux capturer les facteurs de variation des données. L'hypothèse du projet de recherche du mémoire est que la classification par apprentissage de représentations apportera une information supplémentaire au médecin afin de l'aider dans son processus de décision. L'objectif principal, qui en découle, vise à étudier la faisabilité de l'apprentissage de représentations pour le milieu médical en vue de découvrir des structures cliniquement pertinentes au sein des données.Dans un premier temps, un algorithme d'apprentissage non-supervisé extrait des traits caractéristiques discriminants des déformations de la colonne vertébrale de patients atteints de la scoliose idiopathique de l'adolescent qui nécessitent une intervention chirurgicale. Le sous-objectif consiste à proposer une alternative aux systèmes de classification existants qui décrivent les déformations seulement selon deux plans alors que la scoliose déforme le rachis dans les trois dimensions de l'espace. Une large base de données a été rassemblée, composée de 915 reconstructions de la colonne vertébrale issues de 663 patients. Des auto-encodeurs empilés apprennent une représentation latente de ces reconstructions. Cette représentation de plus faible dimension démêle les facteurs de variation. Des sous-groupes sont par la suite formés par un algorithme de k-moyennes++. Onze sous-groupes statistiquement significatifs sont alors proposés pour expliquer la répartition de la déformation de la colonne vertébrale. Dans un second temps, un algorithme d'apprentissage supervisé extrait des traits caractéristiques discriminants au sein d'images médicales. Le sous-objectif consiste à classifier chaque voxel de l'image afin de produire une segmentation des reins. Une large base de données a été rassemblée, composée de 79 images tomographiques avec agent de contraste issues de 63 patients avec de nombreuses complications rénales. Un réseau à convolution est entrainé sur des patches de ces images pour apprendre des représentations discriminantes. Par la suite, des modifications sont appliquées à l'architecture, sans modifier les paramètres appris, pour produire les segmentations des reins. Les résultats obtenus permettent d'atteindre des scores élevés selon les métriques utilisées pour évaluer les segmentations en un court délai de calcul. Des coefficients de Dice de 94,35% pour le rein gauche et 93,07% pour le rein droit ont été atteints.Les résultats du mémoire offrent de nouvelles perspectives pour les pathologies abordées. L'application de l'apprentissage de représentations dans le domaine biomédical montre de nombreuses opportunités pour d'autres tâches à condition de rassembler une base de données d'une taille suffisante.

Department: Institut de génie biomédical
Program: Génie biomédical
Academic/Research Directors: Samuel Kadoury and Christopher J. Pal
PolyPublie URL: https://publications.polymtl.ca/1842/
Institution: École Polytechnique de Montréal
Date Deposited: 15 Dec 2015 15:38
Last Modified: 26 Sep 2024 13:08
Cite in APA 7: Thong, W. (2015). Apprentissage de représentations pour la classification d'images biomédicales [Master's thesis, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/1842/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item