<  Back to the Polytechnique Montréal portal

Segmentation automatique des images de fibres d’ADN pour la quantification du stress réplicatif

Pierre Ghesquiere

Masters thesis (2018)

[img] Restricted to: Repository staff only until 10 May 2020.
Cite this document: Ghesquiere, P. (2018). Segmentation automatique des images de fibres d’ADN pour la quantification du stress réplicatif (Masters thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/3739/
Show abstract Hide abstract

Abstract

La réplication de l’ADN est un processus complexe géré par une multitude d’interactions moléculaires permettant une transmission précise de l’information génétique de la cellule mère vers les cellules filles. Parmi les facteurs pouvant porter atteinte à la fidélité de ce processus, on trouve le Stress Réplicatif. Il s’agit de l’ensemble des phénomènes entraînant le ralentissement voire l’arrêt anormal des fourches de réplication. S’il n’est pas maîtrisé, le stress réplicatif peut causer des ruptures du double brin d’ADN ce qui peut avoir des conséquences graves sur la stabilité du génome, la survie de la cellule et conduire au développement de cancers, de maladies neurodégénératives ou d’autres troubles du développement. Il existe plusieurs techniques d’imagerie de l’ADN par fluorescence permettant l’évaluation de la progression des fourches de réplication au niveau moléculaire. Ces techniques reposent sur l’incorporation d’analogues de nucléotides tels que chloro- (CldU), iodo- (IdU), ou bromo-deoxyuridine (BrdU) dans le double brin en cours de réplication. L’expérience la plus classique repose sur l’incorporation successive de deux types d’analogues de nucléotides (IdU et CldU) dans le milieu cellulaire. Une fois ces nucléotides exogènes intégrés dans le double brin de l’ADN répliqué, on lyse les cellules et on répartit l’ADN sur une lame de microscope. Les brins contenant les nucléotides exogènes peuvent être imagés par immunofluorescence. L’image obtenue est constituée de deux couleurs correspondant à chacun des deux types d’analogues de nucléotides. La mesure des longueurs de chaque section fluorescente permet la quantification de la vitesse de progression des fourches de réplication et donc l’évaluation des effets du stress réplicatif. La mesure de la longueur des fibres fluorescentes d’ADN est généralement réalisée manuellement. Cette opération, en plus d’être longue et fastidieuse, peut être sujette à des variations inter- et intra- opérateurs provenant principalement de déférences dans le choix des fibres. La détection des fibres d’ADN est difficile car ces dernières sont souvent fragmentées en plusieurs morceaux espacés et peuvent s’enchevêtrer en agrégats. De plus, les fibres sont parfois difficile à distinguer du bruit en arrière-plan causé par les liaisons non-spécifiques des anticorps fluorescents. Malgré la profusion des algorithmes de segmentation de structures curvilignes (vaisseaux sanguins, réseaux neuronaux, routes, fissures sur béton...), très peu de travaux sont dédiés au traitement des images de fibres d’ADN. Nous avons mis au point un algorithme intitulé ADFA (Automated DNA Fiber Analysis) permettant la segmentation automatique des fibres d’ADN ainsi que la mesure de leur longueur respective. Cet algorithme se divise en trois parties : (i) Une extraction des objets de l’image par analyse des contours. Notre méthode de segmentation des contours se basera sur des techniques classiques d’analyse du gradient de l’image (Marr-Hildreth et de Canny). (ii) Un prolongement des objets adjacents afin de fusionner les fibres fragmentées. Nous avons développé une méthode de suivi (tracking) basée sur l’orientation et la continuité des objets adjacents. (iii) Une détermination du type d’analogue de nucléotide par comparaison des couleurs. Pour ce faire, nous analyserons les deux canaux (vert et rouge) de l’image le long de chaque fibre. Notre algorithme a été testé sur un grand nombre d’images de qualité variable et acquises à partir de différents contextes de stress réplicatif. La comparaison entre ADFA et plusieurs opérateurs humains montre une forte adéquation entre les deux approches à la fois à l’échelle de chaque fibre et à l’échelle plus globale de l’image. La comparaison d’échantillons soumis ou non soumis à un stress réplicatif a aussi permis de valider les performances de notre algorithme. Enfin, nous avons étudié l’impact du temps d’incubation du second analogue de nucléotide sur les résultats de l’algorithme. Notre algorithme est particulièrement efficace sur des images contenant des fibres d’ADN relativement courtes et peu fractionnées. En revanche, notre méthode de suivi montre des limites lorsqu’il s’agit de fusionner correctement de longues fibres fortement fragmentées et superposées à d’autres brins. Afin d’optimiser les performances d’ADFA, nous recommandons des temps d’incubation courts (20 à 30 minutes) pour chaque analogue de nucléotide dans le but d’obtenir des fibres courtes. Nous recommandons aussi de favoriser la dilution des brins sur la lame de microscope afin d’éviter la formation d’agrégats de fibres difficiles à distinguer. ADFA est disponible en libre accès et a pour vocation de servir de référence pour la mesure des brins d’ADN afin de pallier les problèmes de variabilités inter-opérateurs.----------ABSTRACTDNA replication is tightly regulated by a great number of molecular interactions that ensure accurate transmission of genetic information to daughter cells. Replicative Stress refers to all the processes undermining the fidelity of DNA replication by slowing down or stalling DNA replication forks. Indeed, stalled replication forks may “collapse” into highly-genotoxic double strand breaks (DSB) which engender chromosomal rearrangements and genomic instability. Thus, replicative stress can constitute a critical determinant in both cancer development and treatment. Replicative stress is also implicated in the molecular pathogenesis of aging and neurodegenerative disease, as well as developmental disorders. Several fluorescence imaging techniques enable the evaluation of replication forks progression at the level of individual DNA molecules. Those techniques rely on the incorporation of exogene nucleotide analogs in nascent DNA at replication forks in living cells. In a typical experiment, sequential incorporation of two nucleotide analogs, e.g., IdU and CldU, is performed. Following cell lysis and spreading of DNA on microscopy slides, DNA molecules are then imaged by immunofluorescence. The obtained image is made up of two colors corresponding to each one of the two nucleotide analogs. Measurement of the respective lengths of these labeled stretches of DNA permits quantification of replication fork progression. Evaluation of DNA fiber length is generally performed manually. This procedure is laborious and subject to inter- and intra-user variability stemming in part from unintended bias in the choice of fibers to be measured. DNA fiber extraction is difficult because strands are often fragmented in lots of subparts and can be tangled in clusters. Moreover, the extraction of fibers can be difficult when the background is noised by non specific staining. Despite the large number of segmentation algorithms dedicated to curvilinear structures (blood vessels, neural networks, roads, concrete tracks...), few studies address the treatment of DNA fiber images. We developed an algorithm called ADFA (Automated DNA Fiber Analysis) which automatically segments DNA fibers and measures their respective length. Our approach can be divided into three parts: 1. Object extraction by a robust contour detection. Our contour segmentation method relies on two classical gradient analyses (Marr and Hildreth, 1980; Canny, 1986) 2. Fusion of adjacent fragmented fibers by analysing their continuity. We developped a tracking approach based on the orientation and the continuity of adjacent fibers. 3. Detection of the nucleotide analog label (IdU or CldU). To do so, we analyse the color profile on both channels (green and red) along each fiber. ADFA was tested on a database of different images of varying quality, signal to noise ratio, or fiber length which were acquired from two different microscopes. The comparison between ADFA and manual segmentations shows a high correlation both at the scale of the fiber and at the scale of the image. Moreover, we validate our algorithm by comparing samples submitted to replicative stress and controls. Finally, we studied the impact of the incubation time of the second nucleotide analog pulse. The performances of our algorithm are optimised for images containing relatively short and not fragmented DNA fibers. Our tracking methods may be limited when connecting highly split fibers superimposed to other strands. Therefore, we recommend to reduce the incubation time of each nucleotide analog to about 20-30 minutes in order to obtain short fibers. We also recommend to foster the dilution of fibers on the slide to reduce clustering of fluorescent DNA molecules. ADFA is freely available as an open-source software. It might be used as a reference tool to solve inter-intra user variability.

Open Access document in PolyPublie
Department: Institut de génie biomédical
Dissertation/thesis director: Farida Cheriet and Santiago Costantino
Date Deposited: 10 May 2019 14:13
Last Modified: 27 Jun 2019 16:24
PolyPublie URL: https://publications.polymtl.ca/3739/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only