Master's thesis (2020)
Open Access document in PolyPublie |
|
Open Access to the full text of this document Terms of Use: All rights reserved Download (14MB) |
Abstract
This thesis presents new methods to do disparity estimation for human subjects, defined as the distance between pixels on the human silhouettes, between images from the visible (RGB) and infrared domains (LWIR). The goal of disparity estimation is, for each pixel in the left image, to find the corresponding pixel in the right image. This allows the correspondence of objects of interest, which can be useful in applications such as video surveillance and autonomous vehicles. Many factors make this task difficult. It has difficulties related to the stereo aspect of the problem, as well as having to establish correspondences between images from different domains, which is hard since there is not much common information between those. Methods in the literature are based on handcrafted feature descriptors, but we believe that it is possible to obtain better methods if we use convolutional neural networks.
Résumé
Ce mémoire présente des méthodes pour estimer les disparités des humains, soit le déplacement entre les pixels des silhouettes humaines, entre des images visibles (RGB) et infrarouges (LWIR). Le but est que, pour chaque pixel dans l'image de gauche, on soit capable de trouver le pixel correspondant dans l'image de droite. Ceci permet de mettre en correspondance les objets d'intérêts d'une scène et peut être utile dans des applications de vidéosurveillance ou de voitures autonomes. Différents facteurs rendent cette tâche plutôt difficile. En plus des difficultés reliées à la nature stéréo du problème, il y a aussi la difficulté de travailler avec deux spectres différents qui n'ont pas beaucoup d'information en commun. Ceci cause beaucoup de problèmes lorsqu'il est temps d'établir des correspondances entre les images. Les méthodes de la littérature se basent sur des descripteurs classiques, mais nous croyons qu'il est possible d'obtenir des méthodes plus performantes si on utilise des réseaux de neurones convolutifs.
Department: | Department of Computer Engineering and Software Engineering |
---|---|
Program: | Génie informatique |
Academic/Research Directors: | Guillaume-Alexandre Bilodeau |
PolyPublie URL: | https://publications.polymtl.ca/5364/ |
Institution: | Polytechnique Montréal |
Date Deposited: | 20 Oct 2020 13:26 |
Last Modified: | 27 Sep 2024 19:02 |
Cite in APA 7: | Beaupré, D.-A. (2020). Apprentissage profond pour vision stéréoscopique multispectrale [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5364/ |
---|---|
Statistics
Total downloads
Downloads per month in the last year
Origin of downloads