<  Back to the Polytechnique Montréal portal

Apprentissage profond pour vision stéréoscopique multispectrale

David-Alexandre Beaupré

Masters thesis (2020)

[img]
Preview
Terms of Use: All rights reserved.
Download (14MB)
Cite this document: Beaupré, D.-A. (2020). Apprentissage profond pour vision stéréoscopique multispectrale (Masters thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/5364/
Show abstract Hide abstract

Abstract

RÉSUMÉ: Ce mémoire présente des méthodes pour estimer les disparités des humains, soit le déplacement entre les pixels des silhouettes humaines, entre des images visibles (RGB) et infrarouges (LWIR). Le but est que, pour chaque pixel dans l’image de gauche, on soit capable de trouver le pixel correspondant dans l’image de droite. Ceci permet de mettre en correspondance les objets d’intérêts d’une scène et peut être utile dans des applications de vidéosurveillance ou de voitures autonomes. Différents facteurs rendent cette tâche plutôt difficile. En plus des difficultés reliées à la nature stéréo du problème, il y a aussi la difficulté de travailler avec deux spectres différents qui n’ont pas beaucoup d’information en commun. Ceci cause beaucoup de problèmes lorsqu’il est temps d’établir des correspondances entre les images. Les méthodes de la littérature se basent sur des descripteurs classiques, mais nous croyons qu’il est possible d’obtenir des méthodes plus performantes si on utilise des réseaux de neurones convolutifs.----------ABSTRACT:This thesis presents new methods to do disparity estimation for human subjects, defined as the distance between pixels on the human silhouettes, between images from the visible (RGB) and infrared domains (LWIR). The goal of disparity estimation is, for each pixel in the left image, to find the corresponding pixel in the right image. This allows the correspondence of objects of interest, which can be useful in applications such as video surveillance and autonomous vehicles. Many factors make this task difficult. It has difficulties related to the stereo aspect of the problem, as well as having to establish correspondences between images from different domains, which is hard since there is not much common information between those. Methods in the literature are based on handcrafted feature descriptors, but we believe that it is possible to obtain better methods if we use convolutional neural networks.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Academic/Research Directors: Guillaume-Alexandre Bilodeau
Date Deposited: 20 Oct 2020 13:26
Last Modified: 22 Oct 2021 16:40
PolyPublie URL: https://publications.polymtl.ca/5364/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only