Apprentissage profond pour vision stéréoscopique multispectrale

David-Alexandre Beaupré

Mémoire de maîtrise (2020)

Document en libre accès dans PolyPublie

Affichage préliminaire

Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (14MB)

Afficher le résumé

Cacher le résumé

Résumé

Ce mémoire présente des méthodes pour estimer les disparités des humains, soit le déplacement entre les pixels des silhouettes humaines, entre des images visibles (RGB) et infrarouges (LWIR). Le but est que, pour chaque pixel dans l'image de gauche, on soit capable de trouver le pixel correspondant dans l'image de droite. Ceci permet de mettre en correspondance les objets d'intérêts d'une scène et peut être utile dans des applications de vidéosurveillance ou de voitures autonomes. Différents facteurs rendent cette tâche plutôt difficile. En plus des difficultés reliées à la nature stéréo du problème, il y a aussi la difficulté de travailler avec deux spectres différents qui n'ont pas beaucoup d'information en commun. Ceci cause beaucoup de problèmes lorsqu'il est temps d'établir des correspondances entre les images. Les méthodes de la littérature se basent sur des descripteurs classiques, mais nous croyons qu'il est possible d'obtenir des méthodes plus performantes si on utilise des réseaux de neurones convolutifs.

Abstract

This thesis presents new methods to do disparity estimation for human subjects, defined as the distance between pixels on the human silhouettes, between images from the visible (RGB) and infrared domains (LWIR). The goal of disparity estimation is, for each pixel in the left image, to find the corresponding pixel in the right image. This allows the correspondence of objects of interest, which can be useful in applications such as video surveillance and autonomous vehicles. Many factors make this task difficult. It has difficulties related to the stereo aspect of the problem, as well as having to establish correspondences between images from different domains, which is hard since there is not much common information between those. Methods in the literature are based on handcrafted feature descriptors, but we believe that it is possible to obtain better methods if we use convolutional neural networks.

Département:	Département de génie informatique et génie logiciel
Programme:	Génie informatique
Directeurs ou directrices:	Guillaume-Alexandre Bilodeau
URL de PolyPublie:	https://publications.polymtl.ca/5364/
Université/École:	Polytechnique Montréal
Date du dépôt:	20 oct. 2020 13:26
Dernière modification:	27 sept. 2024 19:02

Citer en APA 7:	Beaupré, D.-A. (2020). Apprentissage profond pour vision stéréoscopique multispectrale [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5364/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document