<  Retour au portail Polytechnique Montréal

Learned Image Compression for Machine Visual Perception

Jean-Gabriel Simard

Mémoire de maîtrise (2021)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (3MB)
Afficher le résumé
Cacher le résumé

Résumé

Dans cette thèse, nous explorons la compression d'image avec des techniques d'apprentissage profond. Nous proposons une méthode simple pour apprendre une représentation compress- ible d'image naturelle qui est structurée de façon à faciliter les tâches de vison par ordina- teur que sont la classification, la détection, la segmentation sémantique et la reconstruction d'image. Nous testons l'utilisation d'un espace de représentations compressible comme seule donnée disponible pour accomplir ces différentes tâches. Nous procédons aux mêmes ex- périences à plusieurs taux de compression pour constater l'effet de la compressibilité sur la performance dans les différentes tâches.Nous désirons obtenir des performances de compression supérieures au codec de compression d'image JPEG tout en obtenant des performances supérieures ou égales dans les différentes tâches quand la représentation compressible est utilisée comme seule source d'information pour les différentes tâches.

Abstract

In this thesis, we explore image compression using techniques from deep learning. We propose a simple method to learn a compressible representation of natural images that is structured so as to facilitate the following computer vision tasks : classification, objection detection, semantic segmentation and image reconstruction. We test the use of a compressible repre- sentation as the only input to those tasks. We perform these tasks at different compression ratios to explore the effect of compressibility on performance in the different tasks.

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Christopher J. Pal
URL de PolyPublie: https://publications.polymtl.ca/6579/
Université/École: Polytechnique Montréal
Date du dépôt: 14 juil. 2021 13:32
Dernière modification: 05 avr. 2024 14:05
Citer en APA 7: Simard, J.-G. (2021). Learned Image Compression for Machine Visual Perception [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/6579/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document