<  Back to the Polytechnique Montréal portal

Energy-Efficient, Flexible and Fast Architectures for Deep Convolutional Neural Network Acceleration

Mehdi Ahmadi

PhD thesis (2020)

[img] Terms of Use: All rights reserved.
Restricted to: Repository staff only until 5 May 2022.
Cite this document: Ahmadi, M. (2020). Energy-Efficient, Flexible and Fast Architectures for Deep Convolutional Neural Network Acceleration (PhD thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/5535/
Show abstract Hide abstract

Abstract

RÉSUMÉ: Les méthodes basées sur l'apprentissage profond, et en particulier les réseaux de neurones convolutifs (CNN), ont révolutionné le domaine de la vision par ordinateur. Alors que jusqu'en 2012, les méthodes de traitement d'image traditionnelles les plus précises pouvaient atteindre 26% d'erreurs dans la reconnaissance d'images sur l'étalon normalisé et bien connu ImageNet, une méthode basée sur un CNN a considérablement réduit l'erreur à 16%. En faisant évoluer la structure des CNN, les méthodes actuelles basées sur des CNN atteignent désormais couramment des taux d'erreur inférieurs à 3%, dépassant souvent la précision humaine. Les CNN se composent de nombreuses couches convolutives, chacune effectuant des opérations de convolution complexes de haute dimension. Pour obtenir une précision élevée en reconnaissance d’images, les CNN modernes empilent de nombreuses couches convolutives, ce qui augmente considérablement la diversité des motifs de calcul entre les couches. Ce haut niveau de complexité dans les CNN implique un nombre massif de paramètres et de calculs.----------ABSTRACT: Deep learning-based methods, and specifically Convolutional Neural Networks (CNNs), have revolutionized the field of computer vision. While until 2012, the most accurate traditional image processing methods could reach 26% errors in recognizing images on the standardized and well-known ImageNet benchmark, a CNN-based method dramatically reduced the error to 16%. By evolving CNNs structures, current CNN-based methods now routinely achieve error rates below 3%, often outperforming human level accuracy. CNNs consist of many convolutional layers each performing high dimensional complex convolution operations. To achieve high image recognition accuracy, modern CNNs stack many convolutional layers which dramatically increases computation pattern diversity across layers. This high level of complexity in CNNs implies massive numbers of parameters and computations. Since mobile processors are not designed to perform massive computations, deploying CNNs on portable and mobile devices is challenging.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Academic/Research Directors: Pierre Langlois
Date Deposited: 05 May 2021 13:09
Last Modified: 05 May 2021 13:09
PolyPublie URL: https://publications.polymtl.ca/5535/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only