<  Back to the Polytechnique Montréal portal

DevOps4ML : analyse et reconstruction semi-automatique des artéfacts et pipelines d’apprentissage machine

Aquilas Tchanjou Njomou

Masters thesis (2021)

[img] Terms of Use: All rights reserved.
Restricted to: Repository staff only until 19 October 2022.
Cite this document: Tchanjou Njomou, A. (2021). DevOps4ML : analyse et reconstruction semi-automatique des artéfacts et pipelines d’apprentissage machine (Masters thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/9103/
Show abstract Hide abstract

Abstract

RÉSUMÉ : Les promesses de l’Apprentissage Machine (AM) et les avancées les plus récentes en termes d’apprentissage profond et de réseaux de neurones entraînent un intérêt grandissant de la part des organisations et des développeurs vers ces technologies. Cependant, les applications d’AM sont fondamentalement différentes des logiciels traditionnels du fait de leur processus de développement impliquant des activités et des composants plus complexes à gérer et à maintenir. Étant donné le manque de services ciblés pour les logiciels d'AM par les systèmes de contrôle de version traditionnels (VCS), de nombreuses plates-formes pour la configuration et la gestion du cycle de vie de l'apprentissage automatique et la configuration ont vu le jour. Ces outils tirent parti des pratiques d'ingénierie logicielle et du DevOps pour améliorer la façon dont les développeurs créent, exploitent et maintiennent des applications d'AM. Néanmoins, l’aspect récent de ces outils et l’insuffisance de ressources scientifiques sur le sujet posent des limitations à leur adoption, et une majorité de projets d’AM sont encore construits en utilisant les plateformes traditionnelles de développement logiciel. Au vu de ces éléments, cette étude vise à analyser les pratiques, défis et opportunités relatives aux processus et outils de développement de l’AM d’une part, et d’autre part à proposer des solutions favorisant l’automatisation de ces processus. Au travers du minage des dépôts logiciels, nous avons (1) analysé les pratiques de développement d’AM et de gestion des artéfacts relatifs à partir des dépôts logiciels, (2) identifié les défis relatifs à l’adoption/migration des plateformes MLOps et avons proposé des solutions et recommandations afin de réduire l’impact de ces défis et optimiser les activités afférentes, (3) proposé des méthodologies systématiques de reconstruction automatique des pipelines et des liens entre les artéfacts d’AM.----------ABSTRACT : The promises of Machine Learning (ML) and its recent advancements in deep learning and neural networks cause a growing interest from organizations and developers. However, ML applications are fundamentally different from traditional software because of their development process involving a more complex management of related activities and components. Given the lack of targeted services for ML applications by traditional version control systems (VCS), specialised platforms for the configuration and management of the machine learning lifecycle have been proposed. These tools leverage software engineering and DevOps practices to improve the way developers create, operate, and maintain ML applications. However, they are still in an early stage of adoption, and the lack of scientific resources on the subject pose many limitations to their adoption. Thus, a majority of ML projects are still built using traditional software development platforms and processes. This study aims to analyze and explain the practices, challenges and opportunities related to ML development processes and tools. We also propose targeted solutions to prepare ML projects for automation. Through Mining of Software Repositories (MSR) techniques, we (1) analyze ML development practices from software repositories, (2) identify challenges related to the adoption/migration of MLOps platforms; propose solutions to reduce the impact of these challenges and optimize related activities, (3) propose systematic methodologies for automatic reconstruction of pipelines and links between ML artefacts

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Academic/Research Directors: Marios-Eleftherios Fokaefs
Date Deposited: 19 Oct 2021 11:19
Last Modified: 19 Oct 2021 11:19
PolyPublie URL: https://publications.polymtl.ca/9103/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only