<  Retour au portail Polytechnique Montréal

DevOps4ML : analyse et reconstruction semi-automatique des artéfacts et pipelines d'apprentissage machine

Aquilas Tchanjou Njomou

Mémoire de maîtrise (2021)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (2MB)
Afficher le résumé
Cacher le résumé

Résumé

Les promesses de l'Apprentissage Machine (AM) et les avancées les plus récentes en termes d'apprentissage profond et de réseaux de neurones entraînent un intérêt grandissant de la part des organisations et des développeurs vers ces technologies. Cependant, les applications d'AM sont fondamentalement différentes des logiciels traditionnels du fait de leur processus de développement impliquant des activités et des composants plus complexes à gérer et à maintenir. Étant donné le manque de services ciblés pour les logiciels d'AM par les systèmes de contrôle de version traditionnels (VCS), de nombreuses plates-formes pour la configuration et la gestion du cycle de vie de l'apprentissage automatique et la configuration ont vu le jour. Ces outils tirent parti des pratiques d'ingénierie logicielle et du DevOps pour améliorer la façon dont les développeurs créent, exploitent et maintiennent des applications d'AM. Néanmoins, l'aspect récent de ces outils et l'insuffisance de ressources scientifiques sur le sujet posent des limitations à leur adoption, et une majorité de projets d'AM sont encore construits en utilisant les plateformes traditionnelles de développement logiciel. Au vu de ces éléments, cette étude vise à analyser les pratiques, défis et opportunités relatives aux processus et outils de développement de l'AM d'une part, et d'autre part à proposer des solutions favorisant l'automatisation de ces processus. Au travers du minage des dépôts logiciels, nous avons (1) analysé les pratiques de développement d'AM et de gestion des artéfacts relatifs à partir des dépôts logiciels, (2) identifié les défis relatifs à l'adoption/migration des plateformes MLOps et avons proposé des solutions et recommandations afin de réduire l'impact de ces défis et optimiser les activités afférentes, (3) proposé des méthodologies systématiques de reconstruction automatique des pipelines et des liens entre les artéfacts d'AM.

Abstract

The promises of Machine Learning (ML) and its recent advancements in deep learning and neural networks cause a growing interest from organizations and developers. However, ML applications are fundamentally different from traditional software because of their development process involving a more complex management of related activities and components. Given the lack of targeted services for ML applications by traditional version control systems (VCS), specialised platforms for the configuration and management of the machine learning lifecycle have been proposed. These tools leverage software engineering and DevOps practices to improve the way developers create, operate, and maintain ML applications. However, they are still in an early stage of adoption, and the lack of scientific resources on the subject pose many limitations to their adoption. Thus, a majority of ML projects are still built using traditional software development platforms and processes. This study aims to analyze and explain the practices, challenges and opportunities related to ML development processes and tools. We also propose targeted solutions to prepare ML projects for automation. Through Mining of Software Repositories (MSR) techniques, we (1) analyze ML development practices from software repositories, (2) identify challenges related to the adoption/migration of MLOps platforms; propose solutions to reduce the impact of these challenges and optimize related activities, (3) propose systematic methodologies for automatic reconstruction of pipelines and links between ML artefacts

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Marios-Eleftherios Fokaefs
URL de PolyPublie: https://publications.polymtl.ca/9103/
Université/École: Polytechnique Montréal
Date du dépôt: 19 oct. 2021 11:19
Dernière modification: 27 sept. 2024 21:20
Citer en APA 7: Tchanjou Njomou, A. (2021). DevOps4ML : analyse et reconstruction semi-automatique des artéfacts et pipelines d'apprentissage machine [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/9103/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document