<  Back to the Polytechnique Montréal portal

Towards Improving the Reliability of Live Migration Operations in Openstack Clouds

Armstrong Tita Foundjem

Masters thesis (2017)

[img]
Preview
Download (4MB)
Cite this document: Foundjem, A. T. (2017). Towards Improving the Reliability of Live Migration Operations in Openstack Clouds (Masters thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/2498/
Show abstract Hide abstract

Abstract

RÉSUMÉ Grâce au succès de la virtualisation, les solutions infonuagiques sont aujourd’hui présentes dans plusieurs aspects de nos vies. La virtualisation permet d’abstraire les caractéristiques d’une ma- chine physique sous forme d’instances de machines virtuelles. Les utilisateurs finaux peuvent alors consommer les ressources de ces machines virtuelles comme s’ils étaient sur une machine physique. De plus, les machines virtuelles en cours d’exécution peuvent être migrées d’un hôte source (généralement hébergé dans un centre de données) vers un autre hôte (hôte de destination, qui peut être hébergé dans un centre de données différent), sans perturber les services. Ce processus est appelé migration en temps réel de machine virtuelles. La migration en temps réel de machine virtuelles, est un outil puissant qui permet aux administrateurs de système infonuagiques d’équilibrer les charges dans un centre de données ou encore de déplacer des applications dans le but d’améliorer leurs performances et–ou leurs fiabilités. Toutefois, si elle n’est pas planifiée soigneusement, cette opération peut échouer. Ce qui peut entraîner une dégradation significative de la qualité de service des applications concernées et même parfois des interruptions de services. Il est donc extrêmement important d’équiper les administrateurs de systèmes infonuagiques d’outils leurs permettant d’évaluer et d’améliorer la performance des opérations de migration temps réel de machine virtuelles. Des efforts ont été réalisées par la communauté scientifique dans le but d’améliorer la fiabilité de ces opérations. Cependant, à cause de leur complexité et de la nature dynamique des environnements infonuagiques, plusieurs migrations en temps réel de machines virtuelles échouent encore. Dans ce mémoire, nous nous appuyons sur les prédictions d’un modèle de classification (Random Forest) et sur des politiques générées par un processus de décision markovien (MDP), pour décider du moment propice pour une migration en temps réel de machine virtuelle, et de la destination qui assurerait un succès a l’opération. Nous réalisons des études de cas visant à évaluer l’efficacité de notre approche. Les défaillances sont simulées dans notre environnement d’exécution grâce à l’outils DestroyStack. Les résultats de ces études de cas montrent que notre approche permet de prédire les échecs de migration avec une précision de 95%. En identifiant le meilleur moment pour une migration en temps réel de machine virtuelle (grâce aux modèles MDP), en moyenne, nous sommes capable de réduire le temps de migration de 74% et la durée d’indisponibilité de la machine virtuelle de 21%.----------ABSTRACT Cloud computing has become commonplace with the help of virtualization as an enabling technology. Virtualization abstracts pools of compute resources and represents them as instances of virtual machines (VMs). End users can consume the resources of these VMs as if they were on a physical machine. Moreover, the running VMs can be migrated from one node (Source node; usually a data center) to another node (destination node; another datacenter) without disrupting services. A process known as live VM migration. Live migration is a powerful tool that system administrators can leverage to, for example, balance the loads in a data center or relocate an application to improve its performance and–or reliability. However, if not planned carefully, a live migration can fail, which can lead to service outage or significant performance degradation. Hence, it is utterly important to be able to assess and forecast the performance of live migration operations, before they are executed. The research community have proposed models and mechanisms to improve the reliability of live migration. Yet, because of the scale, complexity and the dynamic nature of cloud environments, live migration operations still fail. In this thesis, we rely on predictions made by a Random Forest model and scheduling policies generated by a Markovian Decision Process (MDP), to decide on the migration time and destination node of a VM, during a live migration operation in OpenStack. We conduct a case study to assess the effectiveness of our approach, using the fault injection framework DestroyStack. Results show that our proposed approach can predict live migration failures with and accuracy of 95%. By identifying the best time for live migration with MDP models, in average, we can reduce the live migration time by 74% and the downtime by 21%.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Dissertation/thesis director: Foutse Khomh
Date Deposited: 13 Jun 2017 11:30
Last Modified: 24 Oct 2018 16:12
PolyPublie URL: https://publications.polymtl.ca/2498/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only