<  Back to the Polytechnique Montréal portal

Programmation différentielle dynamique pour la commande optimale d'actionneurs biomimétiques

Perle Geoffroy

Master's thesis (2014)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (7MB)
Show abstract
Hide abstract

Abstract

Prostheses are artificial devices that replace organs or limbs. Therefore, they must be as muchbiofidelic as possible to provide back to patients close to their lost capacities. In the case of a limb,the complete behavior of the muscles and bones has to be reproduced during movement. However,it is much more complex than it seems, especially because of the cocontraction of agonist andantagonist muscles. This phenomenon ensures stability and protection of the joints, but also themodulation of the stiffness. The later is very important for two main reasons : the optimization ofenergy consumption, and safe interaction with the environment.To design biofidelic prostheses, it is highly desirable to reproduce this variable stiffness. Severalapproaches have been proposed, the one we study here is to use of Variable Impedance Actuators(VIA). The mechanical system of these actuators have springs inside and so, the global stiffnesscan be changed over time.The main problem with VIA is their control. We can decouple it, this means controlling separatelyposition and stiffness, but in this way, the full potential of variable stiffness is not exploited.Our research question can be summed up as follow : How to perform the optimal non decoupledcontrol of VIA ?At first, we modelized a VIA and linearized its evolution function. Then, we tested several algorithms(collocation and Linear Quadratic Regulator (LQR)) among the classical methods to controlit with fixed stiffness. The collocation method required a too long computation time, and we henceprefered the LQR. The results using LQR were very satisfactory both in terms of convergence andin robustness. However this method is not efficient with variable stiffness, and we can't linearizethe equations.The algorithm Differential Dyamic Programming (DDP) solves optimal control problem for nonlinear systems. It is similar to a Newton descent, in which we take into account the second derivatives.This is precisely the key to non linearizable systems. We tested and validated with simulationsthis algorithm, using a jump performed by a humanoid robot with VIA. However, the complexityof DDP tends to be very high and limits its use in real time. We therefore sought to optimize it in asecond time.To limit the number of operations performed during a computation, we used the Gauss Newtonhyptohesis to approximate the second derivatives. We then used a square-root formulation of theDDP algorithm. The complexity decreased from 11n3 operations at each cycle to 3n3.To conclude, uncoupled control of VIA is possible using DDP in a simulation environment. Thefuture step of this work would be the experimental validation of the results.

Résumé

Les prothèses sont des dispositifs permettant de remplacer la fonction d'un organe ou d'unmembre. Elles doivent donc être le plus biofidèle possible pour rendre aux patients l'intégralité deleurs capacités perdues. Dans le cas d'un membre, il est donc nécessaire de reproduire le comportementdes muscles et des os lors des mouvements. Or, ce dernier est bien plus complexe qu'il n'yparaît, et ce notamment à cause de la cocontraction des muscles agonistes et antagonistes qui assurestabilité et protection des articulations et qui permet d'en moduler la rigidité. Ce dernier point esttrès important, pour deux raisons principales : il permet d'optimiser la consommation d'énergie etd'interagir avec l'environnement en toute sécurité.Afin de concevoir des prothèses biofidèles, il est donc pertinent de chercher à reproduire cette rigiditévariable. Plusieurs approches ont été imaginées, celle que nous étudions ici consiste à employerdes actionneurs à impédance variable. Ces actionneurs possèdent des ressorts dans leur mécanisme,que l'on peut régler de façon à changer la rigidité du système au cours du temps.Le problème principal lié à ces actionneurs est leur commande. Il est possible de la découpler, i.e.de contrôler séparément la rigidité et la position de l'actionneur, mais on n'exploite pas dans ce casle plein potentiel de la rigidité variable.Notre problématique se résume donc ainsi : comment calculer la commande optimale non découpléed'un actionneur à impédance variable ?Dans un premier temps, nous avons modélisé un actionneur à impédance variable et linéarisé safonction d'évolution. Puis nous avons testé plusieurs algorithmes (la méthode par collocation et lerégulateur linéaire quadratique) parmi les plus classiques en contrôle optimal pour le contrôler àimpédance fixe. Si la méthode de collocation exigeait un trop long temps de calcul, les résultatsavec le régulateur linéaire quadratique étaient très satisfaisants, tant en convergence qu'en stabilité.Toutefois, cette méthode n'est pas envisageable à impédance variable. En effet, la linéarisation deséquations n'est plus possible.L'algorithme Differential Dynamic Programming (DDP) permet de résoudre le problème de contrôleoptimal pour des systèmes non-linéaires. Son fonctionnement se rapproche de celui d'un descentede Newton dans laquelle on tiendrait compte des dérivées secondes, ce qui permet justement d'étudierdes systèmes pour lesquels la linéarisation est impossible. Nous avons testé et validé cet algorithmeen simulation, notamment sur un saut réalisé par un robot humanoïde équipé d'actionneursà impédance variable. Néanmoins, la complexité de cet algorithme est très élevée et limite son utilisationen temps réel. Nous avons donc cherché à l'optimiser dans un second temps.Afin de limiter le nombre d'opérations effectuées au cours d'un calcul par DDP, nous avons employél'hyptohèse de Gauss-Newton pour approcher les dérivées secondes. Nous avons alors reformulé l'algorithme en utilisant les racines carrées des matrices en jeu et diminué la complexité : de11n3 opérations à chaque cycle à 3n3 opérations, où n est la taille de notre fenêtre de prévision.En conclusion, on a montré qu'il est possible de contrôler de manière non découplée un actionneurà impédance variable, grâce à l'algorithme DDP, en simulation. La suite future de ce travail enserait la validation expérimentale.
Department: Institut de génie biomédical
Program: Génie biomédical
Academic/Research Directors: Maxime Raison, Sofiane Achiche
PolyPublie URL: https://publications.polymtl.ca/1370/
Institution: École Polytechnique de Montréal
Date Deposited: 30 May 2014 11:38
Last Modified: 08 Nov 2022 21:38
Cite in APA 7: Geoffroy, P. (2014). Programmation différentielle dynamique pour la commande optimale d'actionneurs biomimétiques [Master's thesis, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/1370/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item