Mémoire de maîtrise (2012)
Document en libre accès dans PolyPublie |
|
Libre accès au plein texte de ce document Conditions d'utilisation: Tous droits réservés Télécharger (7MB) |
Résumé
La production traditionnelle d'animations 3D pour un jeu vidéo ou un film d'animation est un processus lourd. Les animateurs ont besoin de plusieurs années de pratique et de bons logiciels de création de contenu numérique pour réussir à créer des animations 3D. Cela est dû à la complexité du logiciel et à la complexité de la tâche. La création d'un cycle de marche réaliste dans une scène complexe nécessite de nombreux détails de bas niveau pour atteindre un niveau élevé de réalisme. Ce mémoire propose une vue de haut niveau dans la création automatique des animations 3D afin de simplifier le processus global de production de l'animation. Afin d'aborder cette problématique, l'objectif général de la recherche a consisté à élaborer un prototype logiciel capable de générer automatiquement des animations 3D qui représentent le sens d'une phrase simple. Ce projet faisait partie intégrale du projet GITAN dans le domaine de l'infographie. GITAN proposait une solution pour générer des animations 3D à partir du texte. La solution proposée dans ce mémoire constitue principalement le module graphique qui génère la scène 3D animée qui représente la phrase d'entrée. Avec ce système, la complexité de la construction de la scène animée est considérablement réduite, puisque nous utilisons une représentation textuelle pour décrire l'animation et les différents objets dans la scène. La revue bibliographique a suggéré que les systèmes semblables qui permettent de générer automatiquement des animations 3D à partir du texte sont souvent très orientés vers un domaine d'application spécifique, par exemple les accidents automobiles, les comportements ou les interactions des personnages. L'automatisation de la génération de la scène sur ces systèmes se base souvent sur des langages script ou des formalismes qui étaient souvent orientés au domaine d'application. De plus, nous voulions générer l'animation en utilisant un format d'échange 3D à la place d'afficher directement l'animation. Nous pensons que l'utilisation d'un format d'échange 3D nous permet de bien générer la scène 3D, puisqu'un bon format d'échange intermédiaire permet de bien définir une animation de façon standard et fournit des outils nécessaires pour son utilisation. Pour cette raison, nous avons utilisé COLLADA comme format 3D pour représenter nos animations. D'après ces observations, nous avons émis trois hypothèses de recherche. La première supposait qu'il était possible de créer un formalisme capable de décrire une scène animée à partir d'une phrase simple. Le formalisme nous permet de faire une description de la scène animée en utilisant des noeuds,des contraintes et des images clés. La deuxième hypothèse supposait qu'il est possible de traduire le script qui décrit la scène vers le fichier COLLADA. Nous avons proposé un système logiciel qui permet de traduire le script vers un fichier COLLADA qui contient l'animation 3D. Finalement, la troisième hypothèse supposait que l'animation générée par le système permet de communiquer le sens de la phrase initiale. Le système doit pouvoir communiquer le message de la phrase qui décrit la scène vers les observateurs. Pour tester ces hypothèses, la méthodologie que nous avons retenue consiste, premièrement, à la création du formalisme qui permet de décrire la scène 3D. Nous avons proposé un schéma XML qui permet de déclarer des noeuds, des animations prédéfinies, des contraintes et des images clés qui décrivent la scène la générer. Par la suite, nous avons proposé une architecture logicielle modulaire qui traduit le script vers le fichier COLLADA. Le système utilise des algorithmes pour positionner correctement les objets dans la scène et pour synchroniser les animations. Finalement, nous avons effectué un sondage pour valider la communication du message par les scènes 3D générées. Le résultat du sondage nous permet d'analyser la compréhension du message par les observateurs et l'influence de l'environnement de la scène 3D sur le message, et ainsi, déterminer s'il est possible de transmettre le sens de la phrase initiale avec l'animation 3D. Les résultats que nous avons obtenus sont très satisfaisants. Nous avons été capables de décrire les scènes avec le formalisme proposée. De plus, le système logiciel génère des fichiers COLLADA bien structurés et il est capable de générer deux types de scènes : des scènes statiques et des scènes animées. Finalement, l'analyse des résultats du sondage montre que les scènes animées permettent de mieux communiquer les messages que les scènes statiques, mais l'utilisation correcte de deux types de scènes en fonction de la phrase permet de bien communiquer le message. En eet, les phrases qui contiennent des verbes d'état seront mieux représentées par des scènes statiques, tandis que des animations 3D permettent de mieux représenter des phrases qui contiennent des verbes d'action. De plus, l'analyse de l'influence de l'environnement nous a permis de constater qu'il n'offre pas d'amélioration dans la communication du message. Ces résultats nous ont permis de constater que le système est capable de générer de façon automatique des animations 3D qui transmettent le sens d'une phrase simple ce qui permet de simplifier le processus de production traditionnelle des animations 3D.
Abstract
The traditional production of 3D animations for a video game or an animated film is a cumbersome process. Animators need several years of practice and excellent skills using Digital Content Creation (DCC) software to successfully create 3D animations. This is due to the complexity of the software and the complexity of the task. Creating a realistic walk cycle in a complex scene requires many low-level details for achieving a high level of realism. This thesis proposes a high-level view in the automatic creation of 3D animations to simplify the overall process of animation production. To address this problem, the overall objective of the research was to develop a software prototype able to automatically generate 3D animations that represent the meaning of a simple sentence. This project was an integral part of the project GITAN in computer graphics. GITAN proposed a solution to generate 3D animations from text. The solution proposed in this paper is mainly the graphics module that generates animated 3D scene representing the input sentence. With this system, the complexity of building the animated scene is greatly reduced, since we use a textual representation to describe the animation and the various objects in the scene. The literature review suggested that similar systems that automatically generate 3D animations from text are often related to a specific application domain such as automobile accidents, behavior or interactions of the characters. The automation of the scene generation for these systems is often based on scripting languages related to an application domain. In addition, we wanted to generate the animation using a 3D exchange format instead of directly display the animation. We believe that using a 3D exchange format allows us to better generate the 3D scene, since a good intermediate exchange format allows to define animations as building blocks and provides the tools to use them. For this reason, we used COLLADA as 3D format to represent our animations. From these observations, we formulated three research hypotheses. The first one assumed that it was possible to create a formalism able to describe an animated scene from a simple sentence. The formalism allows us to make an animated description of the scene using nodes, constraints and keyframes. The second hypothesis assumed that it is possible to translate the script that described the scene to a COLLADA file. We proposed a software system that translates the script to a COLLADA file that contains the 3D animation. Finally, the third hypothesis assumed that the animation generated by the system communicate the original meaning of the sentence. The system must be able to communicate the message of the sentence describing the scene to the observers. To test these hypotheses, the methodology we have adopted consists, rst of all, in the creation of the formalism for describing the 3D scene. We have proposed an XML schema for declaring nodes, animation presets, constraints and keyframes to describe the scene. Subsequently, we proposed a modular software architecture that translates the script into the COLLADA file. The system uses algorithms to correctly position the objects in the scene and to synchronize animations. Finally, we conducted a survey to validate the communication of the message contained in the 3D scenes. The result of the survey allows us to analyze the transmission of the message to the observers and the influence of the environment of the 3D scene on the message, and so, determine if it's possible to transmit the original meaning of the sentence with the 3D animation. The results we obtained are very rewarding. We were able to describe the scenes with the proposed script language. In addition, the software system is generating well structured COLLADA files and it is capable of generating two types of scenes: static scenes and animated scenes. Finally, analysis of survey results shows that the animated scenes can better communicate messages than static scenes, but the proper use of the two types of scenes according to the phrase can eectively communicate the message. Indeed, sentences that contain state verbs will be better represented by static scenes, while 3D animations can more adequately represent sentences that contain action verbs. Furthermore, in the analysis of the influence of the environment, we found that it offers no improvement in communicating the message. These results revealed that the system is able to automatically generate 3D animations that convey the sense of a simple sentence to simplify the production process of traditional animation.
Département: | Département de génie informatique et génie logiciel |
---|---|
Programme: | Génie informatique |
Directeurs ou directrices: | Michel Gagnon et Benoît Ozell |
URL de PolyPublie: | https://publications.polymtl.ca/815/ |
Université/École: | École Polytechnique de Montréal |
Date du dépôt: | 09 juil. 2012 16:28 |
Dernière modification: | 25 sept. 2024 19:47 |
Citer en APA 7: | Polar Hito, R. M. (2012). Création automatique des animations 3D [Mémoire de maîtrise, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/815/ |
---|---|
Statistiques
Total des téléchargements à partir de PolyPublie
Téléchargements par année
Provenance des téléchargements