<  Back to the Polytechnique Montréal portal

Analyse et visualisation du processus d’écriture à l’aide des graphes

Hélène-Sarah Bécotte-Boutin

PhD thesis (2019)

[img] Restricted to: Repository staff only until 18 November 2020.
Cite this document: Bécotte-Boutin, H.-S. (2019). Analyse et visualisation du processus d’écriture à l’aide des graphes (PhD thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/4047/
Show abstract Hide abstract

Abstract

RÉSUMÉ: Lorsqu’un individu écrit un texte à l’ordinateur, il enfonce successivement des frappes sur son clavier dans le but de créer des mots et des phrases. Ces frappes peuvent être des caractères tels que des chiffres, des lettres ou des symboles. Ces frappes peuvent aussi être l’action de supprimer ces caractères. Après avoir altéré le texte de multiples fois, en effectuant ces frappes à plusieurs différents endroits, l’individu, qui est plus précisément appelé le scripteur, considérera que ce texte est terminé et arrêtera d’écrire à ce moment. L’ensemble du processus d’écriture est enregistré de telle manière qu’il est possible d’avoir accès à une liste exhaustive et détaillée de l'ensemble des opérations d’écriture effectuées par le scripteur lorsque celui-ci rédigeait le texte. Ces fichiers sont par contre plutôt denses, sont constitués de données brutes et sans prétraitement, il est difficile pour un humain de les analyser et d’en tirer des conclusions sur le processus d’écriture. Le processus d’écriture est étudié par des chercheurs dans des domaines tels que la didactique, la linguistique et la psychologie cognitive. Bien que leurs objectifs de recherche soient différents, ils ont comme point commun de chercher à trouver des régularités dans les structures du processus d’écriture. Plusieurs particularités rendent l’étude du processus d’écriture complexe, dont le fait que le texte est difficile à observer puisque son état change constamment. Actuellement, peu d’automatismes existent pour faciliter l’analyse du processus d’écriture. Parmi les méthodes qui ont été employées pour agréger les données du processus d’écriture, celle qui est privilégiée est la transformation de celles-ci en visualisations. Dans le cadre de ce projet de recherche, la théorie des graphes est utilisée pour structurer l’information et les relations entre les frappes dans le but de développer des outils permettant de faciliter la recherche de tendances dans le processus d’écriture. Puisque les graphes peuvent également être visualisés, les modèles créés sont d’abord exploités en tant que visualisations. Deux visualisations créées à partir des graphes sont présentées dans cette thèse : la visualisation progressive et le modèle sans pertes. La visualisation progressive vise à condenser les meilleurs attributs des visualisations existantes tout en incluant un maximum de dimensions propres à l’écriture. La seconde visualisation, le modèle sans pertes, a été créée dans le but de structurer l’information de façon telle qu’il est possible d’utiliser des propriétés des graphes pour déceler certaines tendances dans les données. Ce modèle peut être utilisé en tant que visualisation, mais ses caractéristiques de présentation ne sont pas propres à celui-ci, ce qui le rend flexible. Finalement, les mesures de proximité chronologique seront présentées. Celles-ci sont calculées à partir de la structure du graphe du modèle sans pertes. Elles permettent de démontrer qu’il est possible d’extraire de l’information pertinente avec le modèle sans pertes. Cette information est autrement difficile à obtenir. Les modèles élaborés dans le cadre de cette thèse visent à permettre une analyse beaucoup plus facile du processus d’écriture.----------ABSTRACT: When someone writes a text using a computer, he successively presses some keys on the keyboard in order to create words and sentences. These keystrokes can either be letters, numbers, symbols or the act of deleting them. After altering the text many times by inserting or deleting parts of it in just as many different places, this person, who is more precisely called the writer, will consider that this text is finished and will then stop writing. The entire process is recorded in a file containing an exhaustive and detailed list of all the writing operations performed by this writer. These files are dense and consist of raw data. Without any preprocessing, it is difficult for a human to analyze them and to draw conclusions about the writing process. Researchers from many fields study the writing process. Although the research objectives in didactics, linguistics or cognitive psychology are different, they share the fact that they seek to find regularities in the structures of the writing process. The process of writing a text is complicated to observe as the state of a text changes constantly. There are not a lot of methods that can aggregate the writing data and facilitate the analysis of the writing process. Among those available, the most used are visualizations of the writing process which consists of transformed data. In this thesis, graph theory is used both to structure the data and the relations between the keystrokes in order to develop tools to help pattern analysis in the writing process. Since graphs can also be visually displayed, the models created are also exploited as visualizations. Two visualizations created out of graph structures are presented in this thesis : the progressive visualization and the lossless model. The progressive visualization aims to condense the best attributes of existing visualizations while including a maximum of dimensions specific to writing. The second visualization, the lossless model, was first conceived as a way to structure the information in order to be able to use graph theory properties to detect some patterns in the data. This model can be used as a visualization, but its presentation features are not unique to it, making it flexible. Finally, the chronological proximity measures will be presented. They are calculated from the graph structure of the lossless model. They demonstrate that it is possible to extract easily relevant information from the lossless model. This specific information is otherwise difficult to obtain The models developed in this thesis were created to allow a much easier analysis of the writing process.

Open Access document in PolyPublie
Department: Département de mathématiques et de génie industriel
Academic/Research Directors: Alain Hertz, Gilles Caporossi and Chistophe Leblay
Date Deposited: 18 Nov 2019 13:56
Last Modified: 12 Dec 2019 10:15
PolyPublie URL: https://publications.polymtl.ca/4047/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only