<  Back to the Polytechnique Montréal portal

Textual Data and Natural Language Processing for Next Generation Intelligent Transportation Systems: Perspectives, Techniques and Challenges

Banafsheh Mehri

Ph.D. thesis (2022)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (6MB)
Show abstract
Hide abstract

Abstract

ABSTRACT Intelligent Transportation System (ITS) refers to technologies applied to transportation sys-tems that improve transportation outcomes such as safety, reliability, informed travel choices, environmental performance, and network operation resilience. A momentous change in ITS in recent years is that much more public data is now available from various data sources that can be processed to address a variety of areas in transportation. As the systems shift from traditional technology-driven systems to data-driven intelligent transportation systems, it leads to evolution in ITS development. Notwithstanding, in the midst of this change, textual data is one sort of data that has been less explored for transportation application. Social media data is a special form of rich textual content, generated by users, holding tremendous potentials to be used in a variety of areas in transportation. This thesis focuses on exploring the capacity of social media data where it can be beneficial to ITSs and propose natural language processing approaches to examine the potential usages of such data in transportation domain. To carry out this work, a research design was formulated including specific methods, each to address one area in the transportation field. The scope of the study was limited to include only Metro network and as case studies, Canadian subway network and the Montreal metro network. The study was conducted in four major parts, of which each involved a distinctive approach. All parts are related in terms of objectivity and differed in approach and detail. Part one involved an approach for multilingual text classification to alert incidents in the metro transportation network within the geolocation boundaries of Montreal metropolitan area in Quebec, Canada. It deals with classification methods combined with multiple text representation algorithms in order to perform incident detection from tweets. Empirical experiments in this study demonstrates the ability of Bidirectional Encoder Representations from Transformers approach to generalize to cross-lingual and multilingual representation for metro incident related tweet classification. Part two elaborates a methodology to assess passengers’ perceptions of transit services and the impact of incidents on transportation users based on social media data. It focuses on investigating the effectiveness of the usage of social media data in transportation studies to model and evaluate public transport riders’ sentiment in different situations and regarding different topics. The case study is conducted in Société de transport de Montréal STM metro network in Montreal, Quebec, Canada.

Résumé

RÉSUMÉ Les Systèmes de Transport Intelligents (STI) contribuent à l’amélioration des différents aspects des réseaux de transport tels que la sécurité, la fiabilité, les choix de voyage éclairés, la performance environnementale et la résilience de l’exploitation du réseau. Un changement significatif dans STI au cours des dernières années est que ces systèmes passent des systèmes traditionnels axés sur la technologie aux systèmes axés sur les données. Cependant, au milieu de ce changement, les données textuelles sont une sorte de données qui a été moins explorée. Depuis ces dernières années, beaucoup plus de données publiques sont désormais disponibles à partir de diverses sources de données qui peuvent être traitées pour aider à améliorer une variété de domaines dans les systèmes de transport. Les données des réseaux sociaux sont une forme spéciale de contenu textuel riche, généré par les utilisateurs, qui recèlent d’énormes potentiels d’utilisation dans divers domaines du transport. Cette thèse se concentre sur l’exploration des domaines dans lesquels les données textuelles, notamment les données des réseaux sociaux, peuvent être bénéfiques pour STI et propose des approches de traitement automatique du langage naturel (TALN) pour examiner le potentiel de ces données pour aider à améliorer plusieurs domaines des réseaux de transport. Cette thèse propose une séquence de méthodes nécessaires pour transformer les données textuelles en contenu utilisable dans la modélisation pour la pratique et la recherche en introduisant les concepts fondamentaux et en proposant les méthodes de métriques de similarité, de text embeddings, d’analyse de sentiment et de modélisation de topics, chacune abordant un do-maine de problèmes rencontrés dans l’application des techniques de TALN dans le domaine des transports. Pour mener cette étude, un plan de recherche a été formulé incluant des méthodes spécifiques, en quatre grandes parties, dont chacune implique une approche distincte. Toutes les parties sont liées en termes d’objectifs et diffèrent dans leur approche et leurs détails. La portée de l’étude a été limitée pour inclure uniquement le réseau du métro et comme études de cas, les réseaux de métro canadiens. Le premier article de cette thèse implique une approche de classification de texte multilingue pour détecter les incidents dans le réseau de transport du métro dans la région métropolitaine de Montréal au Québec, Canada.

Department: Department of Electrical Engineering
Program: Génie électrique
Academic/Research Directors: Yves Goussard and Martin Trépanier
PolyPublie URL: https://publications.polymtl.ca/10748/
Institution: Polytechnique Montréal
Date Deposited: 20 Jun 2023 13:35
Last Modified: 11 Jul 2024 03:05
Cite in APA 7: Mehri, B. (2022). Textual Data and Natural Language Processing for Next Generation Intelligent Transportation Systems: Perspectives, Techniques and Challenges [Ph.D. thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10748/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item