<  Back to the Polytechnique Montréal portal

Analyse du recours aux correspondances dans un réseau de transport en commun à l'aide des données de cartes à puce

Benjamin Disson

Master's thesis (2020)

Open Access document in PolyPublie
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (31MB)
Show abstract
Hide abstract


Transit organizations offer connected and large networks to effectively answer the diversification of origin – destination pairs. But because a direct trip is not always possible, travelers must sometimes use several transfers to reach their destination. A transfer is defined as the change from a vehicle to another during a trip. It generates a physical and mental e˙ort, a waste of time as well as some stress for users. All of which induce a trip discontinuity and reduce the attractiveness of public transportation in favor of other alternatives, especially private cars. If public transit agencies want to improve their service, it is fundamental for then to find solutions to reduce the impacts caused by transfers within the networks. In order to propose eÿcient solutions, it is necessary to understand how travelers use transfers. Historically, such researches are achieved with passenger surveys. They are conducted to determine the attributes that influence the choice to make a transfer for users. But those methods are limited because they do not allow to observe passengers behaviors fluctuations. The use of smart card data brings new possibilities for these studies, both because the sample is larger and because data are spatiotemporal. Each time a traveler validates his card on a fare collection device, the transaction is registered with information from the card and the device. This master's thesis develops a global methodology to analyse the use of transfers through smart cards fare collection data. This method is able to handle daily recorded data from an entire network. The practical applications are made from data of 10,000 smart cards from the Société de transport de Montréal (STM) for the year 2016. These cards have a monthly or a yearly subscription and are randomly selected. The sample, not necessarily representative of the use of the STM's network, is made up of 9,550,725 transactions. The analysis is built around four objectives. The first is the development of an algorithm to transform the original transaction database into a trip database, in order to detect, count and locate all the transfers made into the network. It allows to construct the databases useful for the rest of the project. Particularly, the algorithm processes 97.48 % of the transactions, giving 5,887,074 trips with 4,983,278 transfers. To enrich the databases, two methodological elements are used. First, trips are put into categories according to their transfers composition. A sequence of modes is assigned to each trip, allowing to know with only one attribute the number of transfers, as well as their types and the order in which they are made. Afterwards, the network is described using a bus line typology. Each line is characterized according to its level of service, its location and the feasible connections with the other lines of the network. The second objective takes an interest in the daily fluctuation of the use of transfers. It is about explaining how travelers from this sample resort to transfers in their daily trips. To do so, the distribution of trips is firstly studied. It highlights the variations in the network use. The peak times are identified, showing a difference between weekdays and weekends. Then the analysis of the proportion of trips according to the time of the day and the sequence of modes reveals that the bus and the metro (subway) are equally used in this sample, with respectively 33.04 % and 32.51 % of the trips. But the metro is privileged during the peak periods while the bus is privileged during off-peak periods. Likewise, users in this sample tend to do more transfers during the peak periods. Next, the symmetry between successive trips is considered. It allows to describe the distribution of activities generated by public transit and reveals that 61.11 % of passengers from this sample with two trips in a day use it to make return trips, among which 50.09 % with the same combination of lines in both directions. Finally, it shows that in this sample there are more fluctuation in the bus utilisation than in the metro utilisation.To continue the analysis of the use of transfers, the third objective is the description of the passengers behaviors. One segmentation with the k-means method is made on a vector built with the daily trips types from each card. This leads to seven clusters showing a di˙erent use of transfers in the trips. The within-group variability proves that in this sample, users who favor trips with one transfer are less stable than the ones which favor directs trips (on average respectively ± 12.07 % to ± 6.05 % of variation). Additionally, a higher fluctuation is observed among travelers that privilege the use of metro rather than the bus. A group change probability matrix explains that users from this sample favor in priority a transportation mode rather than a transfer type. Then, a data merging from days to weeks and a Sankey diagram illustrate the passengers' regularity. They are stable within the weekdays but adopt a different behavior in the weekend, when they make fewer trips and favor the use of the bus. Finally, the analysis of the lines used allows to determine the geographical position of the clusters. It highlights that travelers who favor the bus are distributed all around the island of Montreal while the ones who favor the metro stay primarily in the central areas. Finally, the last objective is the characterization of the network use. It is about studying the lines in order to detect the ones that generate more transfers. An independence indicator is created to rank the lines and graphs are developed to schematically represent the interactions between them. This study shows that the independence is linked to both the service and the geolocation of the lines. The ones with the highest independence indicator are the ones defined by a specific service, a large coverage or by few interactions with the rest of the network. On average from this sample, bus lines are more independent than the metro ones, respectively 0.68 to 0.55. Furthermore, a multiple linear regression proves that the independence indicator of a line can be explained using the variables of its typology. This allows both to determine which lines to prioritize to provide a better service and to estimate the influence of future routes. Last, lines needing an improvement are deduced from the graphs and some solutions are listed. It is then possible to identify the principal stops used for bus to bus transfers and to classify each subway station according to its bus to metro, metro to bus and metro to metro transfers ratios. This view highlights important lines and shows that stations who generate the most transfers are located on the main boulevards and on terminuses. To conclude, this master's thesis contribute to the improvement of the methods to analyse users behavior, by including in the existing models the consideration of the transfers realized. It provides a new methodology to process smart cards fare collection data bringing knowledge about the impact of transfers, both on the network and its travelers. Nevertheless, technical limitations linked with the lack of information in the original database and the model's development o˙er new challenges and perspectives for future research.


Les sociétés de transport proposent des réseaux de plus en plus vastes et connectés pour répondre efficacement à la diversification des couples origine–destination. Seulement, un itinéraire direct n'étant pas possible pour chaque déplacement, les usagers doivent dans certaines situations recourir à une ou plusieurs correspondances. La correspondance est définie comme le passage d'un véhicule à un autre au cours d'un déplacement. Elle entraîne à la fois un effort physique et mental, une perte de temps et du stress pour les usagers, occasionnant une discontinuité du déplacement et diminuant l'attractivité du transport en commun (TC) au profit d'autres alternatives, notamment l'automobile particulière. Si les sociétés de transport veulent améliorer leur offre de service, il est essentiel de trouver des solutions pour limiter l'impact des correspondances. Afin de proposer des solutions efficaces, il est nécessaire de comprendre comment les usagers ont recours aux correspondances. Historiquement, ces recherches sont réalisées à l'aide d'enquêtes auprès des voyageurs. Elles sont utilisées pour déterminer les attributs qui influencent les usagers dans leurs choix de faire une correspondance. Mais ces méthodes manquent de profondeur, car elles ne permettent pas d'observer les fluctuations de comportement des usagers. L'utilisation des données de cartes à puce apporte de nouvelles possibilités pour ces études, à la fois car l'échantillonnage obtenu est plus large que celui des enquêtes et car ce sont des données spatio-temporelles. Chaque fois qu'un voyageur valide sa carte à puce sur une borne de perception, la transaction est enregistrée avec des informations provenant de la carte et de la borne. Ce mémoire de maîtrise développe une méthodologie universelle d'analyse de l'utilisation des correspondances à l'aide des données de transactions par cartes à puce. Cette méthode est capable de gérer des données récoltées quotidiennement sur l'intégralité d'un réseau multimodal. Pour ses expérimentations, le projet utilise les données de 10 000 cartes à puce de la Société de transport de Montréal (STM), pendant toute l'année 2016. Les cartes ont un abonnement mensuel ou annuel et sont sélectionnées aléatoirement. L'échantillon, non nécessairement représentatif de l'utilisation du réseau de la STM, est constitué de 9 550 725 transactions. L'analyse est construite à travers quatre objectifs. En premier, un algorithme de transformation des transactions en déplacements est créé afin de détecter, comptabiliser et localiser l'ensemble des correspondances faites sur le réseau. Il permet de fournir les jeux de données nécessaires à la suite du projet. En particulier, l'algorithme traite 97,48 % des transactions,fournissant une table de données de 5 887 074 déplacements avec 4 983 278 correspondances. Pour enrichir les données, deux éléments méthodologiques sont utilisés. Premièrement, les déplacements sont catégorisés selon leur composition en correspondances. Une série de modes est attribuée à chaque enregistrement, permettant de décrire avec un seul attribut le nombre de correspondances qui composent le déplacement, ainsi que leurs types et l'ordre dans lequel elles sont réalisées. Ensuite, le réseau est décrit à l'aide d'une typologie des lignes de bus. Chaque ligne est caractérisée selon son niveau de service, sa localisation et ses possibles interactions avec les autres lignes du réseau. Le second objectif s'intéresse à la fluctuation quotidienne de l'utilisation des correspondances. Il est question d'expliquer comment les usagers de l'échantillon ont recours aux correspondances dans leurs déplacements quotidiens. Pour cela, la répartition des déplacements est d'abord étudiée. Elle met en évidence les variations d'utilisations du réseau entre tous les jours de la semaine. Les heures de pointe sont identifiées, montrant un écart entre les jours ouvrés et les jours de fins de semaine. Ensuite, l'analyse de la proportion des déplacements de chaque série de modes par heure montre que le bus et le métro sont autant utilisés (respectivement 33,04 % et 32,51 % des déplacements), mais que le métro est favorisé en pointe alors que le bus est favorisé hors pointe. De même, les usagers de l'échantillon ont tendance à faire plus de correspondances pendant leurs déplacements en pointe. Ensuite, une analyse de la symétrie des déplacements successifs est réalisée. Elle permet de décrire la répartition des activités générées par le TC et révèle que 61,11 % des passagers avec deux déplacements quo-tidiens font un aller-retour, dont 50,09 % avec la même combinaison de lignes dans les deux directions. Enfin, elle témoigne que l'utilisation du bus est plus variable que celle du métro. Pour poursuivre l'analyse de l'utilisation des correspondances, le troisième objectif est la caractérisation du comportement des usagers de l'échantillon. Une segmentation par la méthode des k-moyennes est réalisée sur un vecteur composé séquences de correspondances dans les déplacements quotidiens de chaque carte. Il en résulte sept groupes marqués par une utilisation différente des correspondances dans les déplacements. La variabilité intragroupe montre que les voyageurs favorisant des déplacements avec une correspondance sont moins stables que ceux favorisant des trajets directs (en moyenne respectivement ± 12,07 % contre ± 6,05 %de variation). De plus, une fluctuation plus élevée est observée chez les passagers favorisant le métro plutôt que le bus. Une matrice de probabilité de changement de groupe explique que les usagers favorisent en priorité un mode de transport plutôt qu'un type de correspondance. Ensuite, un regroupement des données en semaines et un diagramme de Sankey illustrent la régularité des passagers de l'échantillon. Ils sont stables pendant les jours ouvrés, mais ont un comportement variable la fin de semaine, où ils se déplacent moins et favorisent davantage bus. Enfin, l'analyse de l'utilisation des lignes permet de positionner géographiquement les groupes. Elle souligne que les voyageurs favorisant le bus sont répartis sur tout le terri-toire de l'Île de Montréal alors que ceux privilégiant le métro restent principalement dans les régions centrales. Enfin, le dernier objectif est la caractérisation de l'utilisation des lignes du réseau. Il s'agit de les étudier afin de détecter celles qui génèrent le plus de correspondances. Un indicateur d'autonomie est créé pour classer les lignes et des graphes sont développés pour représenter schématiquement leurs interactions. Cette étude montre que l'indicateur dépend à la fois du service et de la géolocalisation des lignes. Celles dont l'autonomie est grande sont caractérisées par un service spécifique, une large couverture spatiale ou par peu d'interactions avec le reste du réseau. En moyenne, avec l'échantillon étudié, les lignes de bus sont plus autonomes que les lignes de métro, respectivement 0,68 contre 0,55. De plus, une régression linéaire multiple prouve que l'indice d'autonomie d'une ligne peut être expliqué à l'aide des variables de sa typologie. Cela permet à la fois d'identifier les lignes à prioriser pour augmenter l'offre de service et d'estimer l'influence des futurs parcours proposés. Enfin, à l'aide des graphes il devient possible de localiser les principaux arrêts impliqués dans les correspondances bus – bus et de classer les stations selon leur taux de correspondances bus – métro, métro – bus et métro – métro. Cette visualisation met en évidence les lignes importantes et montre que les stations générant le plus de correspondances sont celles situées sur les grands boulevards et aux terminus. En conclusion, ce mémoire contribue à l'amélioration des méthodes d'analyses comportementales des usagers en incluant dans les modèles existants la prise en compte des correspondances effectuées. Il fournit une nouvelle méthodologie de traitement des données de cartes à puce apportant des connaissances sur l'impact des correspondances, à la fois sur le réseau et sur ses usagers. Toutefois, des limites techniques liées au manque d'informations disponibles dans les données brutes et au développement du modèle offrent de nouveaux défis à relever et des perspectives d'études élargies.

Department: Department of Mathematics and Industrial Engineering
Program: Maîtrise recherche en génie industriel
Academic/Research Directors: Martin Trépanier and Catherine Morency
PolyPublie URL: https://publications.polymtl.ca/5214/
Institution: Polytechnique Montréal
Date Deposited: 13 Oct 2020 12:11
Last Modified: 19 Apr 2023 09:36
Cite in APA 7: Disson, B. (2020). Analyse du recours aux correspondances dans un réseau de transport en commun à l'aide des données de cartes à puce [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5214/


Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item