<  Retour au portail Polytechnique Montréal

Fusion des données provenant d’un système de paiement par cartes à puce, d’un système de compte à bord et d’horaire pour l’imputation d’arrêts d’embarquement en transport collectif

Félix Légaré

Mémoire de maîtrise (2014)

[img]
Affichage préliminaire
Télécharger (2MB)
Citer ce document: Légaré, F. (2014). Fusion des données provenant d’un système de paiement par cartes à puce, d’un système de compte à bord et d’horaire pour l’imputation d’arrêts d’embarquement en transport collectif (Mémoire de maîtrise, École Polytechnique de Montréal). Tiré de https://publications.polymtl.ca/1628/
Afficher le résumé Cacher le résumé

Résumé

RÉSUMÉ : Avec l’adoption de systèmes de péage par cartes à puce, une grande quantité de données opérationnelles est maintenant accessible pour la planification des transports. Ces données demandent cependant un traitement préalable comme elles sont souvent récoltées pour répondre à des besoins administratifs comme la collecte de revenus. Ce projet porte sur l’attribution d’arrêts aux données d’embarquements provenant du système de péage automatisé par cartes à puce du Réseau de Transport de Longueuil (RTL). Cette attribution a été effectuée par un algorithme utilisant des requêtes SQL. Les données de localisation des véhicules sont déjà utilisées pour évaluer le service et en améliorer la ponctualité. Les données de systèmes de décompte automatisé de passagers sont utilisées pour connaître la demande sur les réseaux de transport et la charge des autobus. Les données de cartes à puce ont plusieurs applications. Une fois enrichies d’arrêts d’embarquement ainsi que d’arrêts de destination, plusieurs analyses peuvent être faites grâce aux données de cartes à puce. Il est possible d’analyser la demande, d’établir les zones du réseau les plus populaires et d’analyser le comportement des usagers. Les données de cartes à puce peuvent aussi compléter et améliorer l’information obtenue grâce aux enquêtes origines-destinations puisqu’elles couvrent un plus grand nombre de déplacements et que l’information sur ceux-ci est plus précise. La méthodologie utilisée pour cette recherche est la suivante. Tout d’abord, le système d’information du RTL est caractérisé pour pouvoir proposer une structure d'accueil pour les données. Trois tables principales sont utilisées. La table CAP (cartes à puce) comprend les données du système de péage automatisé par cartes à puce où les transactions d’embarquements sont enregistrées. Ces transactions ne contiennent pas de données de localisation. La table SDAP (système de décompte automatique de passagers) comprend les données de localisation des autobus lors des passages aux arrêts et les données de compte à bord. La table GTFS (Google Transit Feed Specification) comprend les données du service planifié. Ensuite, les tables sont comparées entre elles pour vérifier l’intégrité des données. L’algorithme d’attribution d’arrêts est réalisé en trois étapes. La première étape est d’utiliser les données de la table SDAP pour enrichir les embarquements CAP. La deuxième étape est d’utiliser les habitudes des usagers et les embarquements CAP ayant obtenu des arrêts à la première étape pour dériver les arrêts d’embarquement manquants. La dernière étape est d’utiliser les données GTFS pour finir l’enrichissement des embarquements CAP. La caractérisation des données a permis de mettre en évidence des variations dans l’intensité des activités semblables pour les trois tables avec des pointes d'appariement maximal le matin et en début de soirée en semaine et beaucoup moins d’activités couplées la fin de semaine. La caractérisation a aussi permis de voir un manque de données au niveau de la table SDAP alors que beaucoup moins d’autobus y sont actifs que dans la table CAP, où il y a significativement moins de passages capturés que de passages prévus. Le manque de données dans la table SDAP rend l’application de l’algorithme beaucoup moins efficace. L’application de l’algorithme d’attribution d’arrêt aux embarquements CAP a permis d’attribuer un arrêt à 91.7 % des embarquements. 54% ont été attribués lors de l’enrichissement grâce aux données SDAP, 27.2 % lors de l’enrichissement grâce aux habitudes des usagers et 10.5% lors de l’enrichissement grâce aux données GTFS.-----------ABSTRACT : A huge amount of data is now collected in public transit. With the arrival of automated fare collection system, a lot of operational data is now accessible. This data requires to be processed because it is usually collected for administrative purpose. This project aims to assign a stop location to the boarding transactions recorded by the RTL’s fare collection system using smartcard. The assignment is made using an algorithm running SQL queries. Vehicle location data is already used to evaluate public transit service and to improve service punctuality. Automated passenger count data is used to know the demand on the transit network and the load on each bus. Automated fare collection system data using smartcard are widely used. Smartcard data enrich with boarding location and alighting location can be analyzed with many purposes. It is possible to use smartcard data to analyze demand on the network, popular boarding and alighting stops and user behavior. Smartcard data can be used to complement and improve origin-destination survey with information on a larger number of trip and more precise information. The research methodology is the following. First, the RTL’s information system is characterized. Three tables are used in this research. The CAP (AFC) table contains the boarding transactions from the fare collection system using smartcard. Those transactions do not contain boarding locations. The SDAP (AVL/ APC) table contains the vehicles locations and the passenger count data. The GTFS table contains data on the planned service. Second, the tables are compared to verify the data integrity. Third, the algorithm is used to assign boarding stops to the CAP data. The algorithm starts by using the SDAP data. Then it uses the commuters’ habits to derive boarding stops from results of the first assignment. Finally, the GTFS data is used to assign stops to the remaining boarding transactions. The data characterization shows similar variations through time between the activities of the three tables with peak periods in the morning and in the evening during week days and a lower level of activities during the week-ends. The characterization also shows missing data in the SDAP table. There are a fewer active buses than in the CAP table and fewer vehicle locations were capture than what was scheduled.

Document en libre accès dans PolyPublie
Département: Département de mathématiques et de génie industriel
Directeur de mémoire/thèse: Martin Trépanier et Catherine Morency
Date du dépôt: 01 avr. 2015 15:35
Dernière modification: 24 oct. 2018 16:11
Adresse URL de PolyPublie: https://publications.polymtl.ca/1628/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel