<  Back to the Polytechnique Montréal portal

Towards Station-Level Demand Prediction for Effective Rebalancing in Bike-Sharing Systems

Pierre Hulot

Masters thesis (2018)

[img]
Preview
Download (3MB)
Cite this document: Hulot, P. (2018). Towards Station-Level Demand Prediction for Effective Rebalancing in Bike-Sharing Systems (Masters thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/3160/
Show abstract Hide abstract

Abstract

Les systèmes de vélos en libre-service sont utilisés à l’échelle mondiale pour soulager la congestion et apporter une solution aux problèmes environnementaux dans les villes. De nos jours, presque toutes les grandes villes ont un tel système. Ces systèmes sont très pratiques pour les utilisateurs qui n’ont pas besoin de faire l’entretien du vélo et peuvent le rendre presque partout dans la ville. Cependant, le nombre croissant d’abonnés et la demande aléatoire rendent la planification opérationnelle du système très difficile. Prédire la demande en vélos a été l’objet de nombreuses recherches dans la communauté scientifique. Cependant, la plupart des travaux ont cherché à prédire la demande globale du réseau, qui n’est généralement pas suffisante pour améliorer la planification opérationnelle. En effet elle nécessite des prévisions spécifiques pour chaque station et à des moments précis de la journée. Ces travaux ont montré qu’une variation significative du trafic peut être liée à des comportements réguliers, et à des facteurs externes tels que les heures de pointe ou les conditions météorologiques. En particulier, de nombreux opérateurs utilisent des intervalles pour combler les lacunes dans la prédiction du trafic. Cependant, très peu de travaux ont cherché à correctement définir ces intervalles. Dans cette recherche, nous nous concentrons sur la modélisation de la distribution statistique du nombre de déplacements qui se produisent à chaque heure et chaque station. Ce modèle ne se contente pas de prédire l’espérance du nombre de voyages prévus, mais aussi la probabilité de chaque nombre de départs et d’arrivées par station en utilisant la demande historique. Le modèle mis en place est composé de trois parties. Tout d’abord, nous estimons, en utilisant des techniques d’apprentissage machine, le nombre de trajets attendus à chaque station. Puis, nous calculons la confiance sur la première prédiction (variance attendue). Enfin, nous déterminons la bonne distribution à utiliser.----------ABSTRACT: Bikesharing systems are globally used and provide relief to congestion and environmental issues in cities. Nowadays, almost all big cities have a bicycle-sharing system. These systems are very convenient for users that don’t need to do maintenance of the bicycle and can return it almost everywhere in the city. However, the increasing number of subscribers and the stochastic demand makes the operational planning of the system very difficult. Predicting bike demand has been a major effort in the scientific community. However, most of the efforts have been focused on the prediction of the global demand for the entire system. This is typically not sufficient to improve the operational planning, which requires demand predictions for each station and at specific moments during the day. A significant variation of the traffic can be linked to regular behaviors, and external factors as peak hours or weather. In particular, many system operators use fill level intervals which guide the redeployment crews in their efforts to equilibrate the system. However, little work has been done on how to effectively define those fill levels. In this research, we focus on modeling the distribution of the number of trips that occur at each hour and each station. This model not only seeks to predict the number of expected trips, but also determines as precisely as possible the expected distribution of trips. It uses the historical observed demand to predict future demand. The prediction model is composed of three parts. First, we estimate from historical data the expected number of trips, using machine learning techniques that use features related to weather and time. Second, we compute the confidence of the first prediction (expected variance). Finally, we focus on determining the right distribution to use. The first part uses a two-step algorithm that first reduces the problem to a simpler one, minimizing the information lost, then learns a predictive algorithm on the reduced problem. The prediction process inverts this mechanism. Several simplification and prediction methods are tested and compared in terms of precision and computing times. The final test compares distribution estimations in terms of log likelihood. The results show that the choice of the best algorithm depends on the station. Then a combined model is proposed to better model the demand. Our models are tested on several networks (Montreal, New York and Washington). Finally, this model is used to define an online rebalancing strategy close to the one used by Bixi at Montreal. This strategy has been deployed in Montreal.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Dissertation/thesis director: Daniel Aloise, Sanjay Dominik Jena and Andrea Lodi
Date Deposited: 17 Oct 2018 15:22
Last Modified: 24 Oct 2018 16:13
PolyPublie URL: https://publications.polymtl.ca/3160/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only