Development of a Method for Anomaly Detection in Time Series Applied to Vehicle Monitoring

Pablo Garcia Vega

Mémoire de maîtrise (2022)

Document en libre accès dans PolyPublie

Affichage préliminaire

Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (2MB)

Afficher le résumé

Cacher le résumé

Résumé

L'objectif de ce projet a été de développer une méthode de détection des anomalies dans les séries temporelles, applicable à la surveillance des véhicules routiers. La détection de comportements anormaux dans la conduite des véhicules permet d'anticiper les problèmes mécaniques, les mauvaises pratiques et d'améliorer les performances des véhicules. Pour le présent projet, nous avons collaboré avec une entreprise montréalaise visant l'électrification partielle des camions. Les séries temporelles associées aux véhicules proviennent de la surveillance effectuée par leurs capteurs tout au long du processus de conduite. Ces informations sont stockées sous la forme de séries chronologiques multivariées. La détection d'anomalies dans ces véhicules se heurte notamment à la présence de séries chronologiques multivariées, à la subjectivité de la définition de l'anomalie et au manque d'ensembles de données étiquetées. Les techniques étudiées dans la littérature ont été classées en méthodes probabilistes, basées sur la distance, basées sur un modèle, basées sur la fréquence et basées sur la théorie de l'information. À partir de ces approches, une méthodologie itérative a été développée. Elle se compose de cinq étapes, brièvement décrites ci-dessous : La première étape est appelée prétraitement. Ici, il faut s'assurer que les données d'entrée sont dans un format approprié. Certaines opérations de filtrage ou de normalisation sont effectuées à ce stade. La deuxième étape vise à extraire des sous-séquences de la série temporelle. Ces sous-séquences sont obtenues en recherchant les changements dans la dynamique de la série multivariée. Dans la troisième étape, un score d'anomalie est calculé pour chaque sous-séquence et un seuil d'anomalie est défini. À l'issue de la troisième étape, un lot de sous-séquences extraites de la série originale est défini comme des anomalies candidates. Les candidats sont regroupés en catégories en fonction de leur comportement dynamique dans la quatrième étape et la cinquième étape consiste à valider les catégories de candidats précédemment crées. Cette méthodologie est dite itérative car les résultats de chaque itération sont utilisés pour le calibrage des paramètres de chaque étape, ainsi que pour identifier à chaque fois des anomalies différentes. La méthode décrite est appliquée dans un cas réel en utilisant les données d'un partenaire industriel. Ce partenaire installe des modules « Stop Start » (SSM) dans des camions afin de réduire leur consommation de carburant. Lorsque le moteur du camion est arrêté, la batterie intégrée au SSM est chargée d'alimenter les systèmes auxiliaires du camion (chariot élévateur, climatisation, etc.) et elle aide également à redémarrer le camion. Actuellement, la détection des anomalies est effectuée visuellement par l'équipement de diagnostic. La valeur perçue par le partenaire industriel consiste à automatiser la détection et le diagnostic des anomalies. Dans le cadre du présent projet, les données recueillies par le SSM pour l'une des flottes de camions ont été utilisées. La base de données initiale contient un total de 206 923 observations de 279 variables différentes pour un camion. Au total, trois itérations de la méthode sont effectuées. Au cours de la première itération, l'extraction des sous-séquences est effectuée en utilisant la série temporelle de la position de l'accélérateur comme référence. Le score d'anomalie est calculé en mettant en relation les courbes de vitesse et d'accélération du véhicule. Les candidats identifiés sont les séquences pour lesquelles la relation entre l'accélération et la vitesse est inhabituelle. Un total de 19 séquences anormales sont validées par le partenaire industriel dans cette itération. La deuxième itération utilise une variable catégorielle, liée à l'état du SSM pour l'extraction des sous-séquences. En utilisant le même score d'anomalie que lors de la première itération, on obtient 82 anomalies validées par des experts. En outre, un patron d'anomalie est découvert dans cette itération, qui est utilisé dans l'itération suivante. La troisième itération utilise les mêmes sous-séquences extraites lors de la deuxième itération, mais le score d'anomalie est lié à la distance par rapport au patron anormal détecté lors de la deuxième itération. Ainsi, après classification et validation, 103 sous-séquences sont validées comme anomalies. Enfin, on obtient ainsi après trois itérations, en éliminant les anomalies qui se chevauchent entre les itérations, 122 séquences validées comme anomalies, 13 sous-séquences qui nécessitent une analyse plus approfondie pour être validées et 125 sous-séquences rejetées comme anomalies. Un outil visuel a été développé pour aider l'équipe de diagnostic lors du processus manuel de détection des anomalies. La méthode employée s'est avérée efficace pour la détection des anomalies dans le domaine de la surveillance des véhicules. Une attention particulière a été accordée pour faciliter l'interprétation des résultats par l'équipe de diagnostic du partenaire. Cependant, elle présente des limites liées à l'évolutivité, en raison de l'intervention humaine pour l'étape de validation, et à la mesure des performances, en raison du manque de données étiquetées. À l'avenir, l'incorporation de méthodes plus complexes et automatiques sera une option intéressante pour détecter de nouvelles anomalies, de même que le passage à un modèle hors ligne, tel que le modèle actuel, à un modèle en ligne dans lequel les données télémétriques des véhicules peuvent être analysées en temps réel.

Abstract

The objective of this project was to develop a method for detecting anomalies in time series, applicable to vehicle monitoring. The detection of abnormal behaviors in the driving of vehicles allows to anticipate mechanical problems, bad practices and to improve the performance of vehicles. For the present project, we collaborated with a Montreal-based company aiming at the partial electrification of trucks. The time series associated with the vehicles come from the monitoring performed by their sensors throughout the driving process. This information is stored in the form of multivariate time series time series. Detecting anomalies in these vehicles is hampered by the presence of time series with multiple variates, the subjectivity of the definition of anomaly and the lack of labeled databases. The search of the literature provided several perspectives on the problem of anomaly detection in time series. The techniques studied were classified into probabilistic, distance-based, model-based, frequency-based, and information theory-based methods. From the studied techniques, an iterative methodology was developed. The first step, preprocessing, aims at clean, filter and normalize the data. The whole time series is segmented in subsequences taking into account the dynamical changes of the time series in the second stage of the method. Then, for each subsequence, an anomaly score is calculated and, by defining an anomaly score threshold, some candidates are identified as potential anomalies. Candidates are grouped according to their dynamic behavior in the fourth step to then proceed to validation by the industrial experts. Finally, the results after three iterations, eliminating overlapping anomalies between iterations, are 122 sequences validated as anomalies, 13 subsequences that require further analysis to be validated, and 125 subsequences rejected as anomalies. A visual tool was developed to assist the diagnostic team in the manual anomaly detection process. The method used has proven to be effective for anomaly detection in the vehicle monitoring domain. Special attention was given to facilitate the interpretation of the results by the diagnostic equipment. However, limitations related to scalability and performance measurement have been identified. In the future, it will be of interesting to incorporating more complex and less interpretable methods will be for detecting new anomalies and move from offline to an online model capable of processing data in real time.

Département:	Département de mathématiques et de génie industriel
Programme:	Maîtrise recherche en génie industriel
Directeurs ou directrices:	Bruno Agard et Nicolas Saunier
URL de PolyPublie:	https://publications.polymtl.ca/10478/
Université/École:	Polytechnique Montréal
Date du dépôt:	06 févr. 2023 14:39
Dernière modification:	26 sept. 2024 11:13

Citer en APA 7:	Garcia Vega, P. (2022). Development of a Method for Anomaly Detection in Time Series Applied to Vehicle Monitoring [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10478/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document