<  Back to the Polytechnique Montréal portal

Suivi multi-objets par la détection : application à la vidéo surveillance

Dorra Riahi

PhD thesis (2016)

[img]
Preview
Download (4MB)
Cite this document: Riahi, D. (2016). Suivi multi-objets par la détection : application à la vidéo surveillance (PhD thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/2326/
Show abstract Hide abstract

Abstract

RÉSUMÉ Dans notre société, les systèmes intelligents ont retenu une attention considérable. En particulier, la vidéosurveillance représente un outil indispensable pour les systèmes de surveillance. Ces systèmes exploitent des données provenant de différents capteurs dans le but d’extraire des informations qui servent à prendre une décision (tel que des événements de menaces). Dans ce contexte, les algorithmes de suivi représentent un vaste sujet important parmi les algorithmes de traitement des systèmes intelligents de vidéosurveillance. En particulier, dans ce travail, on est intéressé par le suivi de plusieurs objets MOT (Multi Object Tracking). Bien que de nombreuses approches de suivi ont été proposées, ce sujet reste un défi. Ce travail présente une nouvelle approche de MOT. L’algorithme de MOT que nous avons développé est basé sur l’utilisation de plusieurs descripteurs visuels dans le cadre de l’association des données. Notre approche est capable de gérer certaines problématiques liées au suivi à savoir les occultations à long terme et la similarité entre les modèles d’apparence des objets cibles. L’algorithme MOT repose sur le concept de la fusion de plusieurs descripteurs. Il consiste à sélectionner la position exacte de l’objet à suivre en construisant une représentation robuste du modèle d’apparence des objets cibles. Le modèle d’apparence est extrait en utilisant le descripteur de couleur, le descripteur épars, le descripteur de mouvement et le descripteur de l’information spatiale. Dans le but de sélectionner l’objet candidat optimal (une détection) pour un objet cible, une fonction d’affinité linéaire est estimée. Cette fonction combine les différents scores de similarité qui sont calculés pour chaque descripteur mentionné ci-dessus. Dans notre système de MOT, le processus de suivi est formulé comme un problème d’association des données entre un ensemble des objets candidats (résultats d’un détecteur d’objets) et un ensemble des objets cibles en fonction de la valeur de leur probabilité jointe. Dans la partie expérimentale de ce travail, nous réalisons plusieurs expérimentations dans le but d’évaluer et de confirmer la robustesse de l’approche proposée. Cette dernière a été évaluée en utilisant des séquences vidéo publiques à savoir TUD et PETS2009. Ces évaluations prouvent la pertinence de notre approche en démontrant que notre approche de MOT surpasse plusieurs algorithmes récents de la littérature. ----------ABSTRACT In our society, intelligent systems have attracted considerable attention. In particular, video surveillance is an essential tool for monitoring systems. These systems use data from different sensors in order to extract information used to derive a decision (such as events of threat). In this context, the tracking algorithm is a vast and important subject for video surveillance systems. In particular, in this work, we are interested in tracking multiple objects, MOT (Multi Object Tracking). Although numerous tracking approaches have been proposed, this remains a challenging task at the heart of video surveillance applications. This work presents a new MOT approach. The MOT algorithm we developed is based on the use of several visual features as part of the data association. Our approach is able to handle some issues related to tracking namely the long-term occlusions and the close similarity between the appearance model of the target objects. The proposed MOT algorithm is based on the concept of multifeature fusion. It is based on selecting the exact position of the tracked object by constructing a robust representation of appearance model of the target objects. The appearance model is extracted using the color descriptor, the sparse appearance model, the motion descriptor and the spatial information model. In order to select the optimal candidate object (detection) to a target object, a linear affinity function is estimated. This function combines the different similarity scores which are calculated for each descriptor mentioned above. In our MOT system, the tracking process is formulated as a data association problem between a set of candidate objects (results of a detector of objects) and a set of target objects based on their joint probability value. In the experimental part of this work, we perform several experiments in order to evaluate and to confirm the robustness of the proposed approach. It was evaluated using public video sequences namely TUD and PETS2009. These evaluations demonstrate the relevance of our approach by demonstrating that our MOT approach outperforms several recent algorithms of the state-of-the-art.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Dissertation/thesis director: Guillaume-Alexandre Bilodeau
Date Deposited: 06 Mar 2017 16:22
Last Modified: 27 Jun 2019 16:48
PolyPublie URL: https://publications.polymtl.ca/2326/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only