<  Retour au portail Polytechnique Montréal

Detecting very large sets of referenced files at 40/100 GbE, especially MP4 files

Adrien Larbanet, Jonas Lerebours et Jean Pierre David

Communication écrite (2015)

Document en libre accès dans PolyPublie et chez l'éditeur officiel
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Version officielle de l'éditeur
Conditions d'utilisation: Creative Commons: Attribution-Pas d'utilisation commerciale-Pas de modification (CC BY-NC-ND)
Télécharger (714kB)
Afficher le résumé
Cacher le résumé

Abstract

Internet traffic monitoring is an increasingly challenging task because of the high bandwidths, especially at Internet Service Provider routers and/or Internet backbones. We propose a parallel implementation of the max-hashing algorithm that enables the detection of millions of referenced files by deep packet inspection over high bandwidth connections. We also propose a method to extract high-entropy signatures from MP4 files compatible with the max-hashing algorithm in order to have low false positive rates. The system first computes a set of fingerprints, which are small subsets of the referenced files a priori unique and easily identifiable. At detection time, the max-hashing algorithm eliminates the need to reconstruct the flows. A Graphics Processing Unit (GPU) card computes the fingerprints of all the IP packets in parallel and searches for hits in the onboard collection of fingerprints. Our application, dedicated to the detection of known MP4 video files, enables the detection of millions of fingerprints and demonstrates a sustained processing rate of 50 Gbps per card. Furthermore, a null false positive rate was observed for our 28.25 GB transfer test. The proposed implementation also features the detection of suspect flows based on IP addresses and ports in order to carry out deeper investigations off line.

Mots clés

Video fingerprinting; Network monitoring; Deep packet inspection; Content-based detection; GPU computing

Département: Département de génie électrique
Centre de recherche: GR2M - Groupe de recherche en microélectronique et microsystèmes
URL de PolyPublie: https://publications.polymtl.ca/34302/
Nom de la conférence: 15th Annual DFRWS Conference (DFRWS USA 2015)
Lieu de la conférence: Philadelphia, PA, USA
Date(s) de la conférence: 2015-08-09 - 2015-08-12
Titre de la revue: Digital Investigation (vol. 14, no suppl. 1)
Maison d'édition: Elsevier
DOI: 10.1016/j.diin.2015.05.011
URL officielle: https://doi.org/10.1016/j.diin.2015.05.011
Date du dépôt: 18 avr. 2023 15:07
Dernière modification: 04 déc. 2024 19:34
Citer en APA 7: Larbanet, A., Lerebours, J., & David, J. P. (août 2015). Detecting very large sets of referenced files at 40/100 GbE, especially MP4 files [Communication écrite]. 15th Annual DFRWS Conference (DFRWS USA 2015), Philadelphia, PA, USA. Publié dans Digital Investigation, 14(suppl. 1). https://doi.org/10.1016/j.diin.2015.05.011

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Dimensions

Actions réservées au personnel

Afficher document Afficher document