<  Retour au portail Polytechnique Montréal

Une méthode linéaire de déréverbération pour les signaux de parole

Semah Aissaoui

Mémoire de maîtrise (2021)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (1MB)
Afficher le résumé
Cacher le résumé

Résumé

: Lorsqu'une source sonore émet un signal audio dans une salle fermée et si le microphone est situé à une certaine distance de la source, le signal capté par le microphone est composé de plusieurs versions retardées et atténuées du signal source. En e˙et, le signal observé est formé du signal direct de la source et de ses réflexions avec les objets existants dans la même salle. Ce phénomène s'appelle la réverbération. Plusieurs études ont montré que la réverbération provoque la dégradation de la qualité du signal de parole et peut nuire à son intelligibilité. Pour cela, notre partenaire fluent.ai cherche une solution de déréverbération pour améliorer la performance de son système de reconnaissance automatique de la parole. Le problème de déréverbération est plus compliqué que le problème de réduction de bruit de fond car les réverbérations qu'on veut réduire sont en forte corrélation avec le signal désiré qu'on veut estimer. C'est dans ce cadre qu'on effectue ce projet de recherche, notre objectif est d'étudier l'e˙et et les caractéristiques de la réverbération afin d'implémenter une solution qui permet de la réduire. Puisque la solution de déréverbération sera intégrée dans un système de reconnaissance automatique de la parole, on cherche une méthode qui peut fonctionner en temps réel et qui utilise le signal capté par un ou plusieurs microphones. On commence par étudier la réverbération, ses caractéristiques et ses effets sur les signaux de parole. On présente aussi un état de l'art des techniques les plus connues de déréverbéra-tion. Parmi les méthodes de déréverbération présentées, la méthode de déréverbération par prédiction linéaire sera choisie et expliquée. On présentera la méthode de déréverbération par prédiction linéaire avec le modèle proposé dans [1]. Cette méthode consiste à modéliser le signal observé par la somme du signal désiré à estimer et la partie réverbérée du signal source. Notre objectif est d'estimer un filtre qui réduit la partie réverbérée dans le signal observé. Le temps de traitement pour cette méthode est considéré élevé pour notre application. Pour cela, on présente une implémentation rapide qui se base sur le calcul de la fonction d'autocorrélation du signal observé. Cette implémentation bénéficie de la transformée de Fourier rapide. Pour évaluer les deux implémentations, on utilise des indicateurs de performance objectifs pour avoir une idée exacte de leurs performances. On commence par évaluer la méthode de base avec une source de bruit blanc et des signaux de parole supposés stationnaires. Ensuite, on évalue la performance de la méthode de base et la méthode rapide avec des signaux de commande. Les résultats de l'évaluation de deux méthodes serviront pour étudier les différents facteurs qui peuvent améliorer le temps de calcul et la qualité du signal à estimer.

Abstract

When a sound source emits an audio signal in a closed room and the microphone is located at a certain distance from the source, the microphone signal is composed of several delayed and attenuated versions of the source signal. In e˙ect, the observed signal is composed of the direct signal coming from the source and its reflections from existing objects in the same room. This phenomenon is called reverberation. Several studies have shown that reverberation causes degradation of the quality of the speech signal and can impair its intelligibility. For this reason, our partner fluent.ai is looking for a solution to the reverberation problem to improve the performance of its automatic speech recognition system. The dereverberation problem is more complicated than the background noise reduction problem because the reverberations we want to reduce are strongly correlated with the desired signal we want to estimate. It is in this context that we are conducting this research project. Our objective is to study the effect and characteristics of reverberation in order to implement a solution that will reduce it. Since the dereverberation solution will be integrated in an automatic speech recognition system, we are looking for a method that can work in real time and that uses the signal captured by one or more microphones. We start by studying reverberation, its characteristics and its effects on speech signals. We also present a state of the art of the most known techniques of dereverberation. Among the dereverberation methods presented, the linear prediction dereverberation method will be selected and explained. We will present the dereverberation method by linear prediction with the model proposed in [1]. This method consists in modelling the observed signal by the sum of the desired signal to estimate and the reverberated part of the source signal. Our goal is to estimate a filter that reduces the reverberated part in the observed signal. The processing time for this method is considered high for our application. For this purpose, we present a fast implementation that is based on the computation of the autocorrelation function of the observed signal. This implementation benefits from the fast Fourier transform. To evaluate both implementations, objective performance indicators are used to get an accurate idea of their performance. First, we evaluate the basic method with a white noise source and speech signals assumed to be stationary. Then, we evaluate the performance of the basic method and the fast method with control signals. The results of the evaluation of two methods will be used to study the di˙erent factors that can improve the computation time and the quality of the signal to be estimated.

Département: Département de mathématiques et de génie industriel
Programme: Maîtrise recherche en mathématiques appliquées
Directeurs ou directrices: Antoine Saucier
URL de PolyPublie: https://publications.polymtl.ca/6337/
Université/École: Polytechnique Montréal
Date du dépôt: 14 juil. 2021 13:00
Dernière modification: 08 avr. 2024 09:25
Citer en APA 7: Aissaoui, S. (2021). Une méthode linéaire de déréverbération pour les signaux de parole [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/6337/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document