<  Back to the Polytechnique Montréal portal

Utilisation d'un espace latent pour une déduplication de bogues rapide

Adem Aber Aouni

Master's thesis (2022)

[img] Restricted to: Repository staff only until 17 July 2024
Terms of Use: All rights reserved
Show abstract
Hide abstract

Abstract

It is common for software with a large userbase to provide a platform for bug submissions. These platforms group together the submitted bug reports and offer more information to de- velopers once the bugs are addressed. Unfortunately, the grouping of bug reports according to the bug from which they originate is not trivial. Historically, this was done by several human evaluators. In this sense, in order to lighten their task and progress towards a future where automatic clustering is possible, several bug deduplication methods have been proposed. One important information used to group bug reports is the stacktrace of the application, since it represents the current functions being executed when an error occurs. On the other hand, the state of the art of the bug deduplication with the use of stacktraces can be improved on several fronts. Therefore, our work attempts to address some shortcomings in the current state of the art. First, we noticed that a step of preprocessing of stacktraces, used in our research field, is underdeveloped. We are referring here to recursion removal. Indeed, the methods currently used in the state of the art are naive and do not take into account the different forms of recursion. Thus, in this document, we define four types of recursion that we have observed in real datasets. Then, we propose a new recursion removal algorithm capable of addressing these types of recursion without losing vital information.

Résumé

Il est commun pour des logiciels avec une grosse base d’utilisateurs de fournir une plate- forme de soumissions de rapports de bogue. Ces plateformes permettent de regrouper les rapports de bogue soumis et offrent plus d’informations aux développeurs lorsque les bogues sont traités. Malheureusement, le groupement des rapports de bogue selon le bogue dont ils sont originaires n’est pas trivial. Historiquement, ce travail fut accompli par plusieurs éva- luateurs humains. En ce sens, afin d’alléger leur tâche et de progresser vers un futur où un groupement automatique est possible, plusieurs méthodes de déduplication de bogues ont été proposées. Une information importante utilisée afin de grouper les rapports de bogue est la trace d’appels de l’application, puisqu’elle représente les appels de fonction en cours d’exécution lorsque qu’une erreur survient. Par contre, l’état de l’art de la déduplication de bogues avec l’utilisation de traces d’appels peut être amélioré sur plusieurs facettes. Notre travail tente donc de résoudre quelques lacunes présentes dans l’état de l’art courant.Premièrement, nous avons remarqué qu’une étape du prétraitement des traces d’appels, utili- sée dans le domaine de recherche, est sous-développée. Nous faisons réference ici à la suppres- sion de récursion. En effet, les méthodes utilisées en ce moment dans l’état de l’art sont naïves et ne prennent pas en compte les différentes formes de manifestation de récursion. Ainsi, dans ce document, nous définissons quatre types de récursion que nous avons observés dans des ensembles de données réels. Puis, nous proposons un nouvel algorithme de suppression de récursion permettant de traiter ces types de récursion sans pertes d’information vitale.

Department: Department of Computer Engineering and Software Engineering
Program: Génie informatique
Academic/Research Directors: Daniel Aloise
PolyPublie URL: https://publications.polymtl.ca/10735/
Institution: Polytechnique Montréal
Date Deposited: 17 Jul 2023 11:46
Last Modified: 13 Apr 2024 05:41
Cite in APA 7: Aber Aouni, A. (2022). Utilisation d'un espace latent pour une déduplication de bogues rapide [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10735/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item