<  Retour au portail Polytechnique Montréal

An empirical study on the relation between identifiers and fault proneness

Venera Arnaoudova, Laleh Eshkevari, Rocco Oliveto, Yann-Gaël Guéhéneuc et Giuliano Antoniol

Rapport technique (2010)

Document en libre accès dans PolyPublie et chez l'éditeur officiel
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Version officielle de l'éditeur
Conditions d'utilisation: Tous droits réservés
Télécharger (702kB)
Afficher le résumé
Cacher le résumé

Abstract

Poorly-chosen identifiers have been reported in the literature as misleading and increasing the program comprehension effort. Identifiers are composed of terms, which can be dictionary words, acronyms, contractions, or simple strings. We conjecture that the use of identical terms in different contexts may increase the risk of faults. We investigate our conjecture using a measure combining term entropy and term context-coverage to study whether certain terms increase the odds ratios of methods to be fault-prone. Entropy measures the physical dispersion of terms in a program: the higher the entropy, the more scattered across the program the terms. Context coverage measures the conceptual dispersion of terms: the higher their context coverage, the more unrelated the methods using them. We compute term entropy and context-coverage of terms extracted from identifiers in Rhino 1.4R3 and ArgoUML 0.16. We show statistically that methods containing terms with high entropy and context-coverage are more fault-prone than others.

Mots clés

Source code identifiers, fault models, program comprehension

Sujet(s): 2700 Technologie de l'information > 2700 Technologie de l'information
2700 Technologie de l'information > 2705 Logiciels et développement
2700 Technologie de l'information > 2706 Génie logiciel
2700 Technologie de l'information > 2720 Logiciel de systèmes informatiques
Département: Département de génie informatique et génie logiciel
Organismes subventionnaires: CRSNG/NSERC, Fonds de recherche Nature et technologies Québec
URL de PolyPublie: https://publications.polymtl.ca/2651/
Numéro du rapport: EPM-RT-2010-02
Date du dépôt: 06 oct. 2017 13:52
Dernière modification: 03 oct. 2024 19:03
Citer en APA 7: Arnaoudova, V., Eshkevari, L., Oliveto, R., Guéhéneuc, Y.-G., & Antoniol, G. (2010). An empirical study on the relation between identifiers and fault proneness. (Rapport technique n° EPM-RT-2010-02). https://publications.polymtl.ca/2651/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document