<  Back to the Polytechnique Montréal portal

Exploration et comparaison d’outils statistiques pour la prédiction du temps de guérison d’une plaie

Violaine Mongeau-Pérusse

Masters thesis (2017)

[img]
Preview
Download (1MB)
Cite this document: Mongeau-Pérusse, V. (2017). Exploration et comparaison d’outils statistiques pour la prédiction du temps de guérison d’une plaie (Masters thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/2765/
Show abstract Hide abstract

Abstract

RÉSUMÉ : Présentement, dans la province de Québec, près de 40% du budget total du gouvernement est alloué au secteur de la santé. Avec le phénomène du constant vieillissement de la population, on suppose que ce chiffre ne cessera de s’accroître dans les prochaines années. En effet, nous constatons qu’actuellement près de 18% de la population est âgée de plus de 65 ans et les experts prévoient encore une augmentation de cette population pour toute la décennie à venir. Il est donc d’une importance cruciale de développer des outils ainsi que des méthodes efficaces pour diminuer les coûts en santé tout en conservant des soins optimaux pour les patients. Une option intéressante pour diminuer ces coûts est l’utilisation du service de soins à domicile. Les patients reçoivent des soins à domicile pour diverses raisons comme par exemple, la préparation des médicaments ou encore les soins des plaies. Donc, une problématique importante touchant cette population spécifique des personnes âgées, concerne les plaies. Nous avons travaillé en collaboration avec une agence d’infirmières de soins à domicile provenant de l’Ontario. Sur l’ensemble de leurs patients, près de 40% reçoivent des soins en lien avec une problématique de plaies. L’objectif de ce projet est de prédire le temps de guérison d’une plaie. Pour ce faire, nous avons utilisé des algorithmes d’intelligence machine. Ainsi, en ayant la possibilité de prédire correctement la durée de soins à donner pour un nouveau patient, le gestionnaire en charge pourra utiliser de façon plus judicieuse et efficiente les ressources infirmières de son équipe. Pour réaliser ce projet, nous avons utilisé les données qu’a récoltées notre partenaire, la compagnie AlayaCare. L’agence d’infirmières emploie le logiciel qu’a créé AlayaCare pour inscrire les informations des patients. Après avoir anonymisées les données, il a été possible de les utiliser pour notre recherche. Nous avons donc tenté, en analysant les observations présentes dans la base de données obtenue, de prédire correctement le temps de guérison d’une nouvelle plaie chez un patient. Deux types de modèles de prédiction sont utilisés pour ce faire soit de régression, pour trouver un nombre de jours exact pour la variable cible ou encore la classification pour déterminer dans quel intervalle se trouve notre variable cible. Les méthodes appliquées sont la régression linéaire, la régression logistique, les arbres de décision et les forêts aléatoires. De nombreuses modifications et analyses des bases de données pour ce projet furent réalisées pour rendre les données utilisables avec les algorithmes choisis. Par exemple, les valeurs manquantes ainsi qu’extrêmes et aberrantes ont été imputées ou encore supprimées. Nous avons aussi fait des analyses des variables disponibles. Concernant nos résultats pour les modèles de classification, le taux de bonne classification se situe entre plus de 52% et plus de 86%. L’importante différence ici, existe pour plusieurs raisons. Entre autres, parce que nous avons ajouté des classes dépendant des essais effectués. Ainsi, il est plus difficile pour un modèle de prédire correctement lorsqu’il y a un plus grand nombre de classes. Pour les résultats des modèles de régression, le nombre de jours d’erreurs moyens se situe entre 20 et 33 jours. À ce stade, il est impossible d’affirmer ou d’infirmer si nos résultats sont satisfaisants. Or, nous avons été en mesure de répondre à notre objectif qui était de prédire le temps de guérison d’une plaie. De nombreux essais ont été réalisés pour déterminer quel modèle présentait les meilleurs résultats. À chaque essai, nous avons modifié les paramètres de nos modèles pour trouver les meilleurs résultats. On remarque cependant que la base de données utilisée n’est pas optimale et que beaucoup d’erreurs semblent s’y être glissées, c’est une des principales limites de nos résultats. À plusieurs reprises, les données sont manquantes ou même erronées à certains endroits. Par exemple, dans plus de 10% des cas, il y a une valeur manquante pour la variable longueur de la plaie. De plus, de nombreux facteurs qui influencent la guérison d’une plaie ne sont pas présents dans la base de données telle que la présence de tabagisme ou encore d’alcoolisme. Une base de données plus complète c’est-à-dire avec un nombre moindre de valeurs manquantes et avec l’ensemble de variables explicatives nécessaires pour prédire la cible aurait pu nous donner de meilleurs résultats. Cependant, certaines lacunes peuvent aussi s’être glissées dans notre méthodologie. Par exemple, nous aurions pu modifier davantage de paramètres dans nos modèles ainsi il aurait peut-être été possible d’obtenir des résultats plus concluants. Malgré tout, force est de constater que nos résultats peuvent quand même apporter une certaine amélioration dans le fonctionnement de la compagnie d’infirmières à domicile. En effet, en obtenant des informations plus complètes au sujet des patients, le gestionnaire pourra améliorer sa gestion pour les horaires des infirmières.----------ABSTRACT : Currently, in the province of Quebec, nearly 40% of the government’s total budget is allocated to the health sector. With the phenomenon of the constant aging of the population, it is assumed that it will continue to increase in the coming years. Indeed, we note that currently about 18% of the population is over 65 years of age and experts are still predicting an increase in this population for the whole of the decade to come. It is therefore crucial to develop tools and effective methods to reduce health costs while maintaining optimal patient care. An attractive option to reduce these costs is the use of the home care service. Patients receive home care for a variety of reasons, such as medication preparation and wound care. Therefore, an important problem affecting this specific population of the elderly concerns wounds. We worked with an agency of home care nurses from Ontario. Almost 40% of all patients receive wound care. The objective of this project is to predict the healing time of a wound. We used machine leaning algorithms. Thus, with the ability to accurately predict the length of care for a new patient, the manager in charge will be able to make better use of his team’s nursing resources in a more judicious and efficient manner. To realize this project, we used the data collected by our partner AlayaCare. The nursing agency uses the software AlayaCare created to record patient information. After anonymizing the data, it was possible to use the data for our research. We have therefore attempted, by analyzing the observations present in the database obtained, to correctly predict the Healing time of a new wound in a patient. Two types of prediction models are used to do this either regression, to find an exact number of days for the target variable or classification to determine in which interval our target variable is. The methods applied are linear regression, logistic regression, decision trees and random forests. Numerous modifications and analyzes of the databases for this project were carried out to make the data usable with the chosen algorithms. For example, the missing values as well as the extreme and outliers were imputed or eliminated. We also analyzed the available variables. Concerning our results for the classification models, the rate of good classification is between more than 52% and more than 86%. The important difference here exists for several reasons. Among other things, it is because we have added classes depending on the tests performed. Thus, it is more difficult for a model to predict correctly when there are more classes. For the results of the regression models, the average number of days of errors is between 20 and 33 days. At this point, it is impossible to say or deny whether our results are satisfactory. However, we were able to meet our goal of predicting the healing time of a wound. Numerous trials have been conducted to determine which model has the best results. At each test, we modified the parameters of our models to find the best results. We note, however, that the database used is not optimal and that many errors seem to have slipped into it, it is one of the main limitations of our results. On several occasions, the data is missing or even erroneous in some places. For example, in more than 10% of cases, there is a missing value for the wound length variable. In addition, many factors that influence the healing of a wound are not present in the database such as the presence of smoking or alcoholism. A more complete database with fewer missing values and the set of explanatory variables necessary to predict the target could have given us better results. However, some gaps may also have crept into our methodology. For example, we could have modified more parameters in our models so it might have been possible to obtain more conclusive results. Nevertheless, it is clear that our results can still bring some improvement in the operation of the home nursing company. Indeed, by obtaining more complete information about the patients, the manager will be able to improve its management for the schedules of the nurses.

Open Access document in PolyPublie
Department: Département de mathématiques et de génie industriel
Dissertation/thesis director: Nadia Lahrichi and Louis-Martin Rousseau
Date Deposited: 16 Nov 2017 14:11
Last Modified: 27 Jun 2019 16:47
PolyPublie URL: https://publications.polymtl.ca/2765/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only