<  Back to the Polytechnique Montréal portal

Estimation quantitative du risque lié aux machines en exploitant des rapports d'enquête d'accident et l'analyse logique de données

Sabrina Jocelyn

Ph.D. thesis (2017)

Open Access document in PolyPublie
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (3MB)
Show abstract
Hide abstract


In machinery safety, safety practitioners use different sources as accident investigation reports to help them identify the risks in the workplace. In that case, they retrieve the knowledge from those reports one at a time, then may forget about them later. Risk identification is followed by risk estimation in risk management. Safety practitioners in machinery safety generally use qualitative tools to estimate the risk. The qualitative aspect entails subjective decision-making regarding risk reduction measures. Moreover, the static nature of those tools forces its users to work with predetermined risk parameters. If new parameters are required to better describe the changing risk, those tools will be unable to consider them, which will lead to outdated decisions in risk reduction. To overcome these issues, this thesis aims at suggesting a risk identification and risk estimation method that facilitates tracking of machinery-related risk in the workplace as well as their physical and organizational environment. That method exploits dynamic experience feedback (ExF) to make the most out of the reports in an efficient and sustainable way. Dynamic ExF is a process consisting of reporting information as well as inferring knowledge at the same time. The essential knowledge is extracted from the information contained in the reports after that information has been formalized in a database. That knowledge can be updated gradually as new information is reported. The knowledge is inferred in the form of relevant patterns generated by a data mining algorithm. A pattern is a combination of conditions describing accidents pertaining to a same set called “class”. Every condition is made of an indicator respecting a specific value or range of values. The indicator is a risk factor or a potential cause of accident. All in all, with a dynamic ExF using a database that can be updated on a regular basis, the reports will not go to waste after being read. Instead, they will continually contribute to the knowledge inference which will progress in the context. A machine learning algorithm called Logical Analysis of Data (LAD) is integrated with the dynamic experience feedback process to ensure that the method is also suited for scarce data. Indeed, LAD proved to be efficient since the classification accuracy of the patterns generated from a 23-belt-conveyor-related accident database was adequate: between 72% and 74%. Two facts explain the choice of belt conveyors for the thesis: among all types of conveyors, they are the ones responsible of the biggest proportion of accidents (16.8%) between 1990 and 2011, according to 137 accident investigation reports from the Commission des normes, de l'équité, de la santé et de la sécurité du travail (CNESST) owing to conveyors; belt conveyors have the biggest ratio (8.5%) of serious and fatal accidents related to all kinds of machines, between 1999 and 2007, according to a database of the Institut de recherche Robert-Sauvé en santé et en sécurité du travail (IRSST). The 23 accident investigation reports dealt with in this thesis come from the CNESST's Documentation Center. Analyzing the information in every report allowed for the identification of the elements describing the accidental context. Processing that information lead to a database that LAD used to generate two kinds of patterns: one for a version of the database splitting the 23 accidents into two classes: maintenance-related accidents and production-related ones; the other for a version of the 23-accident database comprising “Non fatal” and “Fatal” classes. Some of the patterns generated showed that an accident can happen due to dangerous conditions (e.g. a poor environment in the workplace), but also because of an apparently-safe condition (e.g. an existing prevention program). In that case, one should investigate the unsafe sub-factors underlying to the apparently-safe condition in order to understand the occurrence of the accident. For example, 60% of the maintenance-related accidents happened despite the presence of a prevention program. Not updating that program could be a reason why the accident happened. Other patterns showed that risk factors or causes related to the equipment, the organization, the individual or the moment explain mainly the accidents analyzed. Quantitative parameters related to the patterns, such as their coverage and their indicators frequency, enabled to start ranking the patterns as well as their indicators according to their importance (the coverage is the number of accidents a pattern characterizes). A probability of occurrence of harm estimation method associated with each pattern was developed to complete that hierarchy among the patterns with identical coverage. Such hierarchy with quantitative basis objectively guides the safety practitioner with the risks factors or accident potential causes needing to be taken care of in priority. The probability of occurrence of harm estimation uses the mass functions related to the indicators included in the pattern. It is found that the patterns representing the “Fatal” class have a higher probability compared with the ones describing the “Non fatal” class. Surprising fact because in reality, non fatal accidents (serious and non serious ones) are more frequent than fatal accidents. Since the CNESST publishes accident investigation reports only regarding serious or fatal injuries, such difference is understandable. Nevertheless, considering the sample studied for the thesis, the most severe type of accident (fatal) is also the most likely. Therefore, it is suggested that the safety practitioners from the enterprises concerned by the accidents analyzed perform the risk reduction process preventing fatalities first. The probability of occurrence of harm calculated has the potential to serve as a basis for comparison that enables to track the risk evolution. For instance, after implementing a risk reduction measure, one will be able to evaluate the effect of that measure on the probability of occurrence of harm previously calculated. The method suggested is transposable to industrial equipment other than belt conveyors. The same approach can be adopted to estimate the probability of occurrence of a hazardous event of different nature. In such case, the probability calculated can be integrated to qualitative tools to specify their labels describing the probability of occurrence of a hazardous event. That integration adds objectivity to risk estimation process. The success of that method relies on the good will of the stakeholders to bring feedback on the machinery-related risk portrait. If no stakeholder reveals information about a new state of a risk reduction measure or about a new circumstantial event, that information will never be registered in the database. Accordingly, the patterns defining the risk will never be updated, and so will not be the essential risk factors and accident potential causes, as well as the probabilities related. Consequently, outdated decision-making might be performed. A safety culture as well as a mutual trust in the enterprises is important to encourage feedback in order to improve the risk portrait and the efficiency of the risk reduction measures.


Les préventionnistes en sécurité des machines utilisent différents outils, dont des rapports d'enquêtes d'accidents, pour les aider dans l'identification des risques en milieu de travail. L'information est alors extraite ponctuellement, en lisant un rapport à la fois. Par la suite, les rapports consultés risquent de sombrer dans l'oubli. En matière de gestion du risque, l'identification du risque est succédée par l'estimation du risque. Les préventionnistes en sécurité des machines utilisent généralement des outils qualitatifs pour estimer le risque. Cet aspect qualitatif crée de la subjectivité dans les prises de décision quant aux moyens de réduction du risque. De plus, la nature statique de ces outils contraint son utilisateur à des paramètres du risque prédéterminés. Si d'autres paramètres sont requis pour mieux définir le risque qui a évolué, ces outils seront incapables de les intégrer. Cela peut conduire à des décisions inadaptées en matière de réduction du risque. Pour pallier ces inconvénients, cette thèse vise à proposer une démarche d'identification et d'estimation du risque qui facilite le suivi des risques liés aux machines, ainsi qu'à leur environnement physique et organisationnel en milieu de travail. La démarche utilise le retour d'expérience (REX) dynamique pour exploiter efficacement et durablement les rapports d'enquête d'accident. Le REX dynamique est à la fois un processus de remontée d'information et d'inférence de connaissances. La connaissance essentielle est extraite à partir de l'information contenue dans les rapports, après que l'information ait été formalisée dans une base de données. Cette connaissance peut être actualisée au fur et à mesure de la mise à jour de la base de données par la remontée d'information. La connaissance est inférée sous la forme de règles pertinentes générées par un algorithme de fouille de données. Une règle est une combinaison de conditions décrivant des accidents appartenant à un même ensemble, appelé « classe ». Chaque condition se compose d'un indicateur auquel une valeur ou une plage de valeurs est affectée. Un indicateur est un facteur de risque ou une cause potentielle d'accident. Ainsi, avec le REX dynamique utilisant une base de données pouvant être mise à jour régulièrement, les connaissances issues des rapports seront continuellement mises à profit et évolueront avec le contexte. Un algorithme d'apprentissage automatique nommé « Analyse logique de données (ALD) » (Logical Analysis of Data : LAD) est intégré au REX dynamique pour assurer que la démarche proposée fonctionne même pour un échantillon restreint de données. En effet, cette thèse a démontré que, pour un petit échantillon de 23 accidents liés à des convoyeurs à courroie, l'ALD est capable de générer des règles avec une précision de classification adéquate : entre 72% et 74%. Le choix des convoyeurs à courroie s'appuie sur deux constats. Premièrement, de tous les types de convoyeurs, ceux à courroie ont provoqué le plus d'accidents (16,8%) entre 1990 et 2011, d'après 137 rapports d'accidents de la Commission des normes, de l'équité, de la santé et de la sécurité du travail (CNESST) liés à des convoyeurs. Deuxièmement, ce type de convoyeurs représente la plus grande proportion (8,5%) des accidents graves et mortels, toutes machines confondues, entre 1999 et 2007, d'après une base de données de l'Institut de recherche Robert-Sauvé en santé et en sécurité du travail (IRSST). Les 23 rapports d'accidents traités dans cette thèse, proviennent du Centre de documentation de la CNESST. Une analyse de l'information de chaque rapport a permis de tirer les éléments décrivant le contexte accidentel. Ce traitement d'information a donné naissance à une base de données à partir de laquelle l'ALD a généré deux séries de règles. D'abord, l'une pour une version de la base de données divisant les 23 accidents en une classe d'accidents en maintenance et une classe d'accidents en production. Ensuite, l'autre pour une version de la base de données partageant les 23 accidents en deux classes: « Non mortel » et « Mortel ». Certaines des règles générées ont montré qu'un accident peut survenir en raison de conditions dangereuses (ex., un environnement de travail encombré), mais aussi en présence de conditions d'apparence sécuritaire (ex., l'existence d'un programme de prévention). Dans ce dernier cas, il faut investiguer pour comprendre les dessous d'une condition qui semble sécuritaire. Par exemple, pour 60% des accidents en maintenance survenus en dépit de l'existence d'un programme de prévention, l'omission de sa mise à jour pourrait expliquer l'accident. D'autres règles ont montré que les accidents analysés s'expliquent principalement par des facteurs de risque ou causes rattachées à l'équipement, l'organisation, l'individu, ou le moment. Des paramètres quantitatifs associés aux règles, tels que leurs couvertures et la fréquence de leurs indicateurs, ont permis d'entamer la hiérarchisation des règles et des facteurs de risques (la couverture est le nombre d'accidents que décrit la règle). Une méthode développée pour estimer la probabilité du dommage associé à chaque règle a permis de compléter la hiérarchisation des règles de couvertures identiques. Cette hiérarchie, établie sur une base quantitative, aide les préventionnistes à déterminer de manière objective les facteurs de risque ou causes possibles d'accident à prioriser. La méthode exploite les fonctions de masse des indicateurs composant la règle. L'étude a montré que la probabilité des règles caractérisant les accidents mortels analysés est supérieure à celle des règles décrivant les accidents non mortels étudiés. Constat surprenant puisque, dans la réalité, les accidents non mortels (graves et non graves) sont plus fréquents que ceux mortels. Ce constat s'explique par le fait que les accidents analysés proviennent du Centre de documentation de la CNESST qui publie des rapports d'enquête uniquement d'accidents graves ou mortels. Puisque dans la thèse, les accidents avec la plus grande gravité du dommage (mortels) sont aussi les plus probables, il est suggéré que les préventionnistes des entreprises concernées par les accidents analysés entament le processus de réduction du risque en s'attaquant d'abord à la prévention de dommages mortels. La probabilité du dommage calculée permettra d'avoir un référentiel de comparaison permettant de suivre l'évolution du risque. Par exemple, à la suite de la mise en œuvre d'un moyen de réduction du risque, il sera possible d'en évaluer l'impact sur la probabilité du dommage initialement calculée. La démarche proposée est transposable à des équipements industriels autres que les convoyeurs à courroie. Elle peut être utilisée pour l'estimation de la probabilité d'occurrence d'un événement dangereux de nature diverse. Cette probabilité calculée pourra être intégrée à des outils qualitatifs, dans le but de préciser leurs niveaux de probabilité d'occurrence d'un événement dangereux. Cette intégration rendra le processus d'estimation du risque plus objectif. Le succès de la démarche proposée repose sur la bonne volonté des intervenants à faire remonter l'information concernant les risques liés aux machines. Si aucun intervenant ne révèle d'information relative à un nouvel état d'un moyen de réduction du risque ou à un nouvel accident ou incident, l'information ne sera jamais enregistrée dans la base de données. Alors, les règles décrivant le risque ne seront jamais actualisées. Conséquemment, il en sera autant pour les facteurs de risques et les causes potentielles d'accidents, ainsi que les probabilités associées. Dans pareil contexte, des décisions dépassées risquent d'être prises pour réduire le risque. Une culture de sécurité et une confiance mutuelle dans l'entreprise sont primordiales afin d'encourager la remontée d'information pour brosser un portrait plus juste du risque et améliorer l'efficacité des moyens de réduction du risque.

Department: Department of Mathematics and Industrial Engineering
Program: Génie industriel
Academic/Research Directors: Yuvin Adnarain Chinniah and Mohamed-Salah Ouali
PolyPublie URL: https://publications.polymtl.ca/2763/
Institution: École Polytechnique de Montréal
Date Deposited: 16 Nov 2017 15:33
Last Modified: 19 Apr 2023 18:30
Cite in APA 7: Jocelyn, S. (2017). Estimation quantitative du risque lié aux machines en exploitant des rapports d'enquête d'accident et l'analyse logique de données [Ph.D. thesis, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/2763/


Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item