<  Back to the Polytechnique Montréal portal

Développement d’un outil de segmentation des comportements d’achat des clients en se basant sur leurs données morphologiques

Safa El Ayeb

Masters thesis (2019)

[img] Restricted to: Repository staff only until 6 October 2021.
Cite this document: El Ayeb, S. (2019). Développement d’un outil de segmentation des comportements d’achat des clients en se basant sur leurs données morphologiques (Masters thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/4077/
Show abstract Hide abstract

Abstract

RÉSUMÉ : L’analyse des marchés commerciaux est actuellement un processus aussi bien scientifique qu’industriel. Il consiste à recueillir et explorer des informations reliées aux clients en vue de mieux comprendre leurs comportements, habitudes et intérêts. Cette analyse est fortement utilisée par les entreprises afin de les guider dans leurs décisions opérationnelles et stratégiques. Ce mémoire présente un des outils d’analyse des marchés les plus utilisés dans la littérature, qui est la segmentation. Cette approche vise à diviser un ensemble d’individus hétérogènes, en groupes plus homogènes, en se basant sur des critères prédéterminés. La segmentation des marchés est employée dans plusieurs domaines, et vise à diviser un ensemble de clients en plus petits groupes ayant des comportements similaires. Elle peut être employée pour l’amélioration de l’impact et des revenus des produits et services existants ou pour préparer l’introduction de nouveaux produits sur les marchés. Dans notre cas, la segmentation des clients est basée sur l’évolution de tailles des vêtements qu’ils commandent, ou ce qu’on appellera leurs données morphologiques. Les clients font leurs achats sur une plateforme d’achat en ligne fournie par notre partenaire industriel. Notre partenaire est une entreprise qui se charge de la sous-traitance des programmes d’uniformes pour ses clients. Dans ce travail, nous avons utilisé des méthodes de « data mining » pour analyser l’historique des données d’achat d’un des clients de notre partenaire pour une durée d’étude déterminée. Les analyses sont par la suite concentrées sur le type de vêtements le plus commandé, soit les chemises. Des séries chronologiques des tailles commandées pour chaque client sont construites. Ces séries chronologiques permettent d’étudier l’évolution des tailles dans le temps. La segmentation est par la suite appliquée sur ces séries chronologiques afin d’obtenir des groupes ayant des comportements similaires. La similarité entre les clients est basée sur une métrique appelée le Dynamic Time Warping. Cette distance a été choisie parce qu’elle est la plus adaptée pour comparer les séries temporelles en se basant sur leurs formes et en ne tenant pas compte du décalage sur l’axe temporel. Plusieurs tests basés sur différentes méthodes et algorithmes ont eu lieu. Aussi plusieurs structures et variantes des séries temporelles ont été testées. Les séries temporelles retenues sont des séries exprimées en fonction de la variation des mensurations dans le temps. Elles ont été normalisées avec la norme z. Deux segmentations avec des nombres de groupes égaux à six et à dix ont été réalisées. Finalement, une évaluation et une analyse des résultats de la segmentation ont été effectuées pour valider les résultats recueillis. En premier lieu, l’évaluation s’est basée sur la visualisation des groupes obtenus et sur le critère de silhouette. Ce critère permet de mesurer la qualité d’une segmentation donnée, en se basant sur l’homogénéité intragroupe et l’hétérogénéité inter-groupe. Nous avons trouvé que la segmentation en dix groupes a permis d’avoir de meilleurs groupes. Dans un second temps, pour chacun des cas, l’analyse des groupes nous a permis de comprendre la structure et les caractéristiques de ces derniers. Nous avons trouvé que la majorité des clients ont des courbes d’évolution croissante. Nous avons aussi constaté que les groupes ayant des courbes d’évolution stables, ont des pourcentages de retour relativement élevés par rapport à leurs pourcentages d’achat. La répartition des hommes et des femmes dans les groupes est semblable à celle du groupe de clients initial. Cependant, les groupes ayant un pourcentage de femme plus important que les autres ont des moyennes de tailles plus petites.----------ABSTRACT : The analysis of commercial markets is currently a scientific as well as an industrial process. It consists of collecting and exploring information related to clients in order to better understand their behaviours, habits and interests. This analysis is widely used by companies to guide them in their operational and strategic decisions. This paper presents one of the most widely used market analysis tools in the literature, namely segmentation. This approach aims to divide a set of heterogeneous individuals into more homogeneous groups, based on predetermined criteria. Market segmentation is used in several areas and aims to divide a set of customers into smaller groups with similar behaviors. It can be used to improve the impact and revenues of existing products and services or to prepare for the introduction of new products to markets. In our case, customer segmentation is based on the size evolution of the clothes they order, or what we will call their morphological data. Customers make their purchases on an online shopping platform provided by our partner. Our partner is a company that subcontracts uniform programs for its customers. In this work, we used data mining methods to analyze the purchase data history of one of our partner’s customers for a specific study period. The analyses are then focused on the most ordered type of clothing, namely shirts. Time series of the sizes ordered for each customer are built. These time series make it possible to study the evolution of sizes over time. Segmentation is then applied to these time series to obtain groups with similar behaviors. The similarity between customers is based on a metric called Dynamic Time Warping. This distance was chosen because it is the most suitable for comparing time series based on their shapes and ignoring the time axis offset. Several tests based on different methods and algorithms were carried out. Also, several structures and variants of the time series were tested. The time series used are series expressed as a function of the variation in measurements over time, and which were normalized with the z-norm. Two segmentations with numbers of groups equal to six and ten were performed. Finally, an evaluation and analysis of the segmentation results was carried out to validate the results collected. First, the evaluation was based on the visualization of the groups obtained and on the silhouette criterion. This criterion makes it possible to measure the quality of a given segmentation, based on intra-group homogeneity and inter-group heterogeneity. We found that the segmentation into ten groups allowed us to have better groups. This segmentation improved the silhouette index obtained with six groups. In a second step, for each case, the analysis of the groups allowed us to understand their structure and characteristics. We found that most clients have increasing trend curves. We also found that groups with stable evolution curves have relatively high return rates compared to their purchase rates. The distribution of men and women in the groups is similar to that of the original client group. However, groups with a higher percentage of women were found to have smaller average sizes.

Open Access document in PolyPublie
Department: Département de mathématiques et de génie industriel
Academic/Research Directors: Bruno Agard
Date Deposited: 06 Oct 2020 13:47
Last Modified: 06 Oct 2020 13:47
PolyPublie URL: https://publications.polymtl.ca/4077/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only