<  Back to the Polytechnique Montréal portal

Classification de mots-clés des campagnes publicitaires sur les moteurs de recherche et calcul de prévisions

Chakir Assari

Masters thesis (2014)

[img]
Preview
Download (2MB)
Cite this document: Assari, C. (2014). Classification de mots-clés des campagnes publicitaires sur les moteurs de recherche et calcul de prévisions (Masters thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/1509/
Show abstract Hide abstract

Abstract

RÉSUMÉ : Les publicités sur le web qui se présentent sous forme de liens textuels s’affichent dans les pages de résultats des moteurs de recherche, suite aux requêtes des internautes par le biais des mots-clés achetés par les annonceurs via un système d’enchères. Communément, les premières pages du moteur de recherche offrent aux annonceurs de promouvoir les produits et services. Quand une annonce s’affiche et qu’un internaute clique sur le lien correspondant, l’entreprise en question paie le moteur de recherche. Afin de gérer son budget, une entreprise doit établir des stratégies d’enchères; sélectionner un ensemble de mots-clés et déterminer un montant pour chaque mot-clé. Les données historiques de ces mots-clés sont évidemment nécessaires pour évaluer le comportement des requêtes des internautes sur les moteurs de recherches. Les travaux présentés dans ce mémoire sont une suite d’un thème de recherche dont l’objectif est de développer des algorithmes permettant d’améliorer le rendement des campagnes publicitaires sur les moteurs de recherche. Dans cette optique un algorithme permettant d’affecter des positions optimales aux mots-clés est développé de sorte que le nombre total de clics par campagne est maximisé. En outre, une méthode de génération de courbes génériques est proposée pour chaque mot-clé afin d’effectuer une prédiction à la fois du nombre de clics et du coût par clic en fonction de sa position. Ces paramètres sont essentiels au programme d’optimisation. Nous présentons une approche de classification basée sur les techniques de data mining pour l’extraction des connaissances cachées dans une base de données de mots-clés. Le but est de déceler des comportements similaires au niveau des mots-clés et de les classifier par la suite. Si la classification des mots-clés est optimale, on estime pouvoir obtenir des courbes génériques de meilleure qualité. Notre stratégie utilise beaucoup d'échantillons composés de différentes campagnes dans différents types de marché sur le Web. Cette stratégie nous permet de conclure, lors de la classification automatique, que le nombre de classes de mots-clés est approprié pour toutes les campagnes publicitaires. Nous exploitons divers méthodes de classifications automatiques pour une meilleure organisation des mots-clés selon leurs caractéristiques. Parmi les algorithmes cités dans le présent document il y a : k-means, fuzzy c-means, Clara, Clues et Pam. Les résultats obtenus lors de la classification non supervisée se sont avérés en deçà de nos attentes. Toutefois, notre mandat ne s’arrête pas là, on doit améliorer les courbes génériques existantes. Une évaluation expérimentale basée sur nos données montre que notre approche améliore modestement la précision des paramètres. Cependant, nous n’affirmons pas nécessairement que les résultats ainsi obtenus soient concrets car aucune de nos expériences pratiques n’a été conduite en temps réel sous le moteur de recherche Google.----------ABSTRACT : Web advertisements that are in the form of text links are displayed in the results pages of search engines through internauts requests via keywords purchased by advertisers via an auction system. Commonly, the first pages of search engine offer advertisers to promote products and services. When an ad displays and a user clicks on it, the company in question pays the search engine. To manage its budget, a company must establish bid strategies; select a set of keywords and determine an amount for each keyword. Obviously, historical data on such keywords are needed to assess the behavior of users by their entry into the search engine query. The work presented in this thesis is part of a series of research aimed at developing algorithms to improve the performance of advertising campaigns on search engines. In this context, we propose an algorithm that assigns optimal keywords positions so that the total number of clicks per campaign is maximized. Furthermore, a generic method of generating curves is proposed for each keyword to make a prediction of the number of clicks and estimate the cost per click according to its position. These parameters are critical to the optimization program. We present a classification approach, based on data mining techniques, in order to extract hidden information in data warehouse keywords in order to identify similar behaviors of keywords and classify them thereafter. An improved classification of keywords is estimated to lead to better generic curves. Our strategy uses a lot of samples from different campaigns with different types of market on the web. This strategy allows us to conclude, during the automatic classification, that the number of classes of keywords is appropriate for all campaigns. We used various methods of automatic classifications for better organization of keywords according to their characteristics. Among the algorithms mentioned in this document there are: k-means, fuzzy c-means, clustering large application, clustering based on local shrinking and partitioning around medoïds. The results obtained in the automatic classification proved to lower our expectations. However, our mandate does not stop there; we must improve existing generic curves. Experimental evaluation based on data provided showed that our approach modestly improves the accuracy of parameters. However, we cannot say that the results are real because we have not done a practical experience in real time on the Google search engine.

Open Access document in PolyPublie
Department: Département de mathématiques et de génie industriel
Dissertation/thesis director: Michel Gamache and Luc Adjengue
Date Deposited: 22 Dec 2014 14:25
Last Modified: 24 Oct 2018 16:11
PolyPublie URL: https://publications.polymtl.ca/1509/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only