Mémoire de maîtrise (2016)
Document en libre accès dans PolyPublie |
|
Libre accès au plein texte de ce document Conditions d'utilisation: Tous droits réservés Télécharger (3MB) |
Résumé
La publicité en ligne est devenue une ressource économique importante et indispensable pour de nombreux services en ligne. Cependant, on note que ce marché est particulièrement touché par la fraude et notamment la fraude au clic. Ainsi, en 2015, il est estimé que, dans le monde, les annonceurs allaient perdre plus de sept milliards de dollars américains en raison de la fraude publicitaire. Les méthodes de luttes actuelles contre la fraude publicitaire sont concentrées sur la détection de logiciels malveillant et le démantèlement des réseaux de machines zombies qui y sont associés. Bien qu'indispensables pour limiter le nombre d'infections, ces démantèlements ne diminuent pas l'attrait pour cette fraude. Il est donc indispensable de s'attaquer en plus à l'incitatif économique. Pour cela, nous avons d'une part essayé de mieux comprendre l'écosystème de la fraude au clic et d'autre part évalué des possibilités de perturbations de cet écosystème afin de diminuer l'attractivité de la fraude. Dans un premier temps, nous avons collecté des données réseau générées par un logiciel malveillant de fraude au clic, Boaxxe. Ces données sont des chaînes de redirection HTTP qui montrent les liens entre les différents acheteurs et revendeurs d'une publicité, c'est-à-dire la chaîne de valeur. Celles-ci commencent au moteur de recherche d'entrée, opéré par des fraudeurs, passe à travers plusieurs régies publicitaires et termine sur le site d'un annonceur, celui ayant acheté le trafic. Dans un second temps, nous avons agrégé les données collectées afin de constituer un graphe montrant les relations entre les différents noms de domaine et adresses IP. Ce graphe est ensuite consolidé, grâce à des données de source ouverte, en regroupant les noeuds réseaux appartenant au même acteur. Le graphe ainsi obtenu constitue une représentation de l'écosystème de la fraude au clic de Boaxxe. Dans un troisième temps, nous avons évalué différentes stratégies de perturbation de l'écosystème. L'objectif de la perturbation est d'empêcher la monétisation de trafic généré par Boaxxe, c'est-à-dire d'empêcher le transit du trafic du moteur de recherche vers le site de l'annonceur. Il s'avère que la stratégie la plus adaptée à notre problème est celle utilisant la méthode du Keyplayer. Nous avons ainsi montré qu'il était possible de protéger un nombre important d'annonceurs en supprimant un faible nombre d'intermédiaires. Enfin, nous discutons des possibilités de mise en pratique de l'opération de perturbation. Nous insistons sur le fait qu'il est important de sensibiliser les annonceurs à la fraude afin qu'ils puissent prendre des mesures contraignantes envers les régies publicitaires les moins scrupuleuses.
Abstract
Online advertising is a growing market with global revenues of 159.8 billion dollars in 2015. Thus, it is a good target for fraudsters to make money on. In 2015, it is estimated that, globally, advertisers were defrauded of more than seven billion dollars. The security community is concerned by this kind of fraud, known as click fraud, and a lot of research aims to limit it. Current methods are more focused on studying malware binaries and performing botnet take-downs. These operations are useful to limit the propagation of malware and to protect users from known threats. However, it does not have an impact on the economic incentives of perpetrating click fraud. In order to diminish the attractiveness of the fraud we first tried to better understand the click-fraud ecosystem and then evaluate disruption strategies on this ecosystem. Firstly, we collected network traces generated by a well-known click-fraud malware, Boaxxe. This data are HTTP redirection chains showing the links between all the intermediaries involved in the reselling of an ad. This constitutes the value chain. The redirection chains begin at a doorway search engine, operated by fraudsters, pass through several ad networks and land on an advertiser web site, that bought the traffic. Secondly, we aggregated the data collected into a single graph. It shows the relationships between the domain names and IP addresses involved in the Boaxxe fraud. We then consolidate this graph by merging all the network nodes operated by a single organization by leveraging information obtained from open sources. Thus, the graph is a representation of the fraud ecosystem. Thirdly, we evaluated disruption strategies on this ecosystem. The aim is to stop the monetization of the traffic generated by Boaxxe. This is equivalent to stopping the traffic going from the doorway search engine to the web sites of the advertisers. Among the strategies tested, the most suitable for our problem was the Keyplayer strategy. We showed that it is possible to protect numerous advertisers from this fraud by disrupting the ecosystem graph. Finally, we discuss how to perform the disruption operation in practice. We focus on increasing the level of awareness of advertisers that could have a strong position to limit click fraud. One way in which they could do so is by implementing controls to make sure they are not maintaining business relationships with unscrupulous ad networks.
Département: | Département de génie informatique et génie logiciel |
---|---|
Programme: | Génie informatique |
Directeurs ou directrices: | Antoine Lemay, Joan Calvet et Jose Manuel Fernandez |
URL de PolyPublie: | https://publications.polymtl.ca/2260/ |
Université/École: | École Polytechnique de Montréal |
Date du dépôt: | 20 avr. 2017 11:34 |
Dernière modification: | 26 sept. 2024 20:43 |
Citer en APA 7: | Faou, M. (2016). Analyse et perturbation d'un écosystème de fraude au clic [Mémoire de maîtrise, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/2260/ |
---|---|
Statistiques
Total des téléchargements à partir de PolyPublie
Téléchargements par année
Provenance des téléchargements