Étude de cas : Ooreka met fin aux attaques DoS avec DataDome
Ooreka.fr est un grand site français de contenu et de conseils sur le quotidien et la vie pratique. Le site renseigne les internautes sur 450 sujets distincts, répartis en huit grandes catégories : maison, argent, famille, santé, droits, carrière, véhicule et entreprise.
Avec son audience mensuelle de 10 millions de visiteurs uniques, Ooreka s’approche du top 50 des sites les plus visités en France. C’est aussi l’un des top 10 des médias les mieux référencés naturellement.
Rédigés par une communauté d’experts indépendants, les 50 000 articles du site apportent des réponses fiables aux questions des internautes. Guides complets, fiches pratiques, vidéos, modèles de lettres et de contrats : chaque thème abordé est traité de façon simple, vivante et complète.
Créé en 2007, Ooreka est une marque de la société FineMedia, une filiale de SoLocal Group.
Les problèmes : attaques DoS et pillage du contenu
Paul Marcombes est le CTO d’Ooreka. Lors de son arrivée dans l’entreprise en 2017, la problématique des robots était déjà bien connue de son équipe.
“Nous sommes un grand site de contenu, et nous étions bien conscients d’être pillés régulièrement,” commente-t-il. “Nous n’étions pas réellement inquiets pour notre référencement, qui reste excellent, mais le scraping est un phénomène indésirable.”
En effet, pour Ooreka, les attaques à répétition sont le principal problème lié à l’activité des robots suscitant deux ou trois indisponibilités par an, d’une durée moyenne de 2 à 3 heures chacune.
“Nous avions une architecture legacy très monolithique,” explique Paul Marcombes. “Par conséquent, quand les robots s’amusaient par exemple à remplir des formulaires à tout va, le traitement des interactions n’arrivait pas à suivre, les serveurs étaient surchargés, et le site tombait.”
Les ruptures de service ne sont jamais bonnes pour la réputation d’un grand site, que ce soit auprès des internautes ou de Google.
“Nous avons eu, par exemple, une attaque qui consistait à envoyer des milliers de mails depuis notre site,” se souvient Paul Marcombes. “Là, nous avons simplement désactivé la fonctionnalité qui permettait de partager des articles par mail. Pour un autre type d’attaque, la solution pouvait être de faire du throttling pour limiter le nombre de “post” par seconde. Mais chaque attaque demande une réponse sur mesure avec, à la clé, du temps et des ressources perdus.”
Par ailleurs, les robots ne ciblaient pas uniquement le site web d’Ooreka, mais également les API.
“Tous les points de contact client qui nécessitent des traitements pouvaient faire tomber le site quand les robots frappaient,” souligne le CTO.
La solution : DataDome identifie et bloque les bots nuisibles
Ooreka étant une filiale du groupe SoLocal, qui utilisait déjà la solution DataDome, le choix s’est fait naturellement. Et si l’équipe IT a eu une petite frayeur au moment de l’activation de la solution — ils se trouvaient eux-mêmes bloqués — les choses sont très vite rentrées dans l’ordre un fois que l’adresse IP d’Ooreka a été autorisée.
“Rapidement, nous avons constaté que tout était en ordre,” rassure Paul Marcombes. “Puisque le dashboard nous montre l’état du trafic en temps réel, l’activité des bons robots est visible et nous pouvons observer que DataDome les laisse passer.”
Les rapports de l’outil DataDome permettent également d’analyser le taux de remplissage du CAPTCHA. Celui-ci est présenté aux visiteurs ayant un comportement suspect. Sur Ooreka.fr, très peu de CAPTCHAs sont effectivement remplis, indiquant un taux de faux positifs extrêmement faible : l’IA de DataDome fait parfaitement la distinction entre les humains et les robots et ne pénalise en rien le trafic légitime.
Résultats : fin des attaques DoS et tranquillité de l’équipe IT
Pour Paul Marcombes et l’équipe IT d’Ooreka, le principal bénéfice de la solution DataDome est la fin des attaques DoS : le site ne tombe plus.
Les robots continuent toujours à chercher à contourner les obstacles et à attaquer de nouvelles façons, mais la base de données partagée entre tous les clients DataDome permet d’identifier très rapidement les nouvelles menaces. Dès qu’un nouveau robot indésirable est détecté sur le site d’un client, l’algorithme DataDome est mis à jour en temps réel, et tous les sites protégés par la solution en bénéficient immédiatement.
“Nous sommes en train de migrer ooreka.fr vers une nouvelle architecture, et je n’ai pas envie de passer du temps à travailler sur le site legacy,” remarque Paul Marcombes. “Avec la protection DataDome, ce n’est plus nécessaire. Nous avons migré le contenu, mais toutes les interactions sont encore sur l’ancien site, et ça tourne sans que j’aie à m’en soucier. Ça marche, je n’ai pas besoin d’y penser, c’est ça qui est agréable.”