Interview DataDome : Patrick Herrmann

CTO de PriceMinister-Rakuten, Patrick Herrman répond à nos questions sur la solution DataDome.

Où sont hébergés les serveurs de PriceMinister-Rakuten ?

Toute l’infrastructure de production est hébergée chez SFR en Ile de France et une partie de l’infrastructure d’intégration est au Luxembourg.

Aviez-vous conscience de l’ampleur du trafic robot ? Si oui, quel impact avait-il ?

Nous n’en avions pas conscience à ce point là.
Après plusieurs semaines de récupération des données et d’analyse du trafic avec la solution DataDome, nous avons vu les premiers chiffres et c’était juste impressionnant : 75% de notre trafic était du trafic de bots.

Les gens cherchaient sur une marketplace ouverte comme celle de PriceMinister-Rakuten des avis clients, des avis utilisateurs et à compléter le catalogue avec des attributs et de la qualification des produits présents sur notre site.

Finalement, cela fait sens, mais nous ne nous étions pas rendu compte que cela générait autant de trafic.

Globalement, cela créait peu de ralentissement sur la partie visible du site et sur l’expérience utilisateurs. En revanche, cela avait de gros impacts sur tout notre système de back end et sur la façon dont les données sont mises à jour et alimentent le site web (imports de catalogues de marchands).

Utilisiez-vous au préalable un système de protection contre le trafic robot ? Si oui, quel type d’outil, quel était son fonctionnement et ses limites ?

Nous avions un système de surveillance et des alertes qui nous permettaient d’être réactifs et d’intervenir rapidement quand il y avait ce type de problèmes, mais ce n’était pas automatisé comme DataDome le permet.
Les administrateurs réseau, ou les personnes d’astreintes à ce moment-là, regardaient les IP sources provoquant ce trafic et ils bloquaient manuellement ces adresses IP. Ce qui était parfois assez frustrant, car quand il s’agit de pirates qui ont une plage d’IP énorme et en changent toutes les 5 minutes, c’est extrêmement compliqué à filtrer et cela devient interminable.

Quand on a découvert la solution DataDome, cela a été vécu comme un soulagement. On va enfin pouvoir faire autre chose que passer notre temps à filtrer des IP. 🙂

Sur quelle brique de votre infra avez-vous installé DataDome ?

Sur les serveurs web frontaux qui sont les serveurs en première ligne et répondent aux requêtes entrant des utilisateurs et des crawlers.

Nous n’avons pas de serveur cache à proprement parler. Comme nous proposons du B to B et du C to C, nous avons des marchands qui mettent à jour leur catalogue toutes les heures. Ainsi, on peut difficilement se permettre de livrer du contenu caché, car le contenu ne serait pas à jour. On limite donc au maximum ce que l’on cache et on travaille l’optimisation sur d’autres briques de la plateforme.

Quel a été l’impact du module DataDome sur la charge CPU/RAM du serveur ?

Cela fait un mois maintenant que le filtrage est en place en production et nous ne filtrons pas tout encore, nous y allons petit à petit. Et pour le moment, aucun impact significatif de performances en termes de CPU et de ressources utilisées.

Vous avez récemment switché vers le nouveau point de présence en France, quelle latence constatez-vous à présent ?

C’est bénin.

Le temps de latence de l’aller-retour entre le module DataDome installé sur nos serveurs Apache et le point d’hébergement des serveurs DataDome en France est complètement insignifiant par rapport à tout le reste du temps que prend la résolution d’une requête.

Nous en sommes pleinement satisfaits. 🙂

Quelle section de PriceMinister-Rakuten est protégée par DataDome ? Sont-elles toutes touchées par le trafic Robot ?

Pour le moment on protège le site mobile et desktop.
L’appli mobile n’est pas encore protégée par DataDome, car moins visible à tous les crawlers. Mais cela sera fait dans les semaines qui viennent.

Que pourrait faire DataDome pour améliorer encore l’expérience utilisateur ?

À terme ce sera bien que DataDome évolue vers plus d’industrialisation : que l’ensemble du processus d’installation soit plus simple, qu’il y ait plus de documentations en ligne.
Je sais que nous étions parmi les premiers et que nous avons pris DataDome au moment où la solution était mûre, mais pas l’ensemble du packaging.

Globalement, c’est ce vers quoi tend un éditeur de logiciel une fois la solution technique mûre : la possibilité de facilement débloquer et activer le packaging via un site Internet, de la documentation en ligne, le module déjà compilé en fonction de l’environnement de l’utilisateur…