Le Parisien régule son trafic bot avec DataDome
Le Parisien est un journal quotidien régional français couvrant l’actualité locale de la région parisienne, mais également les actualités nationales et internationales. Avec plus de 17 millions de visiteurs uniques par mois, leparisien.fr est le troisième site d’informations généraliste en France (source : Médiamétrie, juin 2017).
Sa communauté de lecteurs est particulièrement active, aussi bien sur le site du journal lui-même que sur les réseaux sociaux.
A part la marque parapluie Le Parisien, l’éditeur gère également plusieurs autres portails pour des segments de marché spécifiques. La gamme de ses plates-formes s’étend du portail web classique et du site mobile à la web TV et aux applications mobiles.
Le problème : le vol de contenu parasite la syndication
“Nous avons commencé à prendre conscience du problème en 2013”, commente Caroline de La Vèze, Responsable de la syndication de Le Parisien. “Nous avons été sensibilisés par la FEVeM, une association professionnelle regroupant les principaux acteurs du marché de la veille et des études médias en France, avec laquelle nous avons mis en place des relations commerciales.”
La syndication est une source de revenus importante pour Le Parisien, explique Mme de La Vèze. La FEVeM s’inquiétait d’une concurrence déloyale de la part de certaines entreprises exploitant des robots scrapers pour récolter des contenus éditoriaux sur internet sans, contrairement aux membres de la FEVeM, rémunérer les éditeurs.
“Je me mets à la place des acheteurs : quand ils ont le choix entre une prestation dans les règles et une autre hors des clous mais moins onéreuse, je peux comprendre la tentation. Mais il fallait que nous fassions quelque chose.”
Le Parisien a d’abord considéré une action juridique, mais cette voie s’annonçait lente et coûteuse. Il fallait trouver une autre solution, plus efficace.
La solution : DataDome bloque les robots crawlers non autorisés
Caroline de La Vèze a rencontré DataDome pour la première fois lors d’une conférence organisée par le GESTE (Groupement des Éditeurs de Contenus et Services en Ligne).
Fabien Grenier, CEO et cofondateur de DataDome, y expliquait comment il avait décidé de mettre à profit l’expérience acquise en matière de bots dans le cadre de sa précédente entreprise de social listening pour proposer au marché une solution complète de gestion du trafic web non-humain.

Et de fait, la vision proposée par DataDome, à savoir non seulement bloquer les robots, mais aussi les identifier afin de pouvoir engager des discussions commerciales avec les opérateurs semblait prometteuse.
Après une installation très simple, l’équipe du Parisien a pu commencer à observer, en temps réel, les robots qui visitaient le site.
Étaient-ils surpris ?
“Oui et non. Nous avons notre infrastructure, et nous nous doutions bien qu’il y avait beaucoup de visiteurs qui ne devraient pas y être. Mais de le voir sur notre tableau de bord comme ça, et en particulier certaines marques … C’était constater “ne vous gênez pas, servez-vous !” Nous avons un fichier robots.txt où il est bien marqué « vous n’avez pas le droit de passer », mais ils étaient tous là.”
À partir de là, la crédibilité de la solution DataDome était établie. L’étape suivante était l’identification des partenaires légitimes, afin de s’assurer qu’ils pouvaient toujours accéder au site une fois la protection activée.
“C’était un grand travail en amont,” précise Mme de La Vèze. “Nous avons exporté la liste des bots connus, et demandé à tous les services concernés d’identifier les partenaires légitimes et actifs. Nous avions bien fait comprendre qu’en l’absence d’une réponse, le robot serait bloqué.”
Une fois la protection activée, certains partenaires, qui avaient changé leur adresse IP sans prévenir, se sont retrouvés bloqués. Heureusement, il est facile d’accorder un accès instantané à des bots individuels via le tableau de bord DataDome : le passage leur a été accordé en un clic.
Les résultats : trafic assaini, concurrence équitable
Où la protection DataDome a-t-elle eu le plus grand impact pour Le Parisien ?
“D’abord au niveau de l’hébergement,” affirme Caroline de La Vèze. “Nous avions des coûts beaucoup plus élevés que ce qu’ils devraient être, et DataDome a permis de réduire la charge. Même avant que tous nos actifs ne soient protégés, nous avons pu constater une réduction de 10% sur la charge serveur. La protection de nos applications a également amélioré leur stabilité.”
Grâce à son SEO très performant, Le Parisien n’a jamais été confronté à de sérieux problèmes dû à la duplication de leur contenu ailleurs. Concernant la syndication, en revanche, les avantages du blocage des robots indésirables sont évidents.