Libération utilise DataDome + Arc XP pour neutraliser le scraping IA malveillant en moins de 2 millisecondes
Libération est un journal français avec plus d’un million de lecteurs quotidiens et plus de 120 000 abonnés. Confronté à une recrudescence des bots de scraping basés sur l’IA et ne disposant pas d’une visibilité claire sur le trafic non humain, le journal avait besoin d’une observabilité et d’un contrôle instantanés sur son site web. Puisqu’ils utilisaient Arc XP, une plateforme destinée aux éditeurs et articulée autour d’un CMS, ils ont profité de son intégration native avec DataDome pour déployer Bot Protect. En quelques clics, ils ont commencé à bloquer le trafic automatisé non autorisé en quelques minutes, préservant ainsi son contenu et le protégeant contre le vol.
Le défi : le vol de contenu par les robots d’indexation et les scrapers basés sur l’IA
« En tant que organe de presse, nous créons des informations pour les humains, pas pour les bots, les crawlers ou les agents d’IA », déclare Lucas Delcroix, CTO chez Libération. L’éditeur touche les lecteurs à travers son site, son application mobile et son édition papier, en mettant particulièrement l’accent sur la culture, parallèlement à la politique, à l’économie et à la société.
Comme de nombreuses entreprises de médias, Libération utilise un paywall pour protéger une partie de son contenu, mais des crawlers non autorisés (souvent alimentés par l’IA) et des sites miroirs effectuent de plus en plus de scraping sur les pages publiques à grande échelle. Ce faisant, ils contournent les publicités et consomment de la bande passante, avec peu ou pas de bénéfice pour l’entreprise.
Les recours juridiques peuvent prendre des années à se concrétiser. « Nous ne pouvons pas attendre les solutions juridiques de la France ou de l’Europe ; nous devons nous protéger maintenant, avant que le contenu ne soit volé », déclare Lucas.
Après avoir adopté la plateforme d’Arc XP, conçue spécifiquement pour les salles de rédaction, les équipes produit et ingénierie de Libération manquaient encore d’une vue « lisible » du trafic non humain. « Nous étions un peu à l’aveugle concernant le trafic technique : requêtes, outils, clients. Nous ne savions pas vraiment quels outils ou acteurs non humains accédaient à notre site et copiaient du contenu », explique Lucas. Sans une détection de bot appropriée, même les atténuations simples étaient lentes, et les abuseurs pouvaient changer de tactique avant que les protections ne soient effectives.
La solution : DataDome + Arc XP pour une observabilité et une protection instantanées
Face au scraping agressif et au vol de contenu, Libération savait qu’elle devait trouver une solution adaptée et s’est tournée vers DataDome.
« Après avoir rencontré l’équipe de DataDome, vu leurs références clients et appris que notre CMS, Arc XP, avait formé un partenariat avec DataDome, nous étions convaincus que nous voulions travailler avec eux », explique Lucas.
La mise en œuvre s’est déroulée sans accroc. « Nous avons simplement ajouté une clé secrète à l’intégration Arc XP, et cela a fonctionné instantanément », note-t-il. Délai de mise en valeur : moins de cinq minutes.
À partir de là, l’équipe a obtenu la visibilité qui lui faisait défaut. « La mise en place de DataDome nous a apporté une observabilité claire », explique Lucas. « Nous avons davantage confiance dans notre trafic et dans la manière dont le site est consulté. »
La collaboration avec DataDome est restée légère mais efficace, avec des revues de cas d’utilisation et des discussions sur les meilleures pratiques. « Travailler avec l’équipe est simple et clair », ajoute-t-il.
Les résultats : fin du scraping, contenu sécurisé et esprit tranquille
Une fois DataDome en place, Libération a enfin pu analyser avec précision la composition de son trafic. Entre janvier et mai 2026 seulement, DataDome a bloqué 565 millions de requêtes malveillantes (une moyenne de 113 millions par mois) rovenant de bots, crawlers, et agents IA stockant du contenu ou exécutant des requêtes liées à la manipulation ou à la fraude.
La visibilité offerte par DataDome a également révélé que les tentatives de scraping non autorisées ont augmenté de 86% entre janvier et mai 2026. « Nous avons même constaté l’existence de faux sites de cryptomonnaie imitant Libération pour piéger les utilisateurs, ce qui constitue un autre exemple d’utilisation abusive », dit Lucas.
Désormais, ses ingénieurs peuvent distinguer d’un coup d’œil les visiteurs humains, les principaux robots d’indexation légitimes, les partenaires contractuels, les agents IA non autorisés, et les scrapers. « Nous sommes passés du statut de victimes à celui d’observateurs », explique Lucas. « Nous pouvons voir exactement quels outils explorent notre site web et décider ce qu’il faut autoriser ou bloquer. »
Sur le plan opérationnel, les avantages ont été immédiats. Grâce au partenariat entre DataDome et Arc XP, Libération neutralise désormais le trafic malveillant en moins de 2 millisecondes.
Ce changement a également augmenté la bande passante de l’équipe, entraînant des économies de temps significatives et une réduction de la consommation excessive de ressources due au trafic automatisé indésirable.
Pour eux, cette protection est également synonyme de tranquillité d’esprit. « L’un des grands avantages de DataDome, c’est qu’on n’a pas à s’en soucier : on se sent protégés 24 heures sur 24 », explique Lucas.
Identifiez les scrapers IA et les bots malveillants qui visitent votre site, et bloquez-les en quelques minutes. Obtenez gratuitement votre analyse de vulnérabilité.