DataDome

Comment l’IA générative utilise la génération assistée par récupération quelles sont les conséquences pour votre entreprise ?

Table des matières

Les outils d’IA générative comme ChatGPT ont cherché à résoudre le problème des données en temps réel depuis leur création. Une tentative a consisté à utiliser des plugins pour accéder à des informations plus récentes qui n’étaient pas incluses dans les données d’apprentissage.

Désormais, les outils d’IA ont accès à la génération augmentée par récupération (RAG), une technique qui peut recueillir des faits à partir de sources externes afin d’améliorer la précision des réponses du modèle. Cela aide à garantir que les grands modèles de langage (LLM) restent à jour, même sans mise à jour complète des données d’entraînement.

Pourquoi les applications d’IA utilisent-elles la RAG avec leurs LLM ?

Toutes les informations ne peuvent pas être intégrées et apprises par les LLM pendant leur phase d’entraînement. Par exemple, il n’est pas possible pour un LLM de connaître le futur prix d’une action ou le résultat d’un match de baseball. Ainsi, si vous interagissez avec un LLM via une application comme ChatGPT et posez une question sur un fait survenu après son apprentissage et qui ne peut être prédit, le LLM peut interagir avec une source de données en direct—par exemple, un site web ou une API—pour répondre avec des informations actualisées.

Chronologie de ChatGPT

Ainsi, en tant qu’utilisateur interagissant avec le LLM, vous avez accès à tout le contenu appris par le LLM, mais vous bénéficiez également d’un nouveau contenu. Les LLM peuvent automatiquement interagir avec ce contenu externe, analyser et ingérer les données, et le rendre disponible pour vous sous une forme plus lisible par l’homme.

Mon site web peut-il être ciblé par RAG ?

Oui, tout site web ou API publique peut être ciblé par un LLM utilisant la RAG pour recueillir des informations.

Si votre application est considérée comme une bonne source d’informations sur un certain sujet (sports, finance, e-commerce, restaurants, actualités, etc.), alors les outils d’IA peuvent commencer à effectuer des requêtes RAG pour obtenir des informations en direct et les exploiter dans les résultats de leur LLM.

Quel est l’impact potentiel pour mon entreprise si mon site web est ciblé par la RAG LLM ?

Comme nous l’avons évoqué dans un article de blog précédent sur les plugins ChatGPT, les applications d’IA qui exploitent le LLM peuvent entraîner une diminution potentielle du trafic humain vers votre site web, car leurs utilisateurs interagiraient avec le LLM et non directement avec votre site web. Selon votre modèle d’affaires, cela pourrait entraîner une diminution des ventes ou moins de publicités vues et cliquées, ce qui pourrait nuire à votre chiffre d’affaires.

Votre contenu peut également être mélangé avec du contenu invalide qui a été halluciné par le LLM, ce qui peut nuire à votre réputation.

Cependant, selon votre contenu, et si l’application d’IA fournit des citations claires et des liens vers votre contenu, cela pourrait être une opportunité potentielle de permettre aux utilisateurs d’interagir avec votre contenu via un canal différent.

Comment puis-je bloquer les requêtes RAG LLM sur mes sites web et API ?

Dans le cas des applications d’IA qui déclarent leur présence dans leur user-agent, vous pouvez bloquer les requêtes provenant de ces user-agents comme listés dans les sous-chaînes. Par exemple, dans le cas des plugins ChatGPT qui exécutent la RAG, vous pouvez bloquer les user-agents contenant la sous-chaîne ChatGPT liés à des user-agents ressemblant à ceci : Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot.

Cependant, toutes les applications d’IA utilisant la RAG ne déclarent pas leur identité dans leur user-agent. Dans cette situation, vous devrez appliquer des techniques de détection de bot avancées pour identifier que la requête provient d’un bot. De plus, puisque la RAG peut nécessiter une seule requête pour obtenir l’information, il est important d’utiliser un service de protection contre les bots qui peut – sans impacter l’UX – détecter et protéger le trafic web en temps réel, et détecter les bots dès la première requête.

Conclusion

DataDome est une solution robuste de détection des bots et de la fraude en ligne qui fonctionne à la périphérie, examinant les requêtes en temps réel pour identifier le trafic malveillant dès la première requête. Notre taux de faux positifs de 0,01 %, le meilleur du secteur, et nos challenges invisibles préservent l’expérience utilisateur tout en éloignant les bots malveillants.

Essayez DataDome gratuitement ou réservez une démo aujourd’hui pour voir comment nous pourrions protéger votre entreprise contre le trafic de bots non autorisé.