AEO : Comment auditer la visibilité de votre marque dans les jeux de données d’entraînement des IA
Temps de lecture : 6 minutes | Par l’équipe Stratégie de This is why
Temps de lecture : 6 minutes | Par l’équipe Stratégie de This is why

Common Crawl est une organisation à but non lucratif qui archive le web. Ses données constituent jusqu’à 80% du volume d’entraînement de GPT-3 selon les publications de recherche d’OpenAI.
Le CC Rank, mis en lumière par les recherches de Metehan Yesilyurt, utilise des métriques mathématiques complexes comme la Harmonic Centrality pour définir quels sites sont les plus « importants » à mémoriser pour une IA.
Utilisez l’index officiel de Common Crawl pour voir si votre domaine est régulièrement capturé.
Consultez votre position via l’outil CC Rank Checker. Un score dans le top 1 million est un indicateur fort de « mémorabilité » par les futurs modèles de langage.
L’AEO ne remplace pas le SEO, il le complète. Si vous avez déjà investi dans une stratégie de contenu, l’étape suivante est de s’assurer que ce contenu est « assimilable » par les LLMs.