Aller au contenu principal
Mis à jour le

Pourquoi les IA ne citent pas ton site

Les 5 raisons qui reviennent dans 90 % des audits qu'on fait. Avec un diagnostic rapide pour chacune, et ce que tu peux corriger toi-même vs ce qui demande un dev.

Avant de chercher loin

Un site invisible pour les IA n'est presque jamais "trop petit" ou "trop niche". Il a juste un blocage technique ou éditorial parmi 5 grandes catégories.

Si tu as cherché ton entreprise dans ChatGPT, Perplexity ou Claude et que tu n'apparais nulle part, tu n'es pas seul : c'est le cas de la majorité des sites de TPE et PME aujourd'hui. Mais contrairement à ce qu'on lit souvent, ce n'est presque jamais une question de taille de marché ou de concurrence.

Dans les centaines de scans qu'on a fait passer à Trakora.ai, le diagnostic est presque toujours le même : un blocage technique ou éditorial qui rentre dans 5 grandes catégories, listées ci-dessous par ordre de fréquence.

Bonne nouvelle : la plupart se corrigent en moins d'une journée, sans intervention de développeur. La mauvaise nouvelle : tant qu'elles ne sont pas corrigées, aucun travail de contenu ne fera la différence.

Dans plus de la moitié des audits que nous faisons, le blocage critique est le robots.txt qui interdit aux bots IA d'accéder au site.

Tes bots IA sont bloqués par robots.txt

C'est la cause numéro 1, et de très loin. Beaucoup de templates de sites (WordPress, Shopify, certains thèmes Webflow) bloquent par défaut les crawlers IA dans le `robots.txt` pour des raisons historiques liées à la "protection du contenu". Résultat : ChatGPT, Claude et Perplexity ne peuvent même pas lire tes pages.

Comment vérifier en 30 secondes : ouvre `https://tonsite.fr/robots.txt`. Si tu vois une ligne qui ressemble à `Disallow: /` sous `User-agent: GPTBot` (ou `ClaudeBot`, ou `PerplexityBot`), tu es bloqué.

Exemples par secteur

  • SaaS : ce blocage est fréquent quand le site a été monté par une agence en 2022-2023 sur la base d'un thème "anti-scraping".
  • E-commerce Shopify : certains thèmes premium activent ce blocage par défaut "pour protéger la propriété intellectuelle".
  • WordPress avec Yoast : versions anciennes du plugin proposaient une option de blocage des "AI scrapers" qui est restée activée chez beaucoup de monde.

Comment corriger : modifier le `robots.txt` pour autoriser explicitement chaque bot IA. Procédure complète dans l'étape 1 du guide.

Faisable seul ? Oui, dans 90 % des cas. Sur certains CMS très fermés, il faut passer par leur support.

Ton contenu n'est pas structuré pour être cité

Les LLMs ne citent pas des paragraphes entiers. Ils citent des phrases courtes, autoportantes, qui ont du sens même sortie de leur contexte. Si tes pages sont remplies de marketing flou, de pronoms qui renvoient à des phrases précédentes, et d'aucune statistique chiffrée, les IA n'ont rien à extraire.

Comment vérifier : prends ta page d'accueil. Copie n'importe quelle phrase. Si tu la lis hors contexte, comprends-tu ce qu'elle dit ? Si tu hésites, l'IA hésitera aussi (et ne citera pas).

Exemples par secteur

  • Restaurants : "Une cuisine généreuse dans un cadre chaleureux" ne dit rien à une IA. "Restaurant italien à Lyon 2e, ouvert tous les jours sauf lundi, 30 € par personne en moyenne" oui.
  • Coachs / freelances : "J'accompagne les leaders inspirants" ne dit rien. "Coach business pour fondateurs solo qui dépassent 100k€ de CA" oui.
  • SaaS : "Solution innovante de productivité collaborative" ne dit rien. "Outil de gestion de tickets pour équipes support de 5 à 20 personnes" oui.

Comment corriger : réécrire 5 à 10 phrases-clés des pages les plus importantes. Pas besoin de tout refondre. Méthode détaillée dans l'étape 4 du guide.

Faisable seul ? Oui, demande surtout du temps de réflexion éditoriale.

Tu n'as pas de schema JSON-LD sur tes pages

Le schema JSON-LD est une balise invisible dans le `<head>` de tes pages qui décrit ton contenu de manière structurée. C'est le plus gros multiplicateur de citations IA documenté à ce jour : une page FAQ avec FAQPage schema est citée 2,7× plus souvent qu'une FAQ sans (Relixir, 2025). Sans schema, ton contenu existe pour les IA, mais elles ont du mal à le contextualiser : est-ce une FAQ ? un guide ? un produit ? un article ? Elles doivent deviner, et souvent elles préfèrent citer un autre site qui a la balise.

Comment vérifier : colle l'URL d'une de tes pages dans le Rich Results Test de Google. Si l'outil ne détecte aucun schema structuré, tu es en sous-régime.

Exemples par type de page

  • Page d'accueil sans Organization ou LocalBusiness : invisible pour les recherches locales et les requêtes "qui est X ?".
  • FAQ sans FAQPage : le contenu est lu mais 2,7× moins cité.
  • Article de blog sans Article + dateModified : les IA pensent que c'est obsolète et préfèrent citer du contenu plus frais.

**Comment corriger** : ajouter les schemas pertinents dans le `<head>` de chaque type de page. La plupart des CMS modernes (WordPress avec Yoast/RankMath, Webflow, Framer) le font via plugin ou champ dédié.Rich Results Test

Faisable seul ? Oui sur les CMS modernes. Sur un site custom, il faut un dev pour modifier les templates (compter 2 à 4h).

Personne d'autre que toi ne parle de toi

Une part importante des recommandations IA vient de sources tierces : annuaires, listes "best of", reviews, articles, agrégateurs sectoriels. Si la seule mention de ton entreprise sur le web est ton propre site, les IA ont peu de signaux pour confirmer que tu es légitime. C'est particulièrement vrai pour les secteurs où la confiance est critique : services pro, santé, finance, formation. Une IA ne recommandera jamais un coach business qui n'apparaît sur aucun annuaire ni avis.

Comment vérifier : tape ton nom (ou celui de ton entreprise) dans Google + Perplexity + ChatGPT. Combien de sources tierces te citent ? Si la réponse est zéro, c'est ton blocage principal.

Exemples par secteur

  • SaaS : pas sur Product Hunt, AlternativeTo, G2 ou Capterra, invisible pour les recherches "outil pour faire X".
  • Restaurant local : pas sur Google Business Profile, TripAdvisor ou guides locaux, invisible pour "meilleur restaurant à [ville]".
  • Freelance : pas sur Malt, LinkedIn actif, ou portfolios sectoriels, invisible pour "freelance spécialisé en X".

Comment corriger : t'inscrire sur 3 à 5 plateformes pertinentes pour ton secteur. C'est lent (2 à 6 mois pour voir l'effet), mais c'est cumulatif et durable.

Faisable seul ? Oui à 100 %, demande juste de la patience.

Tes pages sont trop courtes et trop creuses

Les IA favorisent les pages qui répondent précisément à une question. Une page de 200 mots de marketing ne contient pas assez de matière pour qu'une IA y trouve une réponse complète. Elle préférera citer une autre page, même moins bien classée sur Google, mais plus dense en information utile. Règle observée : sous 600 mots utiles, une page n'est quasi jamais citée. Au-delà de 1500 mots utiles avec une bonne structure (H2, listes, exemples), les chances montent significativement.

Comment vérifier : compte les mots de tes 5 pages les plus importantes. Combien dépassent 600 mots ? Si la réponse est "aucune", tu as une page d'intention à créer.

Exemples typiques de pages trop courtes

  • Page "Nos services" : qui liste 4 puces sans explication.
  • Page "À propos" : qui dit "Nous sommes une équipe passionnée".
  • Page "Comment ça marche" : qui décrit 3 étapes en 2 lignes chacune.

Comment corriger : réécrire les pages les plus stratégiques pour qu'elles répondent vraiment à une question, avec des exemples concrets, des chiffres, et au moins 600 mots utiles. Lister les pages d'intention manquantes : FAQ dédiée, comparatifs, cas d'usage, tutoriels.

Faisable seul ? Oui, demande du temps de rédaction (compter 2 à 4h par page).

La plupart des problèmes qui empêchent les IA de citer ton site se corrigent en moins d'une journée, sans développeur.

Comment savoir lequel de ces 5 problèmes te plombe ?

Le moyen le plus rapide : un audit. Sans diagnostic, tu peux passer 3 mois à corriger la mauvaise raison.

Trakora.ai te donne en moins d'une minute :

  • tes 2 scores de visibilité IA,
  • le problème critique numéro 1 parmi les 5 ci-dessus,
  • le nombre exact des autres problèmes détectés (sans les détailler dans le scan gratuit).

Si tu veux le détail complet et le parcours d'actions priorisé : rapport complet à 59 €, accès au rapport inclus.

Scanner mon site gratuitement

Questions fréquentes

Comment savoir si une IA connaît mon site ?
La méthode la plus simple : pose la question directement à ChatGPT et Perplexity. "Que peux-tu me dire sur [nom de ton entreprise] ?" Si la réponse est vague, hallucinée, ou un refus, ton site n'est pas dans les sources que l'IA juge fiables. Tu peux aussi utiliser un audit automatisé qui vérifie en 60 secondes les 5 raisons listées sur cette page.
Mon site est référencé sur Google. Pourquoi pas sur ChatGPT ?
Google et les IA n'utilisent pas les mêmes signaux. Google note ta page sur la base des backlinks, mots-clés, intention. Les IA notent ta page sur la base de sa lisibilité (peuvent-elles t'accéder ?), sa structure (le contenu est-il citable ?) et sa réputation tierce (es-tu mentionné ailleurs ?). Un site bien classé en SEO peut être totalement invisible pour les IA, et inversement.
Combien de temps pour voir des résultats après correction ?
Les corrections techniques (robots.txt, schemas, llms.txt) sont prises en compte sous 1 à 2 semaines par les bots qui crawlent en live (ChatGPT search, Perplexity). Les corrections de contenu et la présence sur des sources tierces mettent 2 à 6 mois à infuser dans les corpus d'entraînement des LLMs.
Mon site est petit / très niche. Est-ce que ça vaut la peine de faire tout ça ?
Oui, et même plus que pour les gros sites. Les IA recherchent activement des sources spécialisées et fiables sur des sujets niches, parce qu'il y a peu de contenu disponible. Un site bien optimisé sur une niche peut devenir la source citée par défaut sur ses mots-clés, là où sur Google la même position serait beaucoup plus disputée.
Mes concurrents sont-ils déjà visibles ?
Souvent non. Demande à ChatGPT "qui sont les principaux acteurs de [ton secteur] ?" et regarde la réponse. Dans la majorité des secteurs, les IA citent encore peu de noms, et souvent les mêmes 2 ou 3. Il y a actuellement une fenêtre où être correctement référencé pour les IA donne un avantage sur des marchés peu compétitifs côté GEO.
Le blocage robots.txt est-il volontaire chez certains sites ?
Oui, mais c'est rare. Quelques sites de presse et de stock photo bloquent activement les bots IA pour protéger leur monétisation (ils veulent que les utilisateurs viennent sur leur site, pas que ChatGPT résume leur contenu). Pour 99 % des sites de TPE/PME, le blocage est accidentel et coûte du trafic qualifié.
Faut-il payer pour être cité par les IA ?
Non. Aucune IA ne vend de placement publicitaire dans ses réponses générées (à ce jour). La visibilité IA se gagne uniquement sur des critères techniques et éditoriaux. Si tu vois des outils qui te promettent "achetez votre place dans ChatGPT", c'est de la fraude.
Et si je ne suis qu'un blogueur / créateur de contenu ?
Les blogs sont parmi les sources les plus citées par les IA quand ils sont bien structurés. Les 5 raisons listées ici s'appliquent intégralement : robots.txt, contenu citable, schema Article + dateModified, présence sur des annuaires de blogs ou réseaux pro, pages assez denses. Un blog spécialisé bien optimisé peut devenir une source de référence sur sa thématique.
Gratuit · Sans compte · 60 secondes

Alors, pourquoi pas
toi ?

Une URL. Soixante secondes. Tu sors avec tes 2 scores, le problème qui bloque le plus, puis tu peux débloquer le parcours complet pour corriger.

https://
Sans carte bancaire 1 problème critique révélé Parcours complet après achat