Depuis des mois, le fichier llms.txt déclenche des débats passionnés dans la communauté SEO/GEO. Certains le présentent comme le « robots.txt des IA », d’autres comme une perte de temps pure. Spoiler : la vérité est moins binaire que ça, et surtout, personne ne te montre les chiffres.

C’est quoi, llms.txt ? (et d’où ça vient)

L’idée vient de Jeremy Howard (Answer.AI / fast.ai), qui a lancé la proposition en septembre 2024.

Le principe est simple : on ajoute à la racine du site un fichier /llms.txt, pensé pour être lu par les modèles de langage, pas par les humains. Howard le décrit comme un fichier Markdown qui donne un contexte rapide sur le site, avec des liens vers des fichiers Markdown plus détaillés.

« We propose adding a /llms.txt file to websites that are designed for reading by language models, not just humans. » — Jeremy Howard

L’objectif affiché : offrir aux LLMs une version propre du contenu — sans pub, sans navigation, sans bruit — pour qu’ils comprennent le site plus vite.

Attention au contresens de départ : llms.txt n’est pas un robots.txt pour LLMs. Le robots.txt contrôle le crawl. llms.txt, lui, ne contrôle rien : il expose du contenu. Ce sont deux problèmes différents.


Ce que disent vraiment les acteurs

C’est là que ça devient intéressant, parce que les positions officielles ne vont pas toutes dans le même sens.

OpenAI : adoption pratique, pas de soutien au standard

Soyons précis, parce que c’est régulièrement déformé :

  • OpenAI n’a jamais déclaré que llms.txt est un standard supporté ou utilisé pour le ranking ou la citation.
  • En revanche, OpenAI publie aujourd’hui son propre llms.txt pour rendre sa documentation plus exploitable par les LLMs (llms-guides.txt, llms-api-reference.txt, etc.).

Ce que ça prouve : une adoption pratique pour sa propre doc. Ce que ça ne prouve pas : un soutien officiel au standard comme signal de visibilité. Ne confonds pas les deux.

Google Search (John Mueller) : « spéculatif »

John Mueller, côté Search, a une position constante et tranchée. Trois points à retenir.

1. Aucun système IA majeur ne l’utilise.

« AFAIK none of the AI services have said they’re using LLMs.TXT (and you can tell when you look at your server logs that they don’t even check for it). » — John Mueller (Reddit, avril 2025)

Son argument est factuel : les logs serveurs ne montrent quasiment aucune consultation du fichier par les bots IA, et aucune preuve d’impact sur la découverte ou les citations.

2. La comparaison qui fait mal : la meta keywords.

C’est probablement sa déclaration la plus forte. Mueller compare llms.txt à la balise meta keywords :

« To me, it’s comparable to the keywords meta tag — this is what a site-owner claims their site is about. »

Le raisonnement est imparable :

  • le contenu est déclaré par le propriétaire du site ;
  • il est donc facilement manipulable (rien n’empêche de montrer une chose aux IA et une autre aux humains — bonjour le cloaking) ;
  • un moteur ou un LLM sérieux préférera analyser directement la page, qui contient déjà le HTML complet et les données structurées.

La meta keywords a été abandonnée pour exactement ces raisons. L’histoire bégaie.

3. Google Search ne l’utilise pas. Point.

Le twist : Chrome et Lighthouse, eux, l’intègrent

Et c’est là que le sujet devient stratégique, parce que Google se contredit en apparence — selon l’équipe produit à qui tu poses la question.

  • 15 mai 2026 : le Search Central Blog publie un guide d’optimisation pour l’IA qui range explicitement llms.txt parmi les choses dont tu n’as pas besoin (au même titre que le content chunking ou le schema spécifique IA).
  • 7 mai 2026 : quelques jours plus tôt, Lighthouse 13.3 fait passer une nouvelle catégorie « Agentic Browsing » en configuration par défaut. Et cette catégorie inclut un audit llms.txt.

La doc Chrome est claire sur le pourquoi :

« Without this file, agents may spend more time crawling the site to understand its high-level structure and primary content. » — Documentation Chrome

Le point essentiel : Google ne parle pas de SEO ici. Il parle de :

  • navigation agentique (un agent IA qui exécute une tâche sur ton site) ;
  • compréhension rapide de la structure du site ;
  • efficacité de l’agent.

Donc pas de contradiction réelle. Deux équipes, deux objectifs : Search juge la visibilité/ranking, Chrome mesure si un agent peut circuler dans ton site sans se perdre. À noter quand même : l’audit Agentic Browsing ne produit pas de score 0-100, et la catégorie est explicitement marquée comme « en cours de développement ». On est sur du signal exploratoire, pas sur une norme établie.


Mon analyse : qui en a vraiment un ?

Les déclarations, c’est bien. Les données, c’est mieux. Alors j’ai mesuré.

Méthode : j’ai identifié 69 000 domaines qui servent de sources à ChatGPT, et j’ai testé l’existence d’un llms.txt sur chacun.

Résultat : 20 % des sites en possèdent un.

Honnêtement, je m’attendais à un taux plus faible. Mais ce chiffre est gonflé : certains CMS génèrent un llms.txt nativement, sans aucune décision consciente du propriétaire du site. Le « 20 % » ne mesure donc pas une adoption stratégique — il mesure en partie un comportement de CMS par défaut.

Ce qui m’amène au point central.


Mon point de vue

Sans détour :

  • Ce n’est pas parce que certains en ont créé un que c’est pertinent. Une adoption par défaut n’est pas un signal d’efficacité. Corrélation ≠ utilité.
  • Google n’a probablement pas besoin de ça. Il a déjà le meilleur index du web. Pourquoi ferait-il confiance à un fichier déclaratif et manipulable plutôt qu’à son propre crawl ?
  • OpenAI communiquera le jour où ça lui servira. Tant qu’il n’y a pas d’annonce officielle, l’absence de signal est un signal.
  • Si tu veux être certain que ça ne sert à rien : crée-en un, et analyse tes logs. C’est le seul test irréfutable. Tu verras qui vient le visiter. Spoiler probable : pas grand monde, hors bots de niche type BuiltWith.

C’est ça, la vraie posture GEO : ne crois ni les enthousiastes ni les sceptiques sur parole. Mesure.


Et la communauté SEO/GEO dans tout ça ?

Petit aparté, parce que le sujet est devenu étrangement sensible.

Mon post LinkedIn n’avait qu’un seul but : lister des informations factuelles et fournir une statistique inédite. À aucun moment je n’ai recommandé de créer un llms.txt. À aucun moment je n’ai dit qu’il fallait l’éviter non plus. Je n’ai jamais poussé cette recommandation à un client pour booster sa visibilité GEO

Et pourtant, ça a suffi à déclencher des réactions enflammées chez certains. Je ne pensais pas que ce sujet était si clivant d’autant que même s’il était utilisé le llms.txt ne serait pas un top facteur de ranking.


En résumé

QuestionRéponse factuelle
llms.txt aide-t-il le ranking Google / AI Overviews / AI Mode ?Non. Google Search dit explicitement que ce n’est pas nécessaire.
Un LLM majeur déclare-t-il l’utiliser comme signal de citation ?Non, à ce jour.
Est-ce que ça sert à quelque chose ?Potentiellement à la navigation agentique (Chrome/Lighthouse), pas au SEO/GEO classique.
Faut-il en créer un ?Le coût est quasi nul. L’intérêt aussi, à ce stade. Si tu en crées un, analyse tes logs pour le vérifier toi-même.

Le vrai conseil : ne perds pas une heure de réunion à débattre de llms.txt. Mets-en un en place en cinq minutes si tu veux, surveille tes logs, et concentre ton énergie sur ce qui bouge réellement les citations IA — le contenu, la structure, l’autorité de la marque.

Le reste, c’est du bruit. Et le bruit, en GEO, c’est exactement ce qu’on est censés filtrer.

Catégories : Uncategorized

0 commentaire

Laisser un commentaire

Emplacement de l’avatar

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *