Qu'est-ce que le llms.txt ?

Le llms.txt est un fichier texte placé à la racine de votre site (https://votresite.com/llms.txt) qui fournit aux crawlers des LLM une vue structurée de votre contenu.

C'est une convention proposée par le développeur Jeremy Howard et progressivement adoptée par la communauté GEO. Elle n'est pas un standard officiel, mais les grands crawlers LLM (Perplexity, ClaudeBot, GPTBot) la lisent.

Structure d'un llms.txt

# Nom du site
> Description courte du site et de son contenu.
> Publié par : Votre Entreprise

## Pages principales

- /: Description de la page d'accueil
- /votre-page: Description de cette page
- /autre-page: Description de cette autre page

## Contact

- Email: [email protected]

Bonnes pratiques

  • Description précise — chaque URL doit avoir une description qui explique ce que contient la page, pas juste son titre
  • Pages prioritaires d'abord — listez en premier les pages les plus importantes pour votre GEO (piliers, glossaire, études)
  • Mettre à jour — ajoutez les nouvelles pages au fur et à mesure de leur publication
  • Cohérence avec robots.txt — n'incluez pas des pages que vous bloquez dans robots.txt

robots.txt : autoriser les bots LLM

Avant même le llms.txt, assurez-vous que votre robots.txt autorise les crawlers des principaux LLM :

User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Googlebot
Allow: /