Architecture RAG de Perplexity

Perplexity effectue une recherche web à chaque requête avant de générer sa réponse. Il crawle les pages trouvées, extrait les passages pertinents, et synthétise une réponse en les citant explicitement.

Conséquence directe : une page publiée aujourd'hui peut être citée demain. Et une page mal structurée, même ancienne, ne sera jamais citée — parce que le crawler ne peut pas en extraire un passage cohérent.

8.4

Citations distinctes par prompt en moyenne sur Perplexity — le double de ChatGPT et 3× plus que Claude · Source : AI Visibility Barometer 2026

Facteurs de citation Perplexity

  • Crawlabilité — PerplexityBot autorisé dans robots.txt, pas de blocage JS
  • Structure — H1/H2 qui reprennent les questions cibles, réponse directe en début de section
  • Fraîcheur — date de publication visible, contenu mis à jour régulièrement
  • FAQ schema — passages clairement identifiables comme Q&A
  • Vitesse — le crawler Perplexity a des timeouts courts

Checklist optimisation Perplexity

  • User-agent: PerplexityBot / Allow: / dans robots.txt
  • llms.txt à la racine
  • ✅ H2 formulés comme des questions ("Comment X ?", "Qu'est-ce que Y ?")
  • ✅ Premier paragraphe après chaque H2 = réponse directe à la question
  • ✅ FAQPage JSON-LD sur les pages catégorie
  • ✅ Date de publication dans le HTML (et schema Article)
  • ✅ Vitesse page <2s (Core Web Vitals)