Architecture RAG de Perplexity
Perplexity effectue une recherche web à chaque requête avant de générer sa réponse. Il crawle les pages trouvées, extrait les passages pertinents, et synthétise une réponse en les citant explicitement.
Conséquence directe : une page publiée aujourd'hui peut être citée demain. Et une page mal structurée, même ancienne, ne sera jamais citée — parce que le crawler ne peut pas en extraire un passage cohérent.
Citations distinctes par prompt en moyenne sur Perplexity — le double de ChatGPT et 3× plus que Claude · Source : AI Visibility Barometer 2026
Facteurs de citation Perplexity
- Crawlabilité — PerplexityBot autorisé dans robots.txt, pas de blocage JS
- Structure — H1/H2 qui reprennent les questions cibles, réponse directe en début de section
- Fraîcheur — date de publication visible, contenu mis à jour régulièrement
- FAQ schema — passages clairement identifiables comme Q&A
- Vitesse — le crawler Perplexity a des timeouts courts
Checklist optimisation Perplexity
- ✅
User-agent: PerplexityBot / Allow: /dans robots.txt - ✅
llms.txtà la racine - ✅ H2 formulés comme des questions ("Comment X ?", "Qu'est-ce que Y ?")
- ✅ Premier paragraphe après chaque H2 = réponse directe à la question
- ✅ FAQPage JSON-LD sur les pages catégorie
- ✅ Date de publication dans le HTML (et schema Article)
- ✅ Vitesse page <2s (Core Web Vitals)