Générateur robots.txt

Générez votre fichier robots.txt en ligne — constructeur visuel, modèles WordPress/e-commerce/SaaS, validation, téléchargement

Constructeur visuel Modèles prêts à l'emploi Éditeur brut

Paramètres globaux

URL du sitemap

Crawl-delay global (secondes, optionnel)

Hôte canonique

🔵

WordPress

Bloque wp-admin, wp-includes, xmlrpc

All bots wp-admin bloqué

🛒

E-commerce

Bloque panier, compte, paiement, recherche

Produits indexés Checkout bloqué

📝

Blog / Média

Optimisé pour contenu éditorial

Articles indexés Tags/Archives limités

⚙️

SaaS / Application

Dashboard et espace utilisateur protégés

Landing indexée Dashboard bloqué

🚫

Bloquer tous les robots

Désindexation complète du site

Tout bloqué

✅

Tout autoriser

Accès complet à tous les robots

Accès total

Aperçu robots.txt LIVE

robots.txt : guide complet pour le SEO

Le fichier robots.txt est un fichier texte placé à la racine de votre site qui indique aux robots d'indexation (Googlebot, Bingbot, etc.) quelles pages ils sont autorisés ou non à explorer. Bien configuré, il améliore l'efficacité de votre budget de crawl et protège vos pages privées des moteurs de recherche.

⚠️ robots.txt ≠ protection de données ! Le fichier robots.txt est une convention, pas une mesure de sécurité. Les robots malveillants ignorent ces directives. Pour protéger des données sensibles, utilisez une authentification ou des règles serveur.

Directives essentielles

Directive	Rôle	Exemple
`User-agent`	Définit le robot ciblé. `*` = tous	`User-agent: Googlebot`
`Disallow`	Interdit l'accès à un chemin	`Disallow: /admin/`
`Allow`	Autorise explicitement un chemin (prioritaire sur Disallow)	`Allow: /admin/logo.png`
`Sitemap`	Déclare l'URL du sitemap XML	`Sitemap: https://exemple.com/sitemap.xml`
`Crawl-delay`	Délai en secondes entre deux requêtes	`Crawl-delay: 10`
`Host`	URL canonique du site (Yandex)	`Host: exemple.com`

Robots les plus courants

Googlebot

Google — principal

Googlebot-Image

Google Images

Bingbot

Microsoft Bing

GPTBot

ChatGPT / OpenAI

anthropic-ai

Claude / Anthropic

facebookexternalhit

Meta / Facebook

Bonnes pratiques robots.txt

Toujours déclarer votre Sitemap: dans le robots.txt pour faciliter la découverte par Google.
Utilisez des barres obliques finales sur les répertoires : Disallow: /admin/ plutôt que /admin.
Un Disallow: vide signifie "tout autoriser". Un Disallow: / signifie "tout bloquer".
Bloquez les pages générées par paramètres de session (?session=) pour économiser le budget de crawl.
Vérifiez votre robots.txt avec Google Search Console → Exploration → Testeur robots.txt.

Questions fréquentes

Le fichier robots.txt doit être placé exactement à la racine de votre domaine : https://votresite.com/robots.txt. Il ne peut pas être dans un sous-répertoire. G... + Lire plus

Disallow empêche le robot d'explorer la page, mais Google peut quand même l'indexer s'il la trouve via un lien. La balise meta noindex indique à Google de ne pa... + Lire plus

Pour bloquer les robots qui collectent des données pour l'entraînement d'IA, ajoutez des blocs spécifiques : User-agent: GPTBot / Disallow: / pour ChatGPT, et U... + Lire plus

Pour tous les robots respectueux des standards (Googlebot, Bingbot…), oui. Mais les robots malveillants, scrapers et certains outils ignorent délibérément le ro... + Lire plus

Mettez à jour votre robots.txt à chaque fois que votre structure de site change : ajout d'une section privée, migration, nouvelle technologie. Pensez aussi à vé... + Lire plus

Outils de la même catégorie

Générateur Sitemap XML Générateur Meta SEO UTM Builder Analyseur de densité de mots-clés Audit SEO rapide Simulateur budget Google Ads Générateur Schema JSON-LD Analyseur Title & Meta Description

Outils populaires

Générateur Alt Text IA OCR Extracteur de Texte Générateur Hashtags Intelligent Vérificateur d'adresse IP Convertisseur de Devises 2026

Outils tendance

Convertisseur de tension Visualiser code HTML en ligne Calculateur Impôts 2026 Calculateur Amazon FBA

Générateur robots.txt

robots.txt : guide complet pour le SEO

Directives essentielles

Robots les plus courants

Bonnes pratiques robots.txt

Questions fréquentes

Où placer le fichier robots.txt ?

Quelle est la différence entre Disallow et noindex ?

Comment bloquer les robots d'IA (ChatGPT, Claude) ?

Un Disallow: / bloque-t-il vraiment tous les robots ?

À quelle fréquence mettre à jour son robots.txt ?