# robots.txt para un blog WordPress. # Bloquear o permitir acceso a contenido adjunto. (Si la instalación está en /public_html). User-agent: * Allow: web/wp-content/uploads/ Disallow: web/cgi-bin Disallow: web/wp-content/plugins/ Disallow: web/wp-content/themes/ Disallow: web/wp-includes/ Disallow: web/wp-admin/ # Desindexar carpetas que empiecen por wp- # Permitir sitemap pero no las búsquedas. Sitemap: https://itramed.com/sitemap.xml # Permitir Feed general para Google Blogsearch. # Impedir que /permalink/feed/ sea indexado pues el feed de comentarios suele posicionarse antes de los post. # Impedir URLs terminadas en /trackback/ que sirven como Trackback URI (contenido duplicado). # Evita bloqueos de CSS y JS. # Lista de bots que deberías permitir. User-agent: Googlebot-Image Allow: /wp-content/uploads/ User-agent: Adsbot-Google Allow: web/ User-agent: Googlebot-Mobile Allow: web/ # Lista de bots que generan consultas abusivas aunque siguen las pautas del archivo robots.txt User-agent: MSIECrawler Disallow: web/ User-agent: WebCopier Disallow: web/ User-agent: HTTrack Disallow: web/ User-agent: Microsoft.URL.Control Disallow: web/ User-agent: libwww Disallow: web/ # Slurp (Yahoo!), Noxtrum y el bot de MSN que suelen generar excesivas consultas. User-agent: noxtrumbot Crawl-Delay: 50 User-agent: msnbot Crawl-Delay: 30 User-agent: Slurp Crawl-Delay: 10