Archivo robots.txt para Wordpress
Tener un archivo robots.txt en nuestro blog ayudará a que los crawlers o robots de los motores de búsqueda tengan una orientación exacta de qué carpetas y qué contenidos deben ser considerados a la hora de indexar, esto evita que se duplique contenido o que información no autorizada se muestre en los resultados.

Aquí les dejo uno que pueden colocar en su root, simplemente copien el contenido y usando un editor de texto plano lo pegan y lo guardan con el nombre de robots.txt o si lo prefieren pueden descargarlo aquí.
# fafamonge Robots.txt
# by FaFa [28/09/09]User-agent: Mediapartners-Google*
Disallow:User-agent: msnbot
Disallow:
Crawl-delay: 30# Image Google crawler
User-agent: Googlebot-Image
Disallow:User-agent: Slurp
Disallow:
Crawl-delay: 10# FullSite and bad bots
User-agent: libwww
Disallow: /User-agent: sitecheck.internetseer.com
Disallow: /User-agent: TurnitinBot
Disallow: /User-agent: EmailCollector
Disallow: /User-agent: EmailWolf
Disallow: /User-agent: Zealbot
Disallow: /User-agent: MSIECrawler
Disallow: /User-agent: SiteSnagger
Disallow: /User-agent: WebStripper
Disallow: /User-agent: WebCopier
Disallow: /User-agent: Fetch
Disallow: /User-agent: Offline Explorer
Disallow: /User-agent: Teleport
Disallow: /User-agent: TeleportPro
Disallow: /User-agent: WebZIP
Disallow: /User-agent: linko
Disallow: /User-agent: HTTrack
Disallow: /User-agent: Microsoft.URL.Control
Disallow: /User-agent: Xenu
Disallow: /User-agent: larbin
Disallow: /User-agent: ZyBORG
Disallow: /User-agent: Download Ninja
Disallow: /User-agent: WebReaper
Disallow: /# fafamonge bad bots
User-agent: VoilaBot
Disallow: /User-agent: ichiro
Disallow: /User-agent: Speedy
Disallow: /User-agent: KeegyBot
Disallow: /User-agent: studybot
Disallow: /User-agent: omgilibot
Disallow: /User-agent: Seekbot
Disallow: /# Para todos los robots
# Zonas irrelevantes
User-agent: *
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-includes/
Disallow: /wp-admin/
Disallow: /*?*
Disallow: /*.js$
Disallow: /*.css$
Disallow: /comments/feed
Disallow: /*/feed/*
Disallow: /*/feed/rss/*
Disallow: /*/trackback/*
Disallow: /*/*/feed/*
Disallow: /*/*/feed/rss/*
Disallow: /*/*/trackback/*
Disallow: /*/*/*/feed/*
Disallow: /*/*/*/feed/rss/*
Disallow: /*/*/*/trackback/*# Sitemaps
Sitemap: http://www.fafamonge.com/urllist.txt
Sitemap: http://www.fafamonge.com/feed
Sitemap: http://www.fafamonge.com/sitemap.xml
Si desean conocer más sobre qué son y cómo funcionan los robots o crawlers, les recomiendo estos 3 artículos:
Espero que les sea de utilidad para ayudarles a posicionar sus bitácoras.
Gracias por el tip, esta bien interesante
[Responder]