DAMR.NET

Archivo robots.txt para Wordpress

Tener un archivo robots.txt en nuestro blog ayudará a que los crawlers o robots de los motores de búsqueda tengan una orientación exacta de qué carpetas y qué contenidos deben ser considerados a la hora de indexar, esto evita que se duplique contenido o que información no autorizada se muestre en los resultados.

Aquí les dejo uno que pueden colocar en su root, simplemente copien el contenido y usando un editor de texto plano lo pegan y lo guardan con el nombre de robots.txt o si lo prefieren pueden descargarlo aquí.


# fafamonge Robots.txt
# by FaFa [28/09/09]

User-agent: Mediapartners-Google*
Disallow:

User-agent: msnbot
Disallow:
Crawl-delay: 30

# Image Google crawler
User-agent: Googlebot-Image
Disallow:

User-agent: Slurp
Disallow:
Crawl-delay: 10

# FullSite and bad bots
User-agent: libwww
Disallow: /

User-agent: sitecheck.internetseer.com
Disallow: /

User-agent: TurnitinBot
Disallow: /

User-agent: EmailCollector
Disallow: /

User-agent: EmailWolf
Disallow: /

User-agent: Zealbot
Disallow: /

User-agent: MSIECrawler
Disallow: /

User-agent: SiteSnagger
Disallow: /

User-agent: WebStripper
Disallow: /

User-agent: WebCopier
Disallow: /

User-agent: Fetch
Disallow: /

User-agent: Offline Explorer
Disallow: /

User-agent: Teleport
Disallow: /

User-agent: TeleportPro
Disallow: /

User-agent: WebZIP
Disallow: /

User-agent: linko
Disallow: /

User-agent: HTTrack
Disallow: /

User-agent: Microsoft.URL.Control
Disallow: /

User-agent: Xenu
Disallow: /

User-agent: larbin
Disallow: /

User-agent: ZyBORG
Disallow: /

User-agent: Download Ninja
Disallow: /

User-agent: WebReaper
Disallow: /

# fafamonge bad bots
User-agent: VoilaBot
Disallow: /

User-agent: ichiro
Disallow: /

User-agent: Speedy
Disallow: /

User-agent: KeegyBot
Disallow: /

User-agent: studybot
Disallow: /

User-agent: omgilibot
Disallow: /

User-agent: Seekbot
Disallow: /

# Para todos los robots
# Zonas irrelevantes
User-agent: *
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-includes/
Disallow: /wp-admin/
Disallow: /*?*
Disallow: /*.js$
Disallow: /*.css$
Disallow: /comments/feed
Disallow: /*/feed/*
Disallow: /*/feed/rss/*
Disallow: /*/trackback/*
Disallow: /*/*/feed/*
Disallow: /*/*/feed/rss/*
Disallow: /*/*/trackback/*
Disallow: /*/*/*/feed/*
Disallow: /*/*/*/feed/rss/*
Disallow: /*/*/*/trackback/*

# Sitemaps

Sitemap: http://www.fafamonge.com/urllist.txt
Sitemap: http://www.fafamonge.com/feed
Sitemap: http://www.fafamonge.com/sitemap.xml

Si desean conocer más sobre qué son y cómo funcionan los robots o crawlers, les recomiendo estos 3 artículos:

Espero que les sea de utilidad para ayudarles a posicionar sus bitácoras.

One Response to “Archivo robots.txt para Wordpress”

  1. Doug says:

    Gracias por el tip, esta bien interesante

    [Responder]

Leave a Reply




Identifíquese con su cuenta de Twitter presionando el siguiente botón o llene el formulario siguiente:

Acerca de

DAMR.NET es un blog en el cual encuentras artículos sobre tecnología, cosas geek, fotografía, software, acontecer nacional e internacional, y muchas cosas más. Su sede central está en El Salvador, pero es expansible a toda habla hispana, siempre manteniendo nuestra hermandad.

Leer más...