Evitar contenido duplicado

Es por todos conocido que Google trabaja contínuamente mejorando su algoritmo para que los resultados entregados en la búsquedas sean de calidad. Por ello es imporante prestar atención a las URL’s de nuestra web indexadas en Google para que el contenido que ofrecemos este bajo control y no sea Google el que tenga que decidir qué URL indexar en caso de contenido duplicado.

A tener en cuenta:

  • Dos o más URL’s de una misma web que muestran el mismo contenido no tiene sentido. Ej: “http://www.microsoft.com/en/us/default.aspx” y “http://www.microsoft.com/en/us/” muestran exactamente el mismo contenido. Para evitarlo se podría hacer una redirección permante 301 de una de las URL’s a la otra.
  • Contenido que no aporte valor no debería ser indexado. Ej: “http://www.elpais.com/envios/enviar_noticia/index.html”, esta URL aparce en el índice de “google.es” con el título “[FATAL ERROR]” y además con Pagerank 4.
  • El contenido relevante de una página no debería mezclarse con el contenido no relevante (publicidad, widgets, herramientas web 2.0, animaciones flash, etc…) en el momento de ser leído por el robot de Google. El contenido no relevante debería cargarse por javascript para evitar que afecte a calidad del documento cuando este sea indexado.

Estos son algunos consejos pero como todo, depende de la situación.

Demystifying the “duplicate content penalty”

Dejar un comentario