El contenido duplicado es uno de los factores que más negativamente puede influir en el posicionamiento en Google. Descubre cómo evitarlo siguiendo unos sencillos pasos.
En uno de nuestros últimos posts hablábamos sobre los factores que potencialmente podían colocarnos en el punto de mira de Panda 4.0. Y como no podía ser de otro modo, el contenido duplicado era uno de ellos, por eso publicamos esta pequeña guia.
Algunos todavía piensan que el contenido duplicado se limita a una cuestión de plagio, violación de derechos de autor, etc. Pero no. ¡Es mucho más complejo que eso! Como consultor SEO me he encontrado con webs hechas con WordPress, por poner un ejemplo emblemático, con un dominio bién trabajado, un theme flamante de pago, un blog incrustado en la web, contenido de calidad, perfiles sociales, y una velocidad de carga superior a la de un F18. Por no hablar de las tiendas online con miles de horas de trabajo invertidas y que, a pesar de ello, apenas nadie conoce. “¿Por qué no conseguimos posicionarnos en Google?”, suelen preguntarme sus propietarios, con cierta angustia. Y resulta que, con un rápido análisis, salta a la vista que la web en cuestión rezuma contenidos duplicados a borbotones. “¿Todo el trabajo tirado a la basura?” ¡No! Tiene solución. Me encanta dar buenas noticias 🙂
A lo largo de este post veremos en qué situaciones puede aparecer contenido duplicado y cómo podemos evitarlo en cada ocasión. ¡Vamos allá!
Índice de contenidos
¿Qué es el contenido duplicado?
Es, simplemente, texto que aparece repetido en más de una página, ya sea dentro de tu propio dominio, o en varios distintos. En otras palabras, si alguien plagia contenidos de tu página web, tienes un problema de contenido duplicado; pero si dispones de textos a los cuales se puede acceder desde distintas URL en tu propia website, ¡también! La cuestión fundamental aquí es que duplicar contenidos sin darse cuenta uno es muy fácil. En el ejemplo anterior me he referido a webs hechas con WordPress, un CMS que cautiva a muchos emprendedores porque parece dárnoslo todo hecho. ¡Pero cuidado! Un WordPress en manos inexpertas puede acabar saboteando un proyecto. Precisamente, porque duplica contenidos con mucha facilidad. ¿Por qué Google lo persigue? Podríamos extendernos mucho, pero básicamente son dos razones:
- Si para una misma búsqueda aparecen contenidos repetidos, empeora la experiencia de usuario.
- Ante contenidos duplicados, Google no sabe cuál debe indexar.
En realidad, (2) es consecuencia de (1). Dado que para ofrecer una buena experiencia de usuario, es preferible evitar los contenidos duplicados en las búsquedas, Google aplica filtros para seleccionar una de las versiones del texto repetido. Y puesto que su sistema de rastreo de páginas no es perfecto, se producen errores de indexación. Cómo puede afectarme la duplicidad de contenidos Pues negativamente. Eso es obvio 🙂 Veámoslo más al detalle:
- Pérdida del control sobre tus páginas indexadas: Google decide qué versión de los contenidos duplicados debe indexar, y es muy probable que elija la opción que menos te interesa. Además, si el robot destina demasiados recursos a “leer” tus páginas con contenidos repetidos, puede ignorar otras páginas que sí te interesa que rastree.
- Peor posicionamiento en buscadores: Si Google elije, puede que muestre la página menos amigable a los buscadores, y por tanto, tendrás que conformarte en una posición inferior en los SERP’s.
- Dispersión de la autoridad: si dispones de dos versiones de tu web o de algunas de sus páginas, estás dividiendo el Link Juice de los enlaces naturales que puedas conseguir. Si conoces conceptos como Page Rank, Domain Authority y Page Authority, y conoces su funcionamiento, no te estoy revelando ningún secreto. Esto se traduce en un peor posicionamiento SEO.
- Penalización por plagio: a menudo se produce una situación surrealista; alguien te plagia contenidos, y Google “decide” que su versión es la original, y la tuya, una mera copia. Te puede caer una penalización, y ese contenido podría ser relegado a la cola de las búsquedas. ¡Increíble!, pero cierto.
¿Cómo se produce el contenido duplicado y qué podemos hacer para evitarlo?
¡Buena pregunta! Llegó la hora de la verdad. Veamos las principales razones por las que se duplican contenidos. Toma nota, o añade este post a “marcadores” en tu explorador, porque esto te interesa 😉 Dominio en dos versiones, con y sin www Tu website puede aparecer con www en el domino, o sin www. Si se puede acceder de ambas formas, ¡tienes tu sitio por duplicado! Y ya sabes lo que esto implica… Para solucionar el problema tienes dos posibilidades: 1. Darte de alta gratuitamente en Google Webmaster Tools (si no lo has hecho ya), e indicar el sitio de preferencia. 2.También puedes realizar un redireccionamiento desde el servidor, pero esta opción es «más compleja». Páginas de categorías o etiquetas Desatender esta cuestión es un error muy extendido. Los CMS suelen producir páginas específicas para cada categoría o etiqueta, que duplican los contenidos de las páginas a las que pertenecen. Parámetros en la URL Los parámetros son símbolos que se añaden al final de la URL (variables), pero que no cambian el contenido de la página, duplicando los contenidos. Pueden deberse a varias causas:
-
Contenidos dinámicos
Esto suele suceder con las tiendas online, otra fuente potencialmente inagotable de contenido duplicado, debido a la gran cantidad de filtros que se aplican para localizar los productos. A menudo, el CMS añade parámetros dinámicos. Imagina que tienes una tienda online de muebles de jardín, y dispones de una mesa en varios colores. Con una descripción casi idéntica, podrías encontrarte con varias URL de este tipo: http://ejemplo.com/mesas?color=blanco http://ejemplo.com/mesas?color=verde http://ejemplo.com/mesas?color=azul Todo esto es contenido duplicado.
-
Sesión de usuario
Cuando los usuarios incluyen su ID de sesión, podría aparecer la duplicidad de páginas con el mismo contenido, donde lo único que cambia es el identificador de sesión, que aparece como un parámetro al final de la URL (sessionid=1357, por ejemplo). Los problemas de contenidos duplicados debido a los parámetros se pueden solucionar de dos formas:
- Con la etiqueta rel=canonical. Aunque mucha gente se confunde con esta etiqueta, introducirla es muy fácil. Basta con incrustar esta línea de código:
<link rel=”canonical” href=”http://ejemplo.com/urlcanonica.html”/> Recuerda que la etiqueta canónical siempre debes introducirla en la web que no quieres usar como “canónica”, ¡y no olvides introducirla entre las etiquetas <head> y </head>!
- Entra en Google Webmaster Tools, y en la sección “Parámetros de URL”, podrás indicar qué parámetros debe obviar el buscador.
Versiones web para móviles A menudo, las páginas web para móviles son una réplica exacta de la versión para equipos de escritorio. Para evitar el contenido duplicado podemos hacer varias cosas:
- Crear una web específica, con contenidos distintos adaptados a los dispositivos móviles.
- Utilizar un diseño responsive, que adapte la forma en la que se visualiza tu web dependiendo de las características del dispositivo desde el que acceden los usuarios.
- Los dos puntos anteriores deberían ponerse en práctica antes de que surja el problema de contenido duplicado. Si esto no es posible, se puede solucionar con la etiqueta rel=canonical para indicar que la versión para escritorio es la buena.
Paginación Con el paginado sucede lo mismo. A menudo, incluso la información de las etiquetas meta no varía, a excepción de los parámetros que marcan el número de página, al final de la URL. Para solucionar este problema dispones de las etiquetas rel=next y rel=prev, que indican a los motores de búsqueda, que todas las páginas, así como el contenido de las etiquetas title, description, etc., pertenecen a la página principal de la serie. Si no sabes cómo introducir esta etiqueta, el Blog para Webmasters de Google puede servirte de guía. Protocolo HTTPS La navegación segura por una página web, mediante SSL puede ser una fuente de contenido duplicado. Como sabes, la URL es la misma, salvo por una –s que aparecerá al final de http. Su contenido también es, obviamente, el mismo. Para solventar el problema, la etiqueta rel=canonical puede ser de gran ayuda de nuevo. Migración de contenidos Cuando los contenidos de una página web se migran para conseguir URLs más amigables, o para moverlos de un sitio a otro, durante algún tiempo, la versión antigua puede convivir con la nueva. ¿La solución?, redireccionamientos 301. Se añaden al final del documento .htaccess. Solo tienes que ir añadiendo el siguiente código por cada página o directorio que quieres redirigir: Redirect 301 /pagina-antigua http://ejemplo.com/pagina-nueva ¡Es muy fácil! Eso sí; no olvides primero guardar una copia de .htaccess en el portapapeles. Cualquier cambio podría hacer verdaderos estragos en tu página.
Duplicidad de contenidos por plagio
Es cierto que, desde que Google inició su particular batalla contra el contenido duplicado, el plagio se ha visto drásticamente reducido. Si plagias, tarde o temprano sufrirás las consecuencias, y lo notarás, perdiendo posiciones en los resultados de búsqueda. No obstante, todavía hay por ahí algún que otro despistado. Existen varios tipos de plagio:
Plagio por la cara
Como decíamos al principio, cuando Google se encuentra con el mismo contenido en dos lugares distintos, debe decidir cuál es la fuente original. En el proceso de discernir entre el original y la copia, a menudo el bot de Google mete la pata. Puede suceder, entonces, algo tan surrealista como que la web donde te han plagiado sea considerada como la emisora del contenido original, y la tuya, como el lugar donde se ha copiado por la cara el contenido creado por otro. ¡Menuda jugarreta!, ¿no? Si se diera el caso, tienes dos opciones:
- Pedir amablemente a quien te ha plagiado, que retire la copia. Si se niega, puedes negociar con él, y sugerirle que al menos introduzca un enlace hacia la página donde publicaste el contenido, para que Google distinga la copia del original. Pero esta solución no siempre es efectiva.
- Enviar una solicitud formal a Google para que elimine la página plagiada de los resultados de búsqueda, en virtud de los derechos de Copyright.
Lo más recomendable es que intentes solucionar el conflicto por la vía pacífica primero, y si no, ¡notifícalo!
Scraping
El Scraping consiste en copiar una web tal cual, con herramientas de software creadas específicamente para ello. Todos tus contenidos podrían acabar publicados en otro dominio. Google Panda se ha propuesto acabar con el Scraping. Pero esto sigue haciéndose, y es importante detectarlo rápidamente. En caso de que alguien haga Scraping con tus contenidos, informar a Google podría, de nuevo ser la solución.
Plagio involuntario
Hay formas muy tontas de publicar contenidos repetidos, en la que suelen incurrir muchos webmasters y blogueros. Tienes un blog, y decides confiar las publicaciones a uno o varios redactores, y te cuelan contenido plagiado. O eres un bloguero que empieza a ser influyente en determinado nicho, y te proponen publicar un post patrocinado, un publirreportaje o una nota de prensa. Accedes gustosamente, y te sacas unos eurillos o unos dólares. Pero al tiempo descubres que varios bloggers publicaron exactamente el mismo post patrocinado. En todos estos casos, no has cometido plagio, pero en tu sitio hay contenido copiado o repetido. Herramientas para detectar contenidos como Copyscape puede sacarte de un apuro.
Recomendaciones
Para el contenido duplicado en otros sitios, utilizan Google Webmaster Tools. Te ayudará a detectar problemas y te proporcionará diversos medios para solucionarlos. Personaliza las etiquetas meta (title y description) para cada una de las páginas de tu dominio. Si haces una cita de otro sitio web, introduce siempre un enlace. ¡Y sé original! A parte de las sanciones de los buscadores, crear contenidos genuinos te ayudará a diferenciarte de los demás, construir tu imagen de marca y posicionarte como experto en tu sector. Si te ha parecido útil este post, por favor, compártelo en las redes sociales 🙂 . Y si tienes algo que añadir, ¡utiliza los comentarios!
Tamara es redactora #seo y la boxeadora de la oficina. 🥊
Siempre escribe textos con gancho 😉
8 Comentarios. Dejar nuevo
Gracias, me has resuelto muchas dudas
Gracias gracias…
Gracias a ti por pasarte espero que estés preparado/a para combatir el contenido duplicado 🙂
A mi me a quedado una duda, tengo una marca de producto y estoy utilizando un blog con dominio propio. Exactamente 2 blogs, uno en catalan y otro en castellano, con el nombre de dominio en catalan y castellano tambien, como si fueran 2 webs distintas. En catalan ya salgo en primer lugar con las palabras clave, y en castellano empeze a subir, poco a poco, hasta que de repente desapareció y no sale en los resultados de google (con palabras clave). Esto puede ser que lo considere como un plagio? he cambiado dominios, fotos, textos, formatos… de todo, pero aun no sale en google.
como puedo saber si estoy en lo cierto? o que creeis que ha podido pasar?
Hola Pere,
He visto tus dos dominios tanto en catalán como en castellano y parece que están en top 10 las keys de los dos dominios. A veces en google hay «danceos», te mueve para atrás y luego vuelves. Pero puede haber miles de motivos se tendría que analizar el caso y saber las acciones que se han llevado a cabo.
Un saludo!
http://ejemplo.com/mesas?color=blanco http://ejemplo.com/mesas?color=verde http://ejemplo.com/mesas?color=azul
Todo esto es contenido duplicado.—————-
Que tal, gracias por la información, pero si un documento php recibe parámetros y reacciona dependiendo del mismo, en este caso el color de la mesa entonces yo no veo que eso sea contenido duplicado, en todo caso es un artículo diferente cada mesa, duplicado sería
http://ejemplo.com/mesas?color=verde
yhttp://ejemplo.com/mesas?color=VERDE
, ahí google por ejemplo determina que se trata de dos productos diferentes cuando no es así.Hola Manuel ¡¡¡Muchas gracias por pasarte!!! Y gracias por tu comentario, tienes razón a medias, quizás en vez de decir todo esto es contenido duplicado podría haber dicho que en la mayoría de los casos se convierte en contenido duplicado. El problema más generalizado en estos casos es que si tu quieres posicionar la categoría mesas y metes una descripción de unas 800/1000 palabras en muchas ocasiones (depende de muchas cosas cms, programación de la web… pero hablo a nivel general) estas variables ponen el mismo texto o contenido de descripción de la categoría en todas las tipologias de mesas (verde, amarillo, rosa, rojo pasión… xD), ahí es cuando hay el problema, gran número de páginas con un porcentaje de copia bastante elevado.
Cualquier comentario por aquí estamos,
hasta pronto!!!
Hola a todos!
Un artículo muy interesante, que aclaró muchas dudas, pero me queda una en especial. Vamos a ello:
Todos recomiendan de una forma u otra publicar nuestros artículos en las redes sociales como Facebook y Google Plus por ejemplo.
Mi pregunta es: No se considera contenido duplicado si yo publico un artículo de 700 palabras en mi sitio web/blog y después lo coloco en estas redes sociales, ya sea a mano o a través de algún plugin? Y al cabo del tiempo, aparece el mismo contenido en cada uno de estos sitios. Esto no es un problema?
Gracias, y espero haberme hecho entender
saludos a todos!
Hola Ernest!!
Gracias por pasarte por nuestro humilde blog!!!
El tema es que no se tienen que publicar los artículos completos en las redes sociales, sino que se comparte un enlace que lleva al contenido, y se escribe una descripción breve de lo que va el contenido, de este modo no es contenido duplicado 🙂
Si haces lo que dices yo si que lo consideraría contenido duplicado, pero nosotros nunca lo hemos hecho, y con la autoridad que tienen las redes sociales… que no te extrañe que se posicionen antes que tu web, o incluso que interprete que tu web es la que copia, quien sabe… como te digo nunca lo hemos probado pero yo creo que los tiros van por ahí… 🙂
Espero que te haya sido de ayuda!!!