En alguna ocasión ya habiamos hablado de como evitar contenido duplicado pero en esta ocasión Jonathan Valenzuela nos explica como eliminar estos contenidos de los resultdos de google.
Como todo, sabes que el contenido duplicado o de páginas con contenido poco cualificado es uno de los focos principales de sanción del algoritmo Panda, pensado en conseguir sitios de más calidad en las páginas de resultados de Google.
Lo malo de este contenido duplicado es que no nos llega ninguna sanción manual ni ningún aviso en Search Console, simplemente nuestro sitio web no consigue posicionar todo lo bien que debería, lo que se conoce como una sanción algorítmica.
Índice de contenidos
¿Cómo puedo saber si tengo contenido duplicado?
La forma más sencilla de saber si tienes contenido duplicado es realizando en google una búsqueda con el comando site:miurl por ejemplo site:rodanet.com de esta manera todos los resultados que nos ofrecerá Google, serán urls de nuestro sitio web indexadas.
¿Qué se considera contenido duplicado?
Básicamente son todas aquellas paginas que listan un contenido que ya tiene su propia url o ha sido listado antes, una buena fuente de contenido duplicado en wordpress suelen ser las páginas de tags, páginas de archivo o author ya que listan los post que previamente ya han sido listado en la categoría, o muestran extracto de las entradas que ya han sido indexadas en los post.
Estas páginas no disponen del suficiente contenido único y son consideradas thin content, o contenido irrelevante.
También tienes que tener en cuenta el hecho de no tener páginas indexadas sin contenido o con solamente 2 o 3 líneas. Estas también pueden ser sancionadas por panda.
¿Has instalado una versión demo de tu theme? Seguramente tendrás muchísimo contenido duplicado, ya que se generan post exactamente iguales con el mismo contenido.
Eliminando el duplicado
La forma más sencilla de librarnos de este contenido duplicado es ajustando los meta robots de estas páginas, es recomendable que en páginas como las de tags o autores de wordpress se les asigne un noindex, follow.
También podemos ajustar la configuración de nuestro robots.txt para evitar que el crawler de google pierda el tiempo, incluso si queremos una optimización al 100% deberíamos evitar que estas urls aparezcan en nuestro sitemap.
Ahora bien, si las urls ya han sido indexadas la forma más rápida de eliminar es mediante un plugin que nos facilitará la vida.
Se trata de una extensión para Chrome, que nos ayudará ha subir de manera automática todas las urls a Search Console y eliminarnos de ella de una manera rápida, para ello necesitamos:
- Recopilar todas las urls en un archivo .txt , para ello podeis hacerlo de forma manual, eligiendo la url directamente de las SERPs y pegando o, la que a mi particularmente me gusta más, aunque es algo más avanzada, utilizar el footprint en scrapebox y exportar la lista de urls en .txt
- Instalar la extensión bullk url. Para ello descagamos la extensión desde la página de Github: https://github.com/noitcudni/google-webmaster-tools-bulk-url-removal
Descomprimimos el zip, y subimos la carpeta en las extensiones de chrome:
chrome://extensions/
Es importante activar el modo desarrollador, y a continuación cargar la carpeta descomprimida de la extensión.
3. Ahora podemos ir a nuestra cuenta de Search Console y podemos ver que en la sección índice de Google > Eliminación de url
Podemos ver como ahora, no tenemos que poner la url de una en una, el plugin nos ha creado un campo donde podemos subir nuestro archivo .txt con todas las urls y este las procesará de forma automática.
Ahora el trabajo está en manos de Google y verás como pasados 10 minutos, no aparecerán esas urls con contenido duplicado tan molesto en el índice de Google.
¡Ya no tienes excusa para no eliminar las urls con contenido duplicado de Google!
Tamara es redactora #seo y la boxeadora de la oficina. 🥊
Siempre escribe textos con gancho 😉