La desindexación de URLs o páginas es el proceso SEO por el cual dejan de aparecer páginas web enteras o URLs concretas de un portal en las SERPs de los diferentes portales de búsqueda.
Es decir, se dice que una página o URL se ha desindexado cuando ha desaparecido de los resultados de búsqueda de los buscadores como Google.
De hecho, este proceso es uno de los principales pasos que lleva a cabo un consultor SEO freelance cuando coge un proyecto sobre dimensionado a nivel SEO.
¿Cómo saber que páginas o URLs ha desindexado Google?
Para conocer que páginas o URLs ha desindexado Google existen diferentes vías o métodos:
- Hacer uso del comando de búsqueda avanzado o footprint site:tudominio.com para conocer que URLs están indexadas y cuales noen Google.
- Estudiar el índice de Cobertura de Search Console para ver que URLs son válidas y cuales están excluidas. Esta forma es sin duda la mejor de todas a la hora de conocer si se ha desindexado contenido de tu página web o no.
¿Por qué se desindexa una página web?
Son varios los motivos por los cuales una URL o una página web entera pueden ser desindexados de Google. Algunos de ellos pueden ser:
- El contenido publicado ya se ha publicado anteriormente en otra página web. Por lo tanto, este contenido al no ser original no se indexa puesto que Google entiende que es contenido duplicado.
- El contenido es demasiado pobre, no responde a la pregunta del usuario o le falta texto, es decir, es Thin Content.
- La URL desindexada ha sido canonicalizada por Google hacia otra distinta en vez de hacia sí misma. En ciertas ocasiones, Google entiende que una URL es similar a otra y la canonicaliza de forma automática. Para saber si ha realizado este proceso de forma automática tendrás que inspeccionar la URL en cuestión con Google Search Console.
- La página no recibe tráfico ni enlaces internos suficientes y por lo tanto Google entiende que no es importante para tenerla en su índice. Prioriza el indexar otras URLs del portal más importantes.
- La URL en cuestión da algún tipo de error 400. Solucionando el error, volverá a indexar el contenido.
- La URL en cuestión da algún tipo de error en el servidor 500. Si el error de servidor persiste una URL antiguamente indexada puede pasar a ser desindexada de forma automática si Google Bot no puede acceder a ella.
- La URL en cuestión está redirigida con un 301 o 302. En este caso, desindexará la antigua URL y Google pondrá en cola de indexación la nueva URL.
- Se ha puesto la normativa noindex para dicha URL. Esta normativa indica a Google que esa URL no ha de tenerla en cuenta en sus SERPs.
- La URL se ha incluido en el sistema de eliminación de URLs en Search Console.
¿Cómo puedo desindexar contenidos de Google por mi mismo?
Si deseas desindexar ciertos contenidos de tu página web podrás llevar a cabo los siguientes procesos:
- Mandar la URL a desindexar gracias a la herramienta que el propio Google Search Console facilita para esta labor.
- Arrojar un error 410 sobre dicha URL para decir que Google ya no tenga en cuenta esa URL nunca más.
- Actualizar la directiva index a noindex para que cuando vuelva a pasar Google Bot por dicha URL la desindexe.