¿Qué es el Rastreo o Crawling?

qué es el rastreo o crawling de una pagina web

El término rastreo en SEO se utiliza para el señalar el proceso por el cual los bots de los diferentes buscadores de internet van abriendo y descubriendo nuevas URLs en internet.

El rastreo de páginas web es el paso previo que se realiza en una página web antes de parecer en un buscador.

Es decir, para que una URL aparezca en Google, GoogleBot ha de pasar por ella para descubrirla y posteriormente si lo cree conveniente indexarla.

Por este motivo, el proceso de rastreo en SEO es tan importante. Si una URL no es rastreable (no contiene enlaces externo/internos) no será visible para los buscadores y no aparecerá en internet.

Por lo tanto, es muy útil optimizar el rastreo. De ahí, la importancia del crawl budget o presupuesto de rastreo en toda estrategia de posicionamiento web SEO.

¿Por qué es tan importante el rastreo en SEO?

El proceso SEO para que una URL aparezca en Google se podría englobar del siguiente modo:

  1. Rastreo.
  2. Indexación.
  3. Posicionamiento o rankeo de keywords.

Es decir, el rastreo, es el principio de la cadena y por ello se ha de cuidar al máximo posible para que finalmente se alcance al final del proceso con el rankeo de keywords.

Por ello, a la hora de hacer accesible el rastreo de Google Bot por una página web es importante que el portal web tenga:

  1. Enlaces internos con código 200.
  2. Enlaces externos de calidad.
  3. Evitar los errores 500.
  4. Ningún código de error 400 o 300.
  5. Eliminar los enlaces ofuscados salvo que sean imprescindibles por motivos de link juice.
  6. Evitar a toda costa el Javascript puesto que los buscadores de internet tienen dificultad para leerlo.
  7. Hacer semánticamente comprensible el DOM de la página web.
  8. Tener una buena arquitectura web.