THIN CONTENT

Qué es el Thin Content y como evitarlo no ser penalizado por Google

thin content seo

Si pensabas que habías hecho todo lo posible para mejorar el posicionamiento SEO de tu página web prepárate a leer el post de hoy sobre el Thin Content querido lector.

Este factor SEO es uno de los principales culpables de que muchos proyectos web no posicionen correctamente en las SERPs de Google.

Esto es debido al total desconocimiento de este factor SEO que, entre otras cosas, reduce el crawl budget o tiempo de rastreo de las spiders o bots de Google.

Pero bueno, vamos poco a poco desgrananado que es esto del Thin Content para que no caigas en sus garras.

¡Al lío!

¿Qué es el Thin Content?

Por Thin Content se entiende toda página o URL cuyo contenido es de baja calidad o relevancia para el usuario. Es decir, es un contenido que no aporta valor alguno al usuario.

OJO. No confundir Thin Content con URLs de pocas palabras.

Este error es muy común, ya que aunque un contenido sea poco extenso si responde a la query o pregunta del usuario, esta página será relevante para el usuario y por lo tanto no será Thin Content.

Es muy común encontrar este tipo de contenido en tiendas online (E-commerce) o blogs donde existen miles y miles de filtros o paginaciones que no aportan nada (De contenido o información) al usuario.

¿Por qué es importante tener en cuenta el Thin Content en SEO?

El Thin Content es un punto importantísimo a la hora de mejorar el SEO de tu página web. Sobre todo si se trata de un portal de cierta envergadura.

  • Si tu página web es un blog personal con número muy pequeño de URLs el efecto negativo que producirá el Thin Content apenas se notará ya que los bots de Google podrán rastrear rápidamente todo el contenido sin problemas.
  • Si tu página web es una tienda online con miles de paginaciones, filtros y categorías necesitarás optimizar ese tiempo de rastreo o crawl bugget al máximo. Esto lo conseguirás mediante barreras a ciertos contenidos cómo te indicaré más adelante.

Otro punto negativo del Thin Content será el aumento de la tasa de rebote.

Es decir, si los usuarios que entran en tu página web se van sin interactuar en ella el porcentaje de rebote de tu página web aumentará. El aumento de la tasa de rebote será un factor de SEO negativo ya que esta métrica indicará un escaso interés por parte del usuario.

Por lo tanto, una mala gestión de Thin Content en tu página web empeorará el tiempo de rastreo (Crawl budget) y la tasa de rebote de tu proyecto.

Además, este tipo de contenido basura o de poca utilidad es sancionado por el algoritmo Google Panda. Este parche es el encargado de perseguir contenido duplicado o de mala calidad en internet.

De esta manera, Google panda aplica sanciones SEO a toda página web que tenga demasiado Thin Content.

Tipos de Thin Content

Existen dos tipos diferenciados de Thin Content. Uno basado en la estructura web y otro basado en el propio contenido.

Contenido generado automáticamente

Dentro de este apartado estaría todo aquel contenido que se genera de manera automática en tu página web en forma de páginas, entradas o productos fruto de la estructura web de tu proyecto online.

Dentro de este apartado estarán:

  1. Las paginaciones. Típicas URLs que existen para organizar las diferentes entradas o posts en los blogs.
  2. Categorías y subcategorías. Creadas para la clasificación de archivos o productos.
  3. Filtros de búsqueda. Típico de las tiendas online o ecommerce.
  4. Tags o etiquetas. Utilizadas para la clasificación de contenidos.
  5. Contenido generado y duplicado por una mala plantilla de WordPress. Este tipo de Thin Content se produce por una duplicidad generada por una mala plantilla WordPress. Normalmente, este tipo de casos me los encuentro en plantillas adquiridas en sitios web como Themeforest o similares.

En definitiva, todo aquel contenido generado automáticamente por parte de la página web se podrá catalogar de Thin Content siempre y cuando se dedique a clasificar contenido y no aporte información original al usuario.

Contenido duplicado o falseado

Este tipo de Thin Content es generado de forma automática. Es decir, se ha generado mediante prácticas ilegales o programas de Black Hat SEO.

En este tipo de Thin Content estará:

  • La mezcla de frases sin ninguna coherencia entre ellas. Está practica es muy común en el Black Hat SEO al realizar un mal spineo de textos.
  • Traducir contenidos de mala manera o sin una lógica coherente.
  • La copia íntegra de textos de otras páginas web.

¿Cómo saber si mi página web tiene Thin Content?

Existen varias herramientas SEO en el mercado que te facilitarán la tarea de localizar Thin Content en tu página web. Sin embargo, mi favorita es Safecont.

De todos modos, si no deseas contratar Safecont podrás utilizar otras herramientas SEO menos válidas para esta labor como:

  1. Semrush. Mediante su auditoría de proyectos.
  2. Screaming Frog. Mediante un rastreo interno de la página web.
  3. Search Console. Observando URLs no indexadas.

Cómo evitar que el Thin Content afecte tu SEO

Una vez hayas descubierto el contenido de baja calidad en tu página web será el momento de ponerle solución al problema. En el caso de tu página web este desarrollada con el CMS WordPress esta labor será sencilla.

Evitar el Thin Content en WordPress con Yoast SEO

Para comenzar a “capar” el contenido de baja calidad en tu sitio web tendrás que instalar el archiconocido Plugin de Yoast SEO.

Con este plugin evitarás que Google rastree con sus bots las URLs generadas de forma automática como paginaciones o filtros. Para ello, haz click en:

Yoast SEO > Títulos y metas > Tipos de contenido

En esta Sección pondrás en “no index” a todos los elementos que no quieras que Google indexe en sus búsquedas, es decir, paginaciones, etc. Posteriormente, realizarás el mismo proceso en las pestañas de Taxonomías y Otros.

Por otro lado, también tendrás que desactivar en tu Sitemap todos aquellos archivos que no quieras que Google rastree. Estos archivos los localizarás en:

Yoast SEO > Títulos y metas > Mapas del sitio XML

En las pestañas de Tipos de contenido y Taxonomías pondrás en “noindex” a todas aquellas secciones que no quieras que Google rastree.

eliminar thin content con yoast seo

Evitar el rastreo de contenido de baja calidad con Robots.txt

Con el paso anterior puede que muchos filtros o contenidos autogenerados se queden en el tintero.

Por lo tanto, para eliminarlos por completo simplemente deberás de pasarte por este post que escribí sobre el robots.txt y pegar el código que te proporciono en la carpeta raíz de tu servidor.

Con este archivo robots.txt lo que provocarás será que Google ni si quiera pase por estas URLs.

estas URLs ya se encuentran registradas en las SERPs, antes de hacer nada deberás eliminarlas manualmente desde el panel de control de tu Search Console en la sección: Índice de Google > Eliminar URLs.

Una vez eliminadas las URLs manualmente ya podrás subir el archivo robots.txt a tu servidor.

Evitar el rastreo de un contenido de baja calidad en concreto

Por otro lado, existe un tipo contenido que apenas aporta información relevante al usuario y que por lo tanto se le considera contenido de baja calidad.

Dentro de este tipo de contenidos estarían los avisos legales, las políticas de cookies, las páginas de contacto, o las secciones autobiográficas, entre otras. No es verdad que estas páginas no aporten valor al usuario, sino que nadie busca este contenido en Google.

Para eliminar este tipo de páginas de Google mediante Yoast, tendrás que realizar el siguiente proceso:

En el panel de control de Yoast que aparece justo debajo del cuadro en el que escribes el contenido en WordPress deberás click en la rueda dentada (No en el semáforo) y posteriormente pondrás como “noindex” dentro de la sección “Meta robots index” la URL.

poner no index a pagina en wordpress

Eliminar el contenido duplicado o contenido basura

Cómo has visto anteriormente, la única manera de que Google Panda no sancione tu página web será eliminando todo aquel contenido considerado de baja calidad.

Por ello, no te quedará más remedio que testear tu página web en busca de ese contenido de baja calidad mediante las diferentes herramientas que te he mostrado en el post.

Lo “bueno” de este contenido basura es que no es “demasiado grave” dentro de una página web siempre y cuando su porcentaje no supere un % elevado del contenido.

La influencia del Thin Content en el SEO de tu página web será directamente proporcional al tamaño del portal en sí y al porcentaje que este ocupe en ella.

Conclusiones sobre el thincontent

El Thin Content no es uno de los errores capitales del SEO. Sin embargo, y como siempre digo todo suma a la hora de mejorar el SEO On Page de una página web.

Por lo tanto, en caso de tener un blog personal o una página web grande te recomiendo que no  dejes escapar esta oportunidad de optimizar el crawl budget de tu página web al máximo. Google te lo agradecerá en sus rankings.

¡Hasta la próxima!

borja aranda vaquero consultor seo

Artículo escrito por:

Borja Aranda Vaquero

Propietario de este bonito blog sobre SEO, WordPress y diseño web. Mi intención es ayudar a empresas y emprendedores a conseguir las primeras posiciones en Google con el fin de que generen nuevos ingresos y clientes a través de internet.

Al realizar un comentario en este blog aceptas su Política de Privacidad
Responsable: Borja Aranda Vaquero
Finalidad: Moderar los comentarios
Legitimación: Tu consentimiento
Destinatarios: Tus datos los guardará Disqus, mi sistema de comentarios (acogido al acuerdo de seguridad EU-US Privacy)
Derechos: Tendrás derecho a acceder, rectificar, limitar y suprimir tus datos
COMPARTIR POST
suscribirse al blog

¿TE GUSTA EL CONTENIDO?

¡Súscríbete y no te pierdas ni uno más!

+ 2 Ebooks SEO DE REGALO