Qué es el Thin Content y como evitarlo para mejorar tu SEO

Qué es el Thin Content y como evitarlo para mejorar tu SEO
5 (100%) 2 votes

Si pensabas que habías hecho todo lo posible para mejorar el posicionamiento SEO de tu web espérate a leer el post de hoy sobre el Thin Content.

Este factor SEO es uno de los principales culpables de que muchos proyectos web no posicionen de manera correcta en las SERPs de Google.

Esto es debido al total desconocimiento de este factor SEO que, entre otras cosas, reduce el crawl budget o tiempo de rastreo que las spiders de Google pasan estudiando tu site.

Pero bueno, vayamos poco a poco desgrananado que es esto del Thin Content y cómo podemos evitar caer en sus garras.

Al lio!

¿Qué es el Thin Content?

Por Thin Content entendemos toda página o URL con contenido de escasa calidad o relevancia para el usuario. Es decir, contenido que no aporta valor alguno al usuario.

No debemos de confundir Thin Content con páginas de pocos caracteres.

Este error es muy común aunque para nada cierto ya que si ese contenido aunque escaso responde a la querry del usuario, dicha página será relevante para el usuario y por lo tanto no será Thin Content.

Este contenido de baja calidad es muy común en tiendas online (ecommerce) o blogs donde existen miles y miles de filtros o paginaciones que no aportan nada (de contenido o información) al usuario.

¿Por qué es importante el Thin Content para el SEO?

El Thin Content es un punto importantísimo a la hora de mejorar el SEO de nuestra web. Sobre todo si se trata de un portal de cierta envergadura.

Es decir, si nuestra web es un blog personal con número muy pequeño de posts el efecto negativo que produce el Thin Content apenas se notará ya que las SEO spiders de Google podrán rastrear rápidamente todo nuestro contenido.

Sin embargo, si nuestra web es una tienda online con miles de paginaciones, filtros y categorías necesitaremos optimizar ese tiempo de rastreo o crawl bugget al máximo. Esto lo conseguiremos mediante barreras a ciertos contenidos cómo veremos más adelante.

Otro punto negativo del Thin Content es el aumento de la tasa de rebote, es decir, el aumento del número de usuarios que no interactúan o hacen clic en nuestro sitio web.

Este aumento de la tasa de rebote es negativo para nuestro SEO y se produce por un contenido de escaso interés para el usuario.

Por lo tanto, una mala gestión de Thin Content en nuestro site empeorará el tiempo de rastreo y la tasa de rebote de nuestro proyecto.

Este tipo de contenido basura o de poca utilidad es sancionado por el parche Panda de Google. Este parche es el encargado de perseguir contenido duplicado o de mala calidad en internet.

De esta manera Google Panda aplica sanciones a toda web que use estas prácticas ilegales a ojos de Google.

panda keyword stuffing

Tipos de Thin Content

Existen dos tipos diferenciados de Thin Content. Uno basado en la estructura web y otro basado en el propio contenido

Contenido generado automáticamente

Dentro de este apartado nos encontraríamos todo aquel contenido que se genera de manera automática en nuestra web web en forma de páginas, entradas o productos fruto de la estructura web de nuestro proyecto.

Dentro de este apartado encontraremos:

  1. Las paginaciones típicas que existen para organizar las diferentes entradas o posts en los blogs.
  2. Categorías y subcategorías creadas para la clasificación de archivos o productos.
  3. Filtros de búsqueda (Caso típico de las tiendas online o ecommerce).
  4. Tags o etiquetas utilizadas para la clasificación.
  5. Contenido generado y duplicado por una mala plantilla de wordpress. Este tipo de Thin Content se produce por una duplicidad generada por una propia plantilla “Premium”. Normalmente este tipo de casos me los encuentro en plantillas adquiridas en sitios web como Themeforest y similares.

En definitiva, todo aquel contenido generado automáticamente por parte del site podemos catalogarlo de Thin Content siempre y cuando se dedique a clasificar contenido y no aporte información original al usuario.

Contenido duplicado o falseado

Este tipo de Thin Content engloba todo ese contenido (o texto) generado de manera automática y no propia. Es decir, se ha generado mediante prácticas ilegales o programas de Black Hat SEO.

Por Thin Content entenderemos pues:

  • La mezcla de frases integras sin ninguna coherencia entre ellas. Está practica es muy común en el Black Hat SEO para poder realizar sitios webs enteros en menos de un día. Copian contenido similar de varias web que al unirlo no tiene ningún sentido.
  • Traducir contenidos de mala manera o sin una lógica coherente mediante programas o traductores.
  • La copia íntegra de textos de otras webs.

Cómo saber si mi web tiene Thin Content

Existen varias herramientas SEO que nos facilitarán la ardua labor de localización de Thin Content en nuestra web.

Todas las siguientes herramientas os permitirán conocer este tipo de contenidos de manera gratuita gracias a su versión o Freemium:

  1. Semrush (Mediante su auditoría de proyectos).
  2. Screaming Frog (Mediante un rastreo interno de la web).
  3. Search Console
  4. Plagiarism Checker (Sí queremos conocer que textos son duplicados o robados)

Cómo evitar que el Thin Content afecte nuestro SEO

Una vez descubiertos los fallos de contenido en nuestro site es hora de poner remedio a esta problemática.

En caso de vuestra web este desarrollada con el CMS wordpress esta labor será tremendamente sencilla.

Evitar el Thin Content en WordPress con Yoast SEO

Para comenzar a “capar” contenido de baja calidad en nuestro site instalaremos el archiconocido Plugin de SEO Yoast.

Con este plugin evitaremos que Google rastree mediante sus spiders las URLs generadas de forma automática como paginaciones o filtros. Para ello haremos clic en:

Yoast SEO > Títulos y metas > Tipos de contenido

En esta Sección haremos “no index” a todos los elementos que no queramos que Google indexe en sus búsquedas, es decir, paginaciones, etc.

Posteriormente realizaremos el mismo proceso en las pestañas de Taxonomías y Otros.

Por otro lado, también desactivaremos en nuestro Sitemap todos aquellos archivos que no queremos que Google rastree. Estos archivos los localizaremos en:

Yoast SEO > Títulos y metas > Mapas del sitio XML

En las pestañas de Tipos de contenido y Taxonomías haremos “no index” a todas aquellas secciones que no queremos que Google rastree.

eliminar thin content con yoast seo

Evitar el rastreo de contenido de baja calidad con Robots.txt

Con el paso anterior puede que muchos filtros o contenidos autogenerados se nos queden en el tintero.

Por lo tanto, para eliminarlos por completo simplemente deberemos de copiar y pegar este archivo robots.txt cortesía de Dean Romero en la carpeta raíz de nuestro servidor servidor y se acabarán los problemas.

Con este archivo robots.txt lo que hacemos es indicar a Google que ni si quiera pase por estas URLs.

estas URLs ya se encuentran registradas en las SERPs, antes de nada deberemos eliminarlas manualmente desde el panel de control de Search Console en la sección: Índice de Google > Eliminar URLs.

Una vez eliminadas las URLs manualmente ya podremos subir este archivo robots.txt a vuestro servidor y acabar con el dichoso contenido de baja calidad que lastra nuestro SEO.

Evitar el rastreo de un contenido de baja calidad en concreto

Por otro lado, existe contenido que apenas aporta información relevante al usuario y que por lo tanto se le considera contenido de baja calidad.

Dentro de este apartado estarían los avisos legales, las políticas de cookies, las páginas de contacto, o las secciones autobiográficas, entre otras.

No es verdad del todo que estas páginas no aporten valor al usuario, sino que nadie buscaría una página sobre mí en Google.

Esta pregunta no sería una típica 1uerry de usuario ya que generalmente nadie buscaría “Sobre Borja Aranda Vaquero”, en todo caso buscarían “Borja Aranda Vaquero” y en ese caso la Home de mi web respondería a su querry o pregunta de manera eficaz evitando un rebote en mi web.

Para eliminar este tipo de páginas de Google mediante Yoast, realizaremos el siguiente proceso:

  1. En el panel de control de Yoast que nos aparece justo debajo del cuadro en el que escribimos texto en wordpress haremos clic en la rueda dentada (no en el semáforo) y posteriormente indicaremos “no index” dentro de la sección “Meta robots index”.
  2. Posteriormente iremos al Plugin Yoast SEO y después nos dirigiremos a Mapas del sitio XML > Entradas Excluidas. Dentro de esta sección incluiremos las ID de las páginas que no deseamos tener en nuestro sitemap.

poner no index a pagina en wordpress

Para conocer las ID de cada página o entrada en wordpress simplemente necesitaremos editar dicha entrada y cuando estemos en ello nos fijaremos en la URL que nos aparece en la aprte superior.

La ID de esta página/post será aquel número que parece seguido de “post=” en el momento que estamos editando la página o post de wordpress.

id de pagina en wordpress

Eliminar el contenido duplicado o contenido basura

Cómo hemos visto anteriormente la única manera de que Google Panda no sancione nuestra página web es eliminando todo aquel contenido considerado de baja calidad.

Por ello, no queda más remedio que testear nuestra web en busca de ese contenido de baja calidad mediante las diferentes herramientas que te he mostrado anteriormente y posteriormente eliminarlo de las SERPs de Google.

Lo “bueno” de este contenido basura es que no es “demasiado grave” dentro de una web siempre y cuando su porcentaje no supere el 50% del contenido.

La influencia del Thin Content el SEO será directamente proporcional al tamaño de vuestro site y al porcentaje de este en vuestro site.

Conclusiones sobre el Thin Content

Cómo hemos visto a lo largo de este post el Thin Content no es uno de los mayores errores capitales del SEO. Sin embargo, y como siempre digo todo suma a la hora de mejorar nuestro SEO.

Por ello, ç en caso de tener un blog personal o un site medio/pequeño siempre recomiendo que no dejemos escapar esta oportunidad de optimizar el crawl budget de nuestra web ya que Google lo agradecerá siempre.

Hasta la próxima!

Te puede interesar también: qué es un hosting

Información sobre el artículo
Qué es el Thin Content y como evitarlo para mejorar tu SEO
Nombre del artículo
Qué es el Thin Content y como evitarlo para mejorar tu SEO
Descripción
En este post te muestro que es el Thin Content y como puede afectar de manera negativa al SEO de tu página web en caso de que no lo tengas controlado. Pon remedio a este factor de SEO negativo YA!
Autor
Editor
Borja Aranda Vaquero
Imagen editor