Qué es el Thin Content y como evitarlo no ser penalizado por Google

Si pensabas que habías hecho todo lo posible para mejorar el posicionamiento SEO de tu web espérate a leer el post de hoy sobre el Thin Content querido lector.

Este factor SEO es uno de los principales culpables de que muchos proyectos web no posicionen correctamente en las búsquedas de Google.

Esto es debido al total desconocimiento de este factor SEO que, entre otras cosas, reduce el crawl budget o tiempo de rastreo de las spiders o bots de Google.

Pero bueno, vayamos poco a poco desgrananado que es esto del Thin Content para que no caigas en sus garras.

¡Al lio!

¿Qué es el Thin Content?

Por Thin Content entendemos toda página o URL cuyo contenido es de baja calidad o relevancia para el usuario. Es decir, es un contenido que no aporta valor alguno al usuario.

No debes de confundir Thin Content con las páginas de pocas palabras.

Este error es muy común, ya que aunque un contenido sea poco extenso si responde a la querry del usuario, esta página será relevante para el usuario y por lo tanto no será Thin Content.

Es muy común encontrar este tipo de contenido en tiendas online (ecommerce) o blogs donde existen miles y miles de filtros o paginaciones que no aportan nada (de contenido o información) al usuario.

¿Por qué es importante tener en cuenta el Thin Content en SEO?

El Thin Content es un punto importantísimo a la hora de mejorar el SEO de tu página web. Sobre todo si se trata de un portal de cierta envergadura.

Es decir, si tu página web es un blog personal con número muy pequeño de posts el efecto negativo que producirá el Thin Content apenas se notará ya que los bots de Google podrán rastrear rápidamente todo el contenido sin problemas.

Sin embargo, si tu web es una tienda online con miles de paginaciones, filtros y categorías necesitará optimizar ese tiempo de rastreo o crawl bugget al máximo. Esto lo conseguirás mediante barreras a ciertos contenidos cómo te indicaré más adelante.

Otro punto negativo del thin content es el aumento de la tasa de rebote. Es decir, si los usuarios que entran en tu página web se van sin interactuar en ella el porcentaje de rebote de tu página web aumentará. El aumento de la tasa de rebote es un factor de SEO negativo ya que esta métrica indica escaso interés del usuario por el contenido.

Por lo tanto, una mala gestión de thin content en tu página web empeorará el tiempo de rastreo (crawl budget) y la tasa de rebote de tu proyecto.

Además, este tipo de contenido basura o de poca utilidad es sancionado por el panda de Google. Este parche es el encargado de perseguir contenido duplicado o de mala calidad en internet. De esta manera, Google panda aplica sanciones SEO a toda página web que tenga demasiado thin content.

¿QUIERES VER TU WEB EN LAS PRIMERAS POSICIONES DE GOOGLE?

Aprende las 15 técnicas SEO que harán de tu sitio web una web popular y deja de ser invisible para Google.

ebook conseguir visitas a tu blog

Responsable: Borja Aranda Vaquero Finalidad: Moderar los comentarios Legitimación: Tu consentimiento  Destinatarios:  Tus datos los guardará Mailchimp, mi proveedor de email marketing, que está acogido al acuerdo de seguridad EU-US Privacy.  Derechos: Tendrás derecho a acceder, rectificar, limitar y suprimir tus datos

Tipos de thin content

Existen dos tipos diferenciados de thin content. Uno basado en la estructura web y otro basado en el propio contenido.

Contenido generado automáticamente

Dentro de este apartado estaría todo aquel contenido que se genera de manera automática en tu página web en forma de páginas, entradas o productos fruto de la estructura web de tu proyecto online.

Dentro de este apartado estarán:

  1. Las paginaciones. Típicas que existen para organizar las diferentes entradas o posts en los blogs.
  2. Categorías y subcategorías. Creadas para la clasificación de archivos o productos.
  3. Filtros de búsqueda. Típico de las tiendas online o ecommerce.
  4. Tags o etiquetas. Utilizadas para clasificar contenidos.
  5. Contenido generado y duplicado por una mala plantilla de WordPress. Este tipo de thin content se produce por una duplicidad generada por una mala plantilla WordPress. Normalmente, este tipo de casos me los encuentro en plantillas adquiridas en sitios web como Themeforest o similares.

En definitiva, todo aquel contenido generado automáticamente por parte de tu página web se podrá catalogar de thin content siempre y cuando se dedique a clasificar contenido y no aporte información original al usuario.

¿ERES INVISIBLE EN INTERNET?
  • ¿NO CONSIGUES POSICIONARTE EN GOOGLE?
  • ¿TE SUENA A CHINO EL POSICIONAMIENTO WEB SEO?
  • ¿QUIERES GANAR DINERO DE VERDAD CON TU WEB?

Contenido duplicado o falseado

Este tipo de thin content engloba todo ese contenido (o texto) generado de manera automática. Es decir, se ha generado mediante prácticas ilegales o programas de Black Hat SEO.

En este tipo de thin tontent estará:

  • La mezcla de frases integras sin ninguna coherencia entre ellas. Está practica es muy común en el Black Hat SEO al realizar un mal spineo de textos.
  • Traducir contenidos de mala manera o sin una lógica coherente.
  • La copia íntegra de textos de otras webs.

¿Cómo saber si mi web tiene thin content?

Existen varias herramientas SEO que te facilitarán la tarea de localizar de thin content en tu web.

Las siguientes herramientas te permitirán conocer este tipo de contenidos de manera gratuita gracias a su versión o Freemium:

  1. Semrush (Mediante su auditoría de proyectos).
  2. Screaming Frog (Mediante un rastreo interno de la web).
  3. Search Console
  4. Plagiarism Checker (Sí queremos conocer que textos son duplicados o robados)
CONOCE LOS TÍPICOS ERRORES CAPITALES QUE LASTRAN TU SEO

Conoce cuales son los principales pecados capitales que se suelen cometer en SEO contados de una forma totalmente distinta a como los habías leído hasta ahora.

pecados capitales seo

Responsable: Borja Aranda Vaquero Finalidad: Moderar los comentarios Legitimación: Tu consentimiento  Destinatarios:  Tus datos los guardará Mailchimp, mi proveedor de email marketing, que está acogido al acuerdo de seguridad EU-US Privacy.  Derechos: Tendrás derecho a acceder, rectificar, limitar y suprimir tus datos

Cómo evitar que el thin content afecte tu SEO

Una vez hayas descubierto el contenido de baja calidad en tu página web es el momento de ponerle solución al problema.

En caso de tu web este desarrollada con el CMS WordPress esta labor será sencilla.

Evitar el Thin Content en WordPress con Yoast SEO

Para comenzar a “capar” el contenido de baja calidad en tu sitio web tendrás que instalar el archiconocido Plugin de Yoast SEO.

Con este plugin evitarás que Google rastree con sus bots las URLs generadas de forma automática como paginaciones o filtros. Para ello, harás clic en:

Yoast SEO > Títulos y metas > Tipos de contenido

En esta Sección pondrás en “no index” a todos los elementos que no quieras que Google indexe en sus búsquedas, es decir, paginaciones, etc. Posteriormente, realizarás el mismo proceso en las pestañas de Taxonomías y Otros.

Por otro lado, también tendrás que desactivar en tu sitemap todos aquellos archivos que no quieras que Google rastree. Estos archivos los localizarás en:

Yoast SEO > Títulos y metas > Mapas del sitio XML

En las pestañas de Tipos de contenido y Taxonomías pondrás en “no index” a todas aquellas secciones que no quieras que Google rastree.

eliminar thin content con yoast seo

Evitar el rastreo de contenido de baja calidad con Robots.txt

Con el paso anterior puede que muchos filtros o contenidos autogenerados se queden en el tintero.

Por lo tanto, para eliminarlos por completo simplemente deberás de pasarte por este post que escribí sobre el robots.txt y pegar el código que te proporciono en la carpeta raíz de tu servidor.

Con este archivo robots.txt lo que conseguirás es indicar a Google que ni si quiera pase por estas URLs.

estas URLs ya se encuentran registradas en las SERPs, antes de hacer nada deberías eliminarlas manualmente desde el panel de control de tu Search Console en la sección: Índice de Google > Eliminar URLs.

Una vez eliminadas las URLs manualmente ya podrás subir el archivo robots.txt a tu servidor.

Evitar el rastreo de un contenido de baja calidad en concreto

Por otro lado, existe un tipo contenido que apenas aporta información relevante al usuario y que por lo tanto se le considera contenido de baja calidad.

Dentro de este tipo de contenidos estarían los avisos legales, las políticas de cookies, las páginas de contacto, o las secciones autobiográficas, entre otras. No es verdad que estas páginas no aporten valor al usuario, sino que nadie busca en Google.

Para eliminar este tipo de páginas de Google mediante Yoast, tendrás que realizar el siguiente proceso:

  1. En el panel de control de Yoast que aparece justo debajo del cuadro en el que escribes el contenid en WordPress harás clic en la rueda dentada (no en el semáforo) y posteriormente pondrás como “no index” dentro de la sección “Meta robots index”.
  2. Posteriormente tendrás que ir al Plugin Yoast SEO y después dirigirte a la sección Mapas del sitio XML > Entradas Excluidas. Dentro de esta sección incluirás las ID de las páginas que no deseas tener en tu sitemap.

poner no index a pagina en wordpress

Para conocer las ID de una página o entrada de WordPress en concreto simplemente tendrás que ir editar dicha entrada y cuando estes editándola tendrás que fijarte en la URL que te aparece en la parte superior.

La ID de esta página/post será el número que parece seguido de la etiqueta “post=” en el momento en el que estés editando la página o post de WordPress.

id de pagina en wordpress

Eliminar el contenido duplicado o contenido basura

Cómo has visto anteriormente, la única manera de que Google Panda no sancione tu página web es eliminando todo aquel contenido considerado de baja calidad.

Por ello, no te quedará más remedio que testear tu página web en busca de ese contenido de baja calidad mediante las diferentes herramientas que te he mostrado en el post.

Lo “bueno” de este contenido basura es que no es “demasiado grave” dentro de una web siempre y cuando su porcentaje no supere un % elevado del contenido.

La influencia del thin content en el SEO de tu página web será directamente proporcional al tamaño de tu web y al porcentaje que este ocupe en ella.

Conclusiones sobre el thincontent

El thin content no es uno de los errores capitales del SEO. Sin embargo, y como siempre digo todo suma a la hora de mejorar nuestro el SEO de tu página web.

Por lo tanto, en caso de tener un blog personal o una web grande te recomiendo que no  dejes escapar esta oportunidad de optimizar el crawl budget de tu página web al máximo. Google te lo agradecerá.

¡Hasta la próxima!

¿QUIERES VER TU WEB EN LAS PRIMERAS POSICIONES DE GOOGLE?

Aprende las 15 técnicas SEO que harán de tu sitio web una web popular y deja de ser invisible para Google.

ebook conseguir visitas a tu blog

Responsable: Borja Aranda Vaquero Finalidad: Moderar los comentarios Legitimación: Tu consentimiento  Destinatarios:  Tus datos los guardará Mailchimp, mi proveedor de email marketing, que está acogido al acuerdo de seguridad EU-US Privacy.  Derechos: Tendrás derecho a acceder, rectificar, limitar y suprimir tus datos

Al realizar un comentario en este blog aceptas su Política de Privacidad
Responsable: Borja Aranda Vaquero
Finalidad: Moderar los comentarios
Legitimación: Tu consentimiento
Destinatarios: Tus datos los guardará Disqus, mi sistema de comentarios (acogido al acuerdo de seguridad EU-US Privacy)
Derechos: Tendrás derecho a acceder, rectificar, limitar y suprimir tus datos

COMPARTIR POST