Similaridad de contenidos o contenido duplicado en SEO

¿Qué es el contenido duplicado, cómo detectarlo y arreglarlo?

¡Hola y hola querido lector! Ya estoy de nuevo por aquí y, en esta ocasión, te hablaré sobre el contenido duplicado y el SEO.

Si, como lo oyes, hoy te hablaré de este factor SEO especialmente relevante para Google que descontrolado podrá ocasionarte una bonita penalización SEO.

De hecho, por desgracia esta técnica del contenido duplicado será utilizada por otros webmasters para realizar ataques de SEO Negativo a otras páginas web.

Por lo tanto, si no quieres ser víctima de una penalización SEO por contenido duplicado sigue leyendo este post que seguro que te ayudará.

¡Vamos al lio!

¿Qué es el contenido duplicado?

El contenido duplicado en SEO será un porcentaje que indicará el grado de similaridad entre una URL (Interna o externa) y otra.

Es decir, que si dos URLs en internet cuentan con un mismo contenido su porcentaje de duplicidad de contenidos será alta.

Tipos de contenido duplicado en SEO

Bien, una vez explicado que esto del contenido duplicado será el momento de conocer los tipos de contenido duplicado que te podrás encontrar en internet.

Estos podrán ser de dos tipos:

  • Contenido duplicado externo. Este contenido será aquel que te podrás encontrar en otras páginas web ajenas a la tuya y que será exactamente igual al tuyo. De hecho, esta técnica de copia de contenidos es frecuente entre los amantes del SEO Negativo y del Black Hat SEO.
  • Contenido duplicado interno. Este contenido será aquel que se repetirá a lo largo de toda tu página web. Es decir que si en todas las URLs de tu página web se repitiese una frase tipo «Este portal ofrece información sobre plantas». Esta frase estará creando contenido duplicado en toda tu página web.

De todos modos, como te he comentado anteriormente no te alarmes con el último ejemplo.

Te en cuenta que el contenido duplicado en SEO se medirá en porcentaje.

Es decir, si siguiésemos el ejemplo anterior (Una única frase repetida a lo largo de todas tus URL) este escenario no dispararía el porcentaje de contenido duplicado de tu página y no provocaría una penalización.

Sin embargo, si en vez de ser un frase como te he mostrado anteriormente fuesen un par de párrafos los que se repitiesen a lo largo de toda tu página web este porcentaje se incrementaría sustancialmente y podrías llegar ser penalizado por los algoritmos de Google.

PD. Qué se repita una frase en todas las URLs de tu página web no será relevante. Eso si, si estos enlaces se repitiesen en tu sidebar o footer (Es decir, en muchas de tus URL) en ese caso estos enlaces podrían llegar a ser peligrosos. Si es tu caso echa un vistazo a este post que escribí sobre ello.

¿Por qué es negativo el contenido duplicado en SEO?

Básicamente por que Google busca indexar únicamente en sus SERPs URLs con contenido 100% original. Es decir, que aporte valor.

Por este motivo, si Google detectase un alto porcentaje de contenido duplicado dentro de tu página web la penalizaría ya que entendería que no estarías aportando valor al usuario.

Por otro lado, si Google detectase contenido copiado de otra página web en la tuya podrás ser penalizado.

Quédate con esta frase:

«Cada página indexada en Google ha de ser original y aportar valor».

Esto es lo que busca y buscará Google siempre, así de simple.

¿Cómo se calcula el porcentaje de duplicidad de contenidos?

Pon mucha atención a la siguientes líneas querido lector ya que en ellas te mostraré como se calculará el porcentaje de duplicidad de contenidos internos de una página web.

Para ello, te mostraré todo con el siguiente ejemplo:

  • La zona Naranja ocupa un 25% del contenido (Contando el código HTML de la estructura de la web más conocido como DOM).
  • La zona Negra ocupa un 25% del contenido (Contando el código HTML de la estructura de la web más conocido como DOM).
  • La zona Blanca ocupa un 50% del contenido (Contando el código HTML de la estructura de la web más conocido como DOM).

ejemplo de similaridad de contenidos

Bien, llegado a este punto será el momento de calcular el porcentaje de duplicidad de contenidos correspondiente a cada caso:

  • En el caso A este será 100% similar con los casos B y C puesto que el poco contenido que contiene A será un 100% igual al de B y al de C incluyendo el código HTML del DOM.
  • En el caso B este será 50% similar con respecto al A y un 100% similar a C.
  • En el caso C este será 25% similar al caso A y un 50% similar al caso B. El resto del contenido (un 50%) será original de esta URL.

Por lo tanto, como habrás podido comprobar en el ejemplo anterior, la duplicidad de contenidos de una URL se calculará en función del contenido con respecto al resto de URLs de la página web mediante un porcentaje.

Por lo tanto, existirá un porcentaje global y uno particular de cada URL.

Es más, podrá darse el caso de que dos URL sean 100% iguales pero estas a su vez sean 0% similares a las URLs del resto de la página web.

En este caso en concreto podrá darse el caso que el porcentaje de contenido duplicado de estas URL sea muy bajo con respecto al resto de la página web.

Sin embargo, puede que el porcentaje de duplicidad de contenidos para dicho grupo de URLs o cluster sea elevado.

De ahí la complejidad de medición de esta métrica SEO que al final se solucionará mediante las distintas herramientas SEO que existen actualmente en el mercado.

Herramientas para comprobar el contenido duplicado interno de tu página web

A la hora de comprobar el contenido duplicado interno de tu página web lo mejor será utilizarlas siguientes herramientas SEO:

SE Ranking

SE Ranking

SE Ranking contará dentro de su sección auditoría SEO con una herramienta que te analizará el contenido duplicado externo e interno de tu página web.

De hecho, la propia herramienta te mostrará el porcentaje de duplicidad de contenidos mediante su métrica conocida como «Tasa de originalidad»

Semrush

SemRush

SemRush también contará con una sección de auditoría de contenidos internos para comprobar el contenido duplicado de una página web.

Por si esto fuera poco, SemRush se ha aliado con CopyScape para detectar contenido copiado en otras páginas web de internet por lo que con SemRush también podrás analizar la duplicidad de contenidos internos y externos de tu página web..

¡Un bonito 2×1!

Siteliner

Siteliner

Siteliner te servirá para comprobar el contenido duplicado interno de tu página web por categorías y etiquetas.

Además, esta herramienta te ayudará a comprobar los enlaces rotos de tu página web entre otras  muchas funcionalidades.

Screaming Frog

Screaming Frog

Gracias a la maravillosa herramienta Screaming Frog podrás analizar la duplicidad de contenidos de tu página web de forma rápida y sencilla mediante este sencillo tutorial.

Duplicate Content Checker de SEO Review Tools

Duplicate Content Checker de SEO Review Tools

Esta herramienta te permitirá medir el grado de contenido duplicado interno de tu página web de forma individual (Es lo malo) ya que no dejará hacerlo de forma global en toda tu página web.

Cómo solucionar el problema del contenido duplicado interno

A la hora de solucionar el problema del contenido duplicado interno lo mejor será aplicar las siguientes reglas:

  • Solo indexar aquellas URLs que realmente cuenten con contenido original y sean útiles para los usuarios.
  • Utilizar la etiqueta rel canonical para productos iguales de diferentes colores, tallas, etc siempre y cuando posiciones una tienda online.
  • Utiliza una buena arquitectura de contenidos que evite la repetición de post en diferentes listados.
  • Intenta evitar al máximo las paginaciones.
  • Si utilizas un spintax SEO en tu página web haz que este contenga el mayor grado de original posible para no ser sancionado.
  • Se generoso en los textos. No rellenes solo dos líneas por URL o producto.

¿Cómo detectar contenido duplicado en otras páginas web?

A la hora de detectar el contenido duplicado en otras páginas web la mejores herramientas del mercado serán:

CopyScape

CopyScape

CopyScape es sin duda la herramienta de contenido duplicado externo por excelencia debido a su sencillez y fiabilidad.

Dupli Checker

Dupli Checker

Dupli Checker será una buena alternativa más a CopyScape que te permitirá introducir un texto de hasta 1000 palabras para comprobar que URLs han copiado total o parcialmente tu contenido.

Plagiarism Checker

Plagiarism Checker

Gracias a Plagiarism Checker podrás localizar el plagio de un texto en concreto dentro del buscador Bing.

CopyLeaks

Copyleaks

Copyleaks será otra alternativa que te permitirá descubrir que páginas web han copiado tus contenidos de forma ilegal.

Cómo evitar el problema del contenido duplicado externo

A la hora de solucionar el problema del contenido externo lo mejor será:

  • Restringir o eliminar el FEED RSS de tu página web para que los scrapeadores de contenidos no puedan copiar todo tu contenido automáticamente mediante bots. Desde WordPress podrás restringir su uso a un extracto con la opción que encontrarás en Ajustes > Lectura > Para cada entrada en el feed > Extracto.
  • Eliminar la función de copia manual de tu página web con un plugin de WordPress tipo WP Content Copy Protector.
  • Aumentar tu autoridad web. De esta forma, Google tendrá más en cuenta tu página web otras que te hayan copiado el contenido con menor autoridad por mucho que la página web se haya montado en un dominio expirado.
  • Indexar tu contenido cuanto antes. Para ello, lo mejor será solicitar la indexación de la URL recién publicada en tu Google Search Console o a través de su API.
  • Marcar con schema la fecha de publicación de tu contenido y su autor para otorgar mas veracidad a tus contenido por encima del resto de páginas web copiadas.
  • Restringir el número de accesos o consultas por IP a tu página web. De esta forma podrás evitar que los bots consulten tu página web de forma continua en busca de nuevos contenidos.

¿Qué hacer si ya te han copiado el contenido?

Si por desgracia has detectado un fuerte bajón en tu posicionamiento SEO y has localizado a varias páginas web plagiando tu contenido no te quedará otra que actuar.

Ante este escenario podrás aplicar una de las siguientes estrategias:

  1. Intentar contactar con el dueño de la página web e instarle «amistosamente» a que elimine el contenido copiado y lo desindexe de Google.
  2. Contacta con el hosting que aloja la página web informándoles de que el contenido alojado en su servidor está infringiendo la ley de propiedad intelectual (Siempre y cuando lo puedas demostrar).
  3. Denuncia a Google el plagio de dicho contenido a través de las siguientes vías: https://support.google.com/legal/troubleshooter/1114905, https://www.google.com/webmasters/tools/dmca-notice
  4. Denuncia el plagio ante la justicia.

Conclusiones sobre el contenido duplicado y el SEO

Cómo has podido ver a lo largo del post el contenido duplicado y el SEO serán dos factores a tener en cuenta en cualquier estrategia SEO.

De hecho, descuidar el contenido de tu página o permitir su copia significará un descenso drástico del tráfico orgánico de tu página web.

Por lo tanto, a la hora de crear y redactar los contenidos de tu página web redacta contenidos SEO «generosos» y de calidad, estudia la estructura de contenidos de tu página web y, sobre todo, aplica la máxima de que cada URL de tu página web deberá ser única.

Por otro lado, si por desgracia has sido víctima de un robo de contenido intenta evitarlo con las medidas que te he mostrado anteriormente, contratando a un consultor SEO freelance o, en última instancia, denuncia ante Google o ante la ley esta apropiación indebida.

Eso es todo por hoy querido lector. Ahora te toca a ti ¿Te han copiado alguna vez el contenido de tu página web? ¿Conocías este factor SEO?

¡Cuéntamelo en los comentarios y nos vemos en dos semanas!

¡Espera! Seguro que estos artículos también te interesan:
Borja Aranda Vaquero 01

Artículo escrito por:

Borja Aranda Vaquero

¡Hola! Me presento. Me llamo Borja y me dedico a incrementar la visibilidad de negocios en internet. Actualmente he ayudado a más de 100 empresas a conseguir una buena visibilidad en internet.

¿Quieres saber más?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¿Necesitas mejorar tu posicionamiento web?

Si quieres posicionar en primera la primera posición tu página web ¡Escríbeme!

¡Suscríbete!

Y consigue en tu email las últimas novedades en SEO, WordPress, WPO y CRO.

También podrás escribirme a: