Comment Vérifier le Contenu Dupliqué sur son site web ?

Verifier contenu duplique

Le contenu dupliqué, ou duplicate content, est l’un des pires fléaux du web ! Il nuit à la qualité et au référencement naturel des sites internet qui le pratiquent, mais aussi à ceux qui en sont victimes.

Google et les autres moteurs de recherche savent très bien détecter les contenus identiques (ou très similaires) sur deux sites différents ou au sein d’un même site. Et ils le pénalisent !

Alors, comment s’en prémunir ? Comment vérifier le contenu dupliqué sur son site ? Et comment vérifier si nos textes ont été copiés par d’autres ?

Pas de panique ! Ils existent sur le web plusieurs outils anti-plagiat (gratuits ou payants) très simples à utiliser pour vérifier le duplicate content. Tu trouveras dans cet article une liste de ces outils ainsi que quelques conseils et astuces pour corriger ce problème si tu le rencontres avec ton site !

Bonne lecture !

Qu’est-ce qu’un contenu dupliqué ?

Le contenu dupliqué (duplicate content en anglais) est un contenu plagié. C’est-à-dire qu’il s’agit d’un texte que l’on peut retrouver sur plusieurs pages d’un même site (contenu dupliqué interne) ou sur différents sites internet (contenu dupliqué externe).

Le contenu dupliqué peut être soit strictement identique au texte d’origine, soit suffisamment similaire pour être catalogué comme du plagiat.

Le contenu dupliqué interne

Il arrive plus souvent qu’on ne le croie qu’un contenu soit copié-collé au sein d’un même site internet.

Le contenu dupliqué interne peut prendre la forme de petits blocs de texte identiques (ou textes entiers) sur différentes pages ou plus typiquement, des fiches produits copiées-collées sur les sites d’e-commerce. On peut aussi trouver du contenu dupliqué au niveau des balises Title, H1 et meta description. Tout comme les contenus des pages et des articles de blog, ces dernières doivent être uniques !

Pour aller plus loin : Comment insérer et optimiser une meta description dans WordPress ?

Pourquoi ce type de plagiat existe-t-il ?

Deux cas de figure :

  • Inconsciemment, il peut nous arriver d’écrire plusieurs fois la même chose sans y prêter attention !
  • Consciemment, pour gagner du temps sur la rédaction (sans forcément connaître les risques que cela engendre).

En procédant de la dernière sorte, Google et les autres moteurs de recherche ne jugent pas d’un très bon œil le site internet ainsi que sa qualité et la pertinence de son contenu éditorial.

Le contenu dupliqué externe

Avec le contenu dupliqué externe, on parle de contenu identique sur deux sites web différents.

On retrouve ce type de plagiat avec le cas des fiches produits de certains e-commerces qui reproduisent le contenu de leurs fournisseurs par exemple.

Sinon, il peut aussi s’agir purement et simplement de plagiat ! Malheureusement, le web compte aussi son lot de personnes totalement malhonnêtes qui n’hésitent pas à copier-coller le contenu d’un blog ou d’un site.

Nous verrons plus loin dans cet article ce qu’il est possible de faire pour vérifier le duplicate content, qu’il soit interne ou externe, et comment faire peut y remédier. Mais avant, voyons ensemble quelles sont les conséquences que peut avoir le contenu dupliqué sur le SEO d’un site internet !

Comment vérifier le contenu dupliqué sur son site ?

Cet article te plaît ?

Partage-le sur Pinterest ! Tu as juste à passer ta souris sur l’image et à cliquer sur le logo Pinterest !

Contenu dupliqué : quelles conséquences sur le référencement naturel ?

2 !

Il y a deux effets négatifs que peut avoir le contenu dupliqué sur le référencement naturel !

Le premier est une expérience utilisateur désagréable (voire désastreuse) et le second est une chute du positionnement dans les pages de résultats de Google.

Mais avant d’entrer dans les détails, sais-tu comment les moteurs de recherche font pour vérifier le contenu dupliqué ? Non, pas trop ! Alors ce qui suit va t’apporter la réponse 😉 !

Comment les moteurs de recherche détectent-ils le contenu dupliqué ?

Le but des moteurs de recherche est de toujours proposer des contenus de qualité aux internautes. Si deux contenus identiques étaient affichés en première page des résultats, ils perdraient la confiance de leurs utilisateurs. Ces derniers iraient alors faire leurs recherches sur un autre moteur !

Il est donc dans leur intérêt de détecter les textes copiés et de les écarter en sanctionnant les sites qui pratiquent le duplicate content.

Quand les moteurs de recherche trouvent dans un site ou sur le web deux contenus identiques ou similaires, ils ne prendront qu’un seul en compte pour le proposer aux internautes et le reste ira aux oubliettes du web.

Ils ne choisiront pas au pif, bien sûr !

Non, ils se baseront sur plusieurs critères comme le PageRank des sites ou des pages (popularité) et la date de première découverte du contenu. Leurs analyses détermineront lequel semble être le contenu original et le mettra donc en valeur dans la SERP. Le reste sera alors considéré comme du contenu de mauvaise qualité, sans valeur ajoutée et donc, sans grand intérêt pour les internautes !

Détection du duplicate content par les moteurs de recherche

Une expérience utilisateur dégradée

Imaginons la situation suivante : tu es sur Google et tu tapes une requête dans la barre de recherche. En toute logique, tu t’attends à des résultats pertinents et à forte valeur ajoutée. Pour chaque lien dans la page de résultats que tu consultes, tu veux des informations justes et complémentaires sur l’objet de ta recherche.

Que se passe-t-il maintenant si tu lis la page d’un des résultats, puis que le lien suivant te propose exactement le même contenu (ou très similaire) ? Que vas-tu penser ?

En premier, tu partiras vite du second site et ensuite, tu te diras « quelle belle perte de temps ! ». Tu ressentiras de la déception. La plupart des gens auraient le même sentiment face à cette situation.

Ce site aura donc eu sur l’internaute un effet négatif, et ce, peu importe si le site web en question est à l’origine du duplicate content ou en est la malheureuse victime. L’expérience utilisateur de ce site est par conséquent dégradée.

En plus de cela, l’image de marque en prend un sérieux coup aussi ! Celle-ci se dégrade dans l’esprit de l’internaute. En toute honnêteté, retournerais-tu sur ce site lors d’une autre recherche ? Sans doute pas. Tu l’auras certainement jugé comme peu fiable. Beaucoup penseraient la même chose.

Un positionnement SEO en chute libre

Les moteurs de recherche n’aiment pas le contenu dupliqué, Google en premier !

Pour lutter contre, il a développé un algorithme, appelé Panda, et l’a greffé à son algorithme principal. Panda a la capacité d’estimer la qualité des contenus proposés par les sites internet et de pénaliser ceux qui offrent de piètres contenus.

Dès que du contenu dupliqué est détecté, l’algorithme Panda diminue fortement le positionnement de la page incriminée. Ce qui signifie plus aucune visibilité dans les pages de résultats de Google et donc, une baisse du trafic naturel !

C’est pour ces deux répercussions que pratiquer intentionnellement le duplicate content n’est pas une très bonne idée ! Même pour gagner du temps ! Au final, ce temps gagné sera largement perdu lorsqu’il faudra rattraper les dégâts provoqués par cette pratique.

Les outils pour vérifier le contenu dupliqué

Il arrive aussi de dupliquer du contenu sans le savoir. Lorsqu’on rédige, notre inconscient peut parfois nous jouer des tours. On se retrouve alors à reproduire par écrit ce que l’on a lu ou rédigé ailleurs (ça arrive plus souvent qu’on ne le croit !).

C’est pour cela qu’une petite vérification avant de publier son texte peut s’avérer utile. Et justement, plusieurs outils existent sur le web pour nous aider à vérifier le contenu dupliqué.

On peut également s’en servir de temps en temps pour vérifier que personne ne copie nos propres contenus, bien sûr !

Quetext

Jusqu’à très récemment, j’utilisais deux outils anti-plagiat. Mais à l’occasion d’un article invité, on m’a fait découvrir Quetext qui s’est révélé bien plus efficace que mes deux outils réunis. Autant dire que je n’ai pas tardé à m’en défaire et que je vais continuer avec ce logiciel !

Quetext, outil de vérification de contenu dupliqué

Quetext existe en deux versions. La première, gratuite, permet de vérifier des textes allant jusqu’à 2 500 mots. Quant à la version payante, la limite de mots est de 100 000 ! Facile à prendre en main, il est également possible de télécharger un fichier avec la version payante.

Copyscape

Copyscape est un outil très pratique et gratuit pour vérifier sur le web si ses contenus ont été copiés par d’autres. Je l’ai découvert il y a quelque temps maintenant et je dois dire qu’il est plutôt performant.

Copyscape, outil de detection de contenu duplique

Il suffit d’entrer l’URL de sa page et Copyscape l’analyse pour savoir s’il y a une copie ou non quelque part sur Internet. Il existe aussi une version payante dans laquelle il est possible de vérifier directement son texte avant sa publication.

L’outil propose une autre fonctionnalité intéressante. Il peut alerter le propriétaire de site web dès que des copies de ses contenus sont détectées grâce à des scans journaliers.

Screaming Frog SEO Spider

Pour vérifier le contenu dupliqué interne à un site internet, Screaming Frog SEO Spider est l’outil qu’il faut.

C’est un crawler, c’est-à-dire qu’il va scanner l’ensemble du site web et révéler le contenu dupliqué présent dans les textes, mais aussi dans les différentes balises des pages.

Avec la version gratuite, il est possible de tester jusqu’à 500 URLs. La version payante est plutôt destinée aux sites avec des milliers de pages.

Cerise sur le gâteau, Screaming Frog t’indiquera en plus du contenu dupliqué les liens rompus et les erreurs de serveur.

Verifier les contenus dupliques avec Screaming Frog SEO Spider

Kill Duplicate

Outil payant, Kill Duplicate se voit en leader du marché de la détection du plagiat.

En quelques clics et moyennant finance, l’inscription à la plateforme est simple et rapide. Elle analyse, détecte le contenu dupliqué et fourni en temps réel l’identité des voleurs de ses contenus.

Cet outil propose aussi une surveillance de son site web avec des scans quotidiens pour lutter rapidement contre le duplicate content.

Kill Duplicate, outil de verification de contenu duplique

Siteliner

Siteliner permet de vérifier le contenu dupliqué interne des sites web. Qui plus est, il est gratuit et super simple d’utilisation.

Après avoir renseigné l’URL du site, l’outil le scanne entièrement et fournit ses résultats sous forme de petits graphiques faciles à comprendre. On peut ensuite consulter un tableau regroupant tous les contenus dupliqués internes trouvés. Le taux de similarité entre deux pages est également donné dans ce même tableau.

Je l’ai testé et il est efficace. L’outil a détecté des tournures de phrase que j’utilise souvent sans m’en rendre compte 😅 !

Verifier le contenu duplique interne avec Siteliner

Copyleaks

Outil se basant sur une puissante Intelligence Artificielle, Copyleaks détecte les contenus copiés ou paraphrasés dans plusieurs langues. Facile à utiliser, cet outil payant offre plusieurs fonctionnalités en plus de la vérification du duplicate content.

Copyleaks, verification de plagiat

Corriger le duplicate content : comment s’y prend-on ?

Si après avoir utilisé l’un des outils cités juste avant, tu as repéré du contenu dupliqué sur ton site et que tu veux le corriger, voici plusieurs astuces pour t’aider à régler ce problème.

En cas de contenu interne dupliqué

Dans un tel cas, deux solutions sont possibles :

  1. Réécrire les contenus en double pour qu’ils soient totalement uniques.
  2. Utiliser la balise canonicale.

La balise canonicale de la page dupliquée permet d’indiquer à Google l’URL de la page originale dont elle est la copie.

En cas de plagiat par un autre site web

Si l’un de tes textes est plagié par un autre site, tu peux commencer par contacter le propriétaire du site en question pour lui demander de supprimer le contenu dupliqué (ou de le modifier suffisamment).

Dans l’éventualité où le copieur ne coopère pas, une autre solution peut être envisagée.

Celle-ci consiste à contacter Google et de signaler le plagiat dont tu es victime. Le moteur de recherche met à disposition des internautes un support pour déposer ses demandes de suppression de contenus dupliqués. Une fois les informations vérifiées, le moteur pénalisera le site s’il juge la demande pertinente.

Il peut arriver que le simple fait d’informer le voleur de contenus de sa volonté de le signaler à Google suffise à le faire revenir à la raison 😉.

Et toi, as-tu déjà été confronté au problème de duplicate content ? Quels outils utilise-tu pour vérifier tes contenus ?

Partage en commentaire ton expérience sur ce sujet, ou simplement pour dire ce que tu as pensé de cet article ! Je suis sûre que cela pourra aider plein d’autres personnes 😊.

Jessica

Partage l'article sur tes réseaux sociaux préférés !
Posté le: 5 novembre 2020, par :

6 commentaires sur “Comment Vérifier le Contenu Dupliqué sur son site web ?

    1. Merci à vous 😊
      Dans ce cas, je penses que les outils pour détecter le contenu dupliqué interne seront vos meilleurs alliés pour améliorer votre blog !
      N’hésitez pas à revenir pour partager votre expérience sur ces outils, cela pourra aussi aider les autres blogueurs et blogueuses d’avoir des avis supplémentaires 😉

  1. Très complet et intéressant ! Merci pour tous ces outils, je ne les connais pas tous, je vais me renseigner et commencer les tests de suite 😉

    1. Je te remercie Charlotte 😊
      J’espère qu’ils t’apporteront satisfaction ! Si tu veux partager ton retour d’expérience sur tes tests ici, c’est avec plaisir 🙂 !

Laisser un commentaire