Duplicate Content : Comment éviter et corriger le contenu dupliqué pour son référencement naturel ?

Dans cet article, nous allons vous expliquer comment éviter et corriger le contenu dupliqué de votre site web sur le moteur de recherche Google et ainsi ne pas impacter votre référencement naturel.

Selon Gary Illyes, parmi toutes les pages web de Google, 60% d’entres elles correspondraient à du contenu dupliqué. C’est pourquoi, le géant américain Google, qui veut proposer à ses internautes du contenu toujours plus pertinent, a décidé de traiter de manière particulière ces méthodes de duplication de contenu.

Tout d’abord, un contenu dupliqué ou «duplicate content» en anglais, est le fait de retrouver un contenu identique sur différent site web. Autrement dit, si deux sites web contiennent sur leurs pages le même contenu (texte, image…) et que l’URL de chacun des sites est différent, alors, nous parlons de contenu dupliqué. Ce «duplicate content» peut avoir deux formes différentes : le contenu dupliqué externe ou le contenu dupliqué interne. Cette problématique récurrente, principalement sur les sites e-commerce, peut impacter tout le travail que vous avez réalisé en référencement naturel. Pour pallier à cela, nous allons vous aiguiller.

Afin de vous éviter toute pénalité par notre cher moteur de recherche Google (Panda), nous verrons dans cet article toutes les bonnes méthodes à suivre : Quelle est la différence entre contenu dupliqué externe et interne ?  Quel est l’impact de ces différents « duplicate content » sur votre référencement naturel ? Ou encore comment les détecter et les corriger ?

Contenu dupliqué externe

Qu’est-ce-que le contenu dupliqué externe ?

Le «duplicate content» externe, comme son nom l’indique, est un contenu identique ou partiellement identique entre deux sites web différents. Ce contenu dupliqué peut avoir différentes sources. Voici donc les causes d’un contenu dupliqué externe :

  • Lorsque vous copiez/collez du contenu (texte, image, vidéo…) d’un site web vers un autre.
  • Lorsque deux sites e-commerces vendent les mêmes produits et utilisent les fiches produits du même fournisseur.
  • Lorsque vous faites rédiger votre contenu textuel par un prestataire et que celui-ci réutilise ses textes pour un autre client ou que celui-ci les utilise sur son propre site.
  • Lorsque vous utilisez des bases de données de contenu qui peuvent être utilisées par d’autre personne (très souvent utilisé par les sites web touristiques).

En quoi le contenu dupliqué externe impact-t-il votre référencement naturel ?

S’il est utilisé, le «duplicate content» externe va impacter sur votre référencement naturel et donc nuire au bon positionnement de votre contenu sur une requête. Mais comment est-il prit en compte par les robots Google ?

Tout d’abord, il n’est absolument pas pertinent pour Google d’avoir sur sa toile différents sites proposant le même contenu. En effet, cela est redondant pour ses utilisateurs. C’est pourquoi, Google va faire un choix entre les différents sites et va favoriser le contenu le plus antérieur. Cependant, un autre facteur peut rentrer en compte. Celui de la popularité du site. Si l’algorithme de Google estime que votre site est moins ancien et moins populaire, alors dans ce cas, cela est possible que votre page soit considérée comme copiée, même si vous êtes l’auteur des contenus. Pour pallier à cela, rien de plus simple ! Il vous suffira de prouver à Google que vous êtes l’auteur original du contenu en question et de faire une demande de retrait de la copie.

Un site entier ne sera pénalisé pour cause de contenu dupliqué si et seulement si celui si est entièrement dupliqué d’un autre site.

Comment détecter le contenu dupliqué externe ?

Afin de détecter si un autre site a dupliqué le contenu d’une de vos pages, différentes méthodes existent.

La première méthode, et sans doute la plus pratique, est d’utiliser un logiciel de détection de contenu dupliqué. Et cela ne manque pas sur la toile. Voici une sélection de deux outils plutôt efficaces :

Ces deux outils marchent de la même façon. Il vous suffira de copier l’URL ou le texte de votre page pour qu’ils puissent détecter les copies.

La deuxième méthode consiste à utiliser directement Google. En effet, Google peut vous permettre de faire la vérification. Pour cela, il vous suffit de mettre entre guillemet un contenu dans la barre de recherche et Google vous sortira alors toutes les pages indexées contenant votre texte.

Comment corriger le contenu dupliqué externe ?

Voici quelques exemples courants de «duplicate content» externe ainsi que les solutions pour y remédier.

  • Dans le cas ou votre contenu a été copié par un tiers, la première option sera de contacter le site concerné afin de lui signaler le contenu dupliqué. Dans le cas ou la personne refuse de vous répondre ou de retirer le contenu dupliqué, vous pouvez engager des poursuites (protection du droit d’auteur).
  • Dans le cas ou vous faites un partenariat avec un autre site et qu’un contenu est identique entre les deux sites, pensez à : voir avec votre partenaire laquelle des deux pages doit être référencées et supprimées, réécrire le contenu d’une autre manière, empêcher l’indexation de votre page par Google avec la balise «noindex» ou via le fichier robots.txt, signaler à Google que votre contenu est dupliqué d’un autre site via une balise canonical.
  • Dans le cas ou vous êtes un site e-commerçant et que vous utilisez les fiches descriptives de vos fournisseurs, cela peut nuire à votre référencement naturel. En effet, si votre site est moins ancien et moins populaire vous serez pénalisé. Pensez donc à vous distinguer de vos concurrents en créant vos propres contenus.

Contenu dupliqué interne

Qu’est-ce-que le contenu dupliqué interne ?

Le «duplicate content» interne est un contenu identique ou partiellement identique au sein de votre propre site. Ce contenu dupliqué peut avoir différentes sources. Voici donc les causes d’un contenu dupliqué interne :

  • Lorsque vous avez des produits proches avec des textes identiques.
  • Lorsque vous avez des URLs différentes avec des textes identiques.
  • Lorsque vous avez des textes copiés de fichiers PDF disponibles sur votre site web.
  • Lorsque vous possédez des pages de tag ou de catégories WordPress mal organisées.

En quoi le contenu dupliqué interne impact-t-il votre référencement naturel ?

Plusieurs raisons sont à prendre en compte lorsque nous parlons de «duplicate content» interne et d’impact sur le référencement naturel.

En effet, si vous décidez de créer deux pages identiques sur votre site web dans le but d’avoir un référencement naturel plus efficace vous vous trompez et risquez même de n’en positionner aucunes. Dans ce cas, vous mettez en concurrence vos deux pages et le moteur de recherche Google n’en affichera qu’une des deux. Il est donc inutile de créer des pages similaires dans le but de toutes les positionner puisque ces pages seront détectées et traitées par les robots Google.

De plus, le fait de créer des pages identiques sur votre site fera perdre du temps à l’analyse de celui-ci et donc de vos pages uniques et importantes. En effet, Google crawl un nombre limité de page par site. Si vous lui faites perdre du temps à crawler des pages identiques, vous prenez donc le risque de limiter l’indexation des contenus intéressants de votre site.

Comment détecter le contenu dupliqué interne ?

Afin d’éviter le contenu dupliqué interne sur votre site, voici quelques astuces :

  • Utilisez un outil pour qu’il puisse analyser votre site. Siteliner vous permettra en quelques clics d’analyser votre site et de déterminer les éléments dupliqués. Cet outil, après analyse, vous donnera le pourcentage de contenu identique avec une ou plusieurs pages. Faites cependant attention car cet outil prend en compte votre header et votre footer (élément forcément identique entre vos pages). Pensez donc à observer uniquement le corps de votre page pour identifier au mieux les éléments dupliqués.
  • La méthode la plus sûr mais aussi la plus minutieux est de chercher vous même les cas de «duplicate content». Il vous suffira d’explorer l’intégralité de vos pages et de faire attention à vos textes, images… Si votre site web est un site e-commerce, faites davantage attention à vos fiches produits.

Comment corriger le contenu dupliqué interne ?

Voici quelques exemples courants de «duplicate content» interne ainsi que les solutions pour y remédier :

  • Un des cas les plus fréquents de contenu dupliqué interne est rencontré sur les sites e-commerçants. En effet, lorsqu’un produit est commercialisé avec des variantes différentes (couleur, taille…) sa fiche produit est très souvent identique. Pour pallier ce problème, voici trois solutions : avoir une seule fiche par produit, utiliser une balise canonical afin d’indiquer que le contenu est identique entre deux pages ou tout simplement réécrire un contenu différent pour chaque page.
  • Les fichiers PDF peuvent-être lu par Google et donc indexés s’ils sont sélectionnables sur votre site. Pour éviter que vos PDF soient mieux positionnés que vos pages, il est préférable d’empêcher leurs indexations grâce au fichier robots.txt. Si vos PDF ne sont pas tous présents dans un répertoire spécifique de votre site, vous devrez utiliser l’en-tête x-robots-tag, qui permettra l’ajout d’une balise noindex dans l’en-tête HTTP de votre page.
  • Dans le cas d’un DUST (Duplicate URL, Same Text), il vous faudra simplement choisir l’URL que vous souhaitez conserver. Gardez la page ayant le plus de liens externes et redirigez les autres URLs avec une redirection 301.

Conclusion :

Le contenu dupliqué, qu’il soit externe ou interne, peut nuire à votre référencement naturel. C’est pourquoi, il est important de faire attention et de vérifier que votre site n’en contienne pas. N’hésitez pas à utiliser des outils d’analyse ou tout simplement à créer votre propre contenu. Des contenus uniques favorisent l’indexation ainsi que le référencement naturel de votre site.

Trigency
SEO   |   SEA

Contact    |   Mentions légales
© 2015 – 2021   |   Tous droits réservés   |   Trigency – Paris