Webpassion360

Duplicate content : le détecter et supprimer

Duplicate content : le détecter et supprimer 3

Est-ce que votre site souffre de duplicate content (ou contenu dupliqué) ?

Cet article vous explique comment détecter et remédier au problème du duplicate content.

Le duplicate content est vraiment néfaste au bon référencement de votre site. Si vous avez du duplicate content dans votre site, Google ne sait pas quelle page prendre en compte.

Tout d’abord, qu’est-ce que le duplicate content ?

Tout contenu dupliqué ou identique à un autre autre site, ou bien son même site

Exemples:

Qu’est ce qui n’est pas du duplicate content (ou contenu dupliqué)

Par exemple :

Il est plusieurs moyens d’être affecté par Google à cause du duplicate content :

Comment détecter du duplicate content dans votre site ?

Le moyen le plus simple est de copier votre contenu dans Google, et voir le résultat. Vous pourrez ainsi trouver les autres sites qui ont peut-etre dupliqué votre contenu. Ceci étant, il y a d’autres moyens (plus rapides).

Voici 3 moyens pour détecter du duplicate content dans votre site :

1) Google Webmaster tools

Vous pouvez trouver facilement le contenu dupliqué avec l’outil gratuit Google Webmaster Tools (sous  Optimization > HTML Improvements)

2) Outil externe

Vous pouvez utiliser l’excellent outil gratuit fourni par Copyscape pour trouver le contenu dupliqué dans votre site. C’est un outil gratuit disponible sur Max et PC

3) L’opérateur de recherche Google « Site: »

Allez sur google, et entrez dans la barre de recherche : site:www.votresite.com [une partie de votre contenu copié]

Si vous voyez dans la page des résultats Google un message d’alerte disant que certains résultats similaires n’ont pas été affichés, c’est une indication que votre contenu est présent dans un autre site, voire même dans votre propre site

Si vous souhaitez rechercher un mot en particulier, rajouter  intitle: »VOTRE_MOT »  : site:votresite.com intitle: »VOTRE_MOT »

Votre contenu est dupliqué, comment y remédier ?

Supprimer le duplicate content / contenu dupliqué

Supprimer le contenu dupliqué est possible, mais demande beaucoup d’effort. Si votre contenu a été « volé » par d’autres sites, vous devrez envoyer un mail poli à chaque auteur pour lui demander de supprimer votre contenu. Ou à défaut, de rajouter un lien vers votre contenu original. Aussi, vous pouvez poster en commentaire qu’ils peuvent trouver l’article original vers votre page (et insérer le lien vers votre page).

Si votre site lui-même est affecté par le duplicate content, voici quelques solutions :

1. Rel= »canonical »

Si vous avez plusieurs pages (et donc des URLs différentes) avec le même contenu, choisissez l’URL que vous préférez afficher dans les résultats de Google. Ce sera votre URL dit canonique.  Dans toutes les autres pages, dans la section <head></head>, vous devez ajouter la balise  rel=“canonical”.

Par exemple : vous souhaitez que la page A soit indexé, et le contenu dupliqué se trouve en page B, vous devez ajouter dans la page B, entre les balises <head></head>

<link href=“URL de la page A” rel=“canonical”/>

Ainsi, les robots crawlers vont comprendre le message et n’affiché que la page A dans les résultats

2. Redirections 301

Vous pouvez utiliser la redirection 301 de vos pages dupliquées.

Ajouter dans vos pages dupliqués le tag  rel= »canonical » laissent les pages visibles pour vos utilisateurs. Tandis qu’une redirection 301 redirige complétement la page vers votre page A que vous souhaitez indexer.
Utilisez cette solution pour rediriger vos pages de www vers non-www (ou vice-versa). A noter que la redirection 301 est permanente, alors réfléchissez bien avant de le faire

3. Meta Robots Tag

Un peu similaire que la solution 1 en ajoutant la base rel, vous pouvez ajouter la balises suivantes dan les pages qui ont du contenu dupliqué et que vous ne souhaitez pas indexer

<meta name= »robots » content= »noindex »>

La encore, les robots vont comprendre le message et ne pas indexer cette page.

4. Google Webmaster Tools

Vous pouvez configurer votre urls avec des paramètres dans Google Webmaster Tools

Commencez par configurer votre URL principale (sous Configuration> Sitelink> Preferred Domain)

Puis, aller à la page Configuration > URL Parameters pour configurer vos urls avec paramètres.

Attention, n’utilisez cette solution que si vous la maitrisez car cela peut faire l’effet inverse et désindexer beaucoup de vos pages si c’est mal configuré.

5. Cas de la pagination

Si vous avez un site qui utilise le système de pagination pour naviguer entre vos pages (ou commentaires), utilisez les attributs rel= »next » et  rel= »prev »  pour indiquer ces pages aux moteurs de recherche.

Pour en savoir plus, lisez cet article sur le blog Google Webmaster concernant la pagination avec rel= »next » et rel= »prev ».

 

A noter : si vous avez utilisez l’une des solutions décrites précédemment, pensez à mettre à jour votre Sitemap XML (en supprimant les URLs dupliqués), et soumettez ce nouveau sitemap sur Google Webmaster Tools.

Pour créer un Sitemap XML facilement, utilisez cet excellent outil : A1 Sitemap Generator 5