Comment éliminer de l'indexation le contenu non significatif d'une page ?

AtomZ peut retirer de l'indexation une partie d'une page qui ne serait pas significative : tout bloc de code encadré par les tags <NOINDEX> et </NOINDEX> est exclu de l'indexation.

Le spider d'AtomZ n'inclut pas le texte situé entre ces tags comme contenu indexable, mais il suit les liens qui peuvent s'y trouver pour poursuivre l'indexation. Ceci est particulièrement utile pour les blocs de navigation, qui sont communs d'une page à l'autre, indispensables à l'indexation mais sans aucune signification pour une recherche.

A contrario, si vous voulez indexer le texte, d'un bloc sans suivre les liens qu'il contient, par exemple pour les liens vers une section protégée du site, vous pouvez utiliser les tags <NOFOLLOW> et >/NOFOLLOW< autour du bloc concerné.

Naturellement, ces deux propriétés peuvent être combinées, et vous pouvez définir un bloc dont le contenu ne sera pas indexé et dont les liens ne seront pas suivis, en emboîtant les tags : <NOINDEX><NOFOLLOW>....</NOFOLLOW></NOINDEX>.

L'utilisation réfléchie de ces tags permet d'éliminer le "bruit" sémantique présent sur vos pages Web, et permet de renvoyer des résultats de recherche plus significatifs.


Get started with Drupal 7

Marques les plus citées

toutes les marques

acheter sur OSInet

Accès direct

Recherche

Blog développeurs

Le mot du jour

PS

PostScript

in | |

Langage Adobe de description de pages. 

Syndiquer le contenu

Dernières définitions

Chrome - Chromium - digitaalisen kuilun - ghetto sharding - HTTP - MongoDB - PNaCl - QUIC - Skia - SPDY

Un mot au hasard

data mining : extraction de données  

Alertes CERTA