 |
Adresse URL (Uniform Resource Locator)
Adresse d’un site Web sur Internet qui se compose des éléments suivants :
http (protocole d’accès), nom de domaine (www.google.fr) et dans certains cas de
l’emplacement d’un autre fichier (www.google.fr/webmaster).
|
 |
Balises Méta
Balises dans le code HTML permettant de décrire le contenu d’une page Web.
Les balises Méta peuvent être utilisées afin de définir des modalités d’indexation spécifiques
pour chacune des pages d’un site.
|
 |
Contenu dynamique
Contenu tel que des images, des animations ou des vidéos qui utilisent
le langage Flash ou Javascript, des cadres ou des adresses URL générées dynamiquement.
|
 |
Dissimulation (Cloaking)
Technique qui consiste à montrer aux moteurs de recherche un contenu
différent de celui visible par les utilisateurs.
|
 |
Exploration (Crawling)
Processus utilisé par les moteurs de recherche pour collecter
des pages sur le Web.
|
 |
Extension de fichier
Nom attribué aux fichiers informatiques (.doc, .txt, .pdf, etc.)
indiquant généralement la nature des données contenues dans le fichier.
|
 |
HTML (Hypertext Markup Language)
Langage de marquage utilisé sur le Web afin de structurer le texte.
|
 |
Indexer
Processus consistant à référencer le contenu d’un site dans un moteur
de recherche.
|
 |
Lien “En cache”
Image d’une page Web capturée par les robots Googlebot lors de leur
dernière visite. Une copie en cache permet aux utilisateurs d’afficher une page même
lorsque sa version en ligne n’est pas disponible. Le contenu de cette copie peut
toutefois varier légèrement de la version en ligne. Pour afficher la copie en
cache d’une page, cliquez sur le lien “En cache” affiché sous le résultat de la recherche.
|
 |
Mot clé
Terme saisi dans la zone de recherche d’un moteur de recherche,
lequel lance une recherche afin de trouver des pages contenant ces termes.
|
 |
Protocole d’exclusion des robots
Norme technique indiquant aux moteurs de recherche quels sites
ou parties de site doivent être ou non référencés dans les résultats de recherche.
|
 |
PageRank
Fonctionnalité proposée par Google contribuant à déterminer le
classement d’un site dans nos résultats de recherche. Ce classement est établi en
respectant le caractère profondément démocratique du Web, puisqu’il utilise son
organisation sous forme de liens pour déterminer la valeur individuelle de chaque page.
Le score PageRank des sites importants et de grande qualité est plus élevé.
Cet élément est pris en compte par Google lors des recherches.
Google associe ce classement à des techniques élaborées de recherche de texte
correspondant aux critères saisis afin de trouver des pages pertinentes et
importantes par rapport aux requêtes des internautes.
|
 |
Répertoire racine
Répertoire principal dans un système de fichiers informatiques.
|
 |
Robot d’exploration (Crawler)
Logiciel utilisé pour repérer, puis indexer les adresses
URL du Web ou d’un réseau intranet.
|
 |
Robots.txt
Fichier texte permettant aux éditeurs Web de contrôler
l’accès de leur site à plusieurs niveaux : intégralité du site, répertoires
individuels, pages d’un type particulier ou même pages individuelles.
Ce fichier signale aux robots d’exploration quels répertoires
peuvent être ou non explorés.
|
 |
Système de gestion de contenu
Logiciel qui permet de gérer différents types de contenus :
fichiers informatiques, images, fichiers audio, contenus Web, etc...
|