Sommaire
- Que signifient l'indexation et le crawling de Google ?
- Qu'est-ce que GoogleBot exactement ?
- Comment puis-je savoir si mon site Web est inclus dans l'index de Google ?
- Sur les sites JavaScript, comment fonctionnent les index de Google ?
- Dans les résultats rendus, comment le pré-rendu JavaScript est-il géré ?
- Quel rôle joue le processus d'exploration et d'indexation de Google ?
Que signifient l'indexation et le crawling de Google ?
L'exploration et l'indexation sont deux activités distinctes. L'exploration consiste pour Googlebot à examiner et à analyser l'ensemble du matériel et du code d'une page Web.
Lorsqu'une page est indexée, elle peut figurer dans les résultats de recherche de Google. La pertinence des noms de domaine a considérablement augmenté après la mise à jour Panda de Google.
Le succès de votre entreprise sur Internet dépend de la capacité de vos pages Web à être correctement explorées et indexées.
Certaines entreprises déploient beaucoup d'efforts pour créer un contenu exceptionnel et optimiser leur site Web, mais leur contenu essentiel n'est toujours pas indexé.
C'est pourquoi nous vous recommandons de tenir compte de ce facteur dès le début de vos séances de planification et de votre stratégie commerciale.
Qu'est-ce que GoogleBot exactement ?
Googlebot est le logiciel du robot de recherche de Google qui collecte le contenu du Web afin de créer un index consultable pour le moteur de recherche de Google.
Avec une bonne compréhension de GoogleBot, le référencement peut stimuler les approches de recherche, que vous cherchiez à maîtriser les méthodes du Google Crawler pour le référencement payant ou payant.
GoogleBot est un composant du moteur de recherche de Google qui explore et indexe vos sites Web.
Il est également appelé “spider” (araignée). Chaque page à laquelle vous autorisez GoogleBot à accéder est explorée et ajoutée à l'index de Google, où elle peut être récupérée et renvoyée pour répondre aux demandes de recherche des utilisateurs. Vos efforts pour indiquer clairement à Google les pages de votre site Web que vous souhaitez voir indexées et celles que vous ne souhaitez pas voir indexées peuvent ressembler à une bataille.
Comment puis-je savoir si mon site Web est inclus dans l'index de Google ?
Une URL de votre propriété sera testée à l'aide du rapport d'informations sur l'index de Google dans votre Google Search Console.
Sa fonctionnalité d'inspection des URL vous montrera l'état actuel de l'index d'une URL. Pour la vérifier et obtenir un rapport sur l'état de l'index, vous devrez saisir l'intégralité de l'URL.
Pour voir comment votre site apparaît lorsqu'il est exploré par Google, utilisez l'outil Fetch as Google.
Les propriétaires de sites peuvent ensuite faire des choix plus précis, par exemple en choisissant comment le contenu est indexé page par page.
Par exemple, vous pouvez examiner comment vos sites apparaissent avec ou sans extrait, dans une version en cache, qui est une copie de sauvegarde stockée sur les serveurs de Google au cas où la page en ligne ne serait pas disponible.
L'opérateur info : peut également être utilisé pour examiner l'état d'indexation de n'importe quelle URL de site.
Dans la barre de navigation du navigateur Google Chrome, tapez info:URL.
Vous obtiendrez l'affichage suivant de Google : Afficher le cache “exemple-domaine-url” de Google. Recherchez les sites Web qui sont similaires à “exemple-domaine-url”.
Sur les sites JavaScript, comment fonctionnent les index de Google ?
Lorsque Google doit explorer des sites JavaScript, ceux-ci doivent passer par une étape supplémentaire que le matériel HTML standard ne connaît pas.
Il s'agit de l'étape de rendu, qui prend du temps. Comme les étapes d'indexation et de rendu sont indépendantes, Google peut indexer le contenu non JavaScript en premier.
L'exploration et l'indexation de JavaScript est une procédure plus longue pour Google. La raison en est qu'il doit d'abord être téléchargé, puis analysé, avant d'être exécuté.
Dans les résultats rendus, comment le pré-rendu JavaScript est-il géré ?
GoogleBot a la possibilité d'effectuer un pré-rendu du JavaScript qui sera utilisé dans le résultat affiché.
Du point de vue de l'expérience utilisateur, le géant technologique examine le prérendu de JavaScript.
Cela facilite les choses car il n'est plus nécessaire de supprimer le JS des pages qui ont déjà été rendues. Restez à l'écoute du porte-parole de Google pour l'évolution de la technologie permettant de gérer de telles instances d'exploration/indexation, si votre site s'appuie sur JS pour gérer les petites mises à jour de contenu et de mise en page, mais pas les requêtes AJAX.
Quel rôle joue le processus d'exploration et d'indexation de Google ?
Le facteur le plus important pour la réussite du marketing Internet est de faire en sorte que votre site Web soit scanné et indexé de manière appropriée par Google. C'est tout le point de départ. Pour réussir, vous aurez besoin de l'exploration du Web et de la capacité d'être indexé.
L'exploration peut prendre beaucoup de temps sans sitemap dans le dossier racine de votre site web – jusqu'à 24 heures ou plus pour indexer un nouvel article de blog ou un site web profond.
La majorité des internautes ne sont pas conscients des nombreuses actions que vous avez entreprises pour améliorer la capacité d'exploration et l'indexation de votre site.
Selon Google, “l'index de Google Search comprend des centaines de milliards de pages Web et sa taille dépasse largement les 100 000 000 gigaoctets.”