Création de plan de site en ligne. Un guide détaillé du fichier Sitemap. Comment générer un plan du site et comment fonctionne ce système infernal

Libérer Générateur de plan de site pour rapide création automatique plan du site complet. Il vous suffit de spécifier son adresse et d'exécuter le programme.

Un plan de site se présente généralement sous deux formats :

  1. Comme une page HTML normale, stylisée dans le style de votre site. Ces pages sont davantage destinées aux visiteurs ;
  2. Dans un format spécial pour le transfert de données XML, ce qui est plus pratique pour les robots de recherche.

En utilisant la première version de la carte, vous pouvez trouver une page par son nom et estimer l'échelle du site (en voyant une liste de toutes ses pages).

Et le second permet d'améliorer l'indexation du site par les moteurs de recherche.

Et le générateur de plan de site de WonderWebWare vous offre le nec plus ultra en matière de création de plan de site avec un effort minimal du webmaster.

Caractéristiques du programme

URL(Anglais Uniform Resource Locator) - un moyen d'enregistrer l'adresse d'une page d'un site ou d'un document sur le réseau.

La chose la plus importante que ce programme peut faire est de créer des plans de site dans différents formats(XML, TXT, exporter des liens vers un fichier CSV ou HTML).

Comme un moteur de recherche, après avoir reçu une URL de démarrage, il scanne l'ensemble de votre site et affiche une liste de tous les liens.

Le programme a même un navigateur intégré pour prévisualiser le site.

Autre utilité : le programme peut être utilisé en scannant plusieurs sites à la fois (pas à tour de rôle). Pour ce faire, il suffit de lancer plusieurs fenêtres SiteMap Generator et de travailler avec elles simultanément.

Installation du générateur de plan de site

L'installation du programme est assez standard. Téléchargez l'archive depuis le site et exécutez le fichier d'installation.

En complétant votre site avec un fichier Plan du site Google , Vous faites d'une pierre deux coups : d'abord, Vous Peut être Bien sur c'est que Google indexera toutes les pages de votre site dans ce fichier, et d'autre part, Google scannez ce fichier régulièrement pour la présence de nouvelles pages d'indexation.

Dans cet article, nous aborderons un certain nombre de problèmes liés à Google Sitemap :

  1. Avantages reçus à la suite de la mise en œuvre de Google Sitemap dans leurs activités ;
  2. Qui devrait l'utiliser ;
  3. Comment ça fonctionne;
  4. Comment créer un plan de site Google pour votre site ;
  5. Comment créer une dynamique fichier XML Plan du site Google ;
  6. Outils de génération fichier google Plan du site de tiers.

Avantages reçus à la suite de la mise en œuvre de Google Sitemap dans leurs activités :

  1. Accélérer le processus de découverte et d'ajout de pages de site à l'index Google.
  2. Trouver rapidement par Google les pages du site qui ont subi des modifications.
  3. Garantir des visites de site plus rapides dans les résultats Résultats de recherche Google.
  4. Aider Google à mettre à jour son index avec du nouveau contenu, utilisateurs de google recevoir en réponse à leur Requêtes de recherche contenu pertinent et frais.

Qui doit l'utiliser ?

Tout propriétaire de site peut utiliser Google Sitemap, quel que soit le nombre de pages sur le site, une ou un million. Mais peu importe le plus nécessaire utiliser Google Sitemap pour les propriétaires de ces sites dont les pages subissent des changements très fréquents.

Il arrive généralement qu'un certain nombre de pages du site non indexé, bien que les liens qui y mènent soient correctement reconnus par les robots de recherche. La raison de cela trivial - l'emplacement des liens vers ces pages dans la profondeur du site, c'est-à-dire robot de recherche n'atteint pas ces liens, donc ne trouve pas ces pages. Vous pouvez éviter ce problème en utilisant Plan du site Google.

Rappelles toi: l'utilisation de Google Sitemap ne vous donne pas un avantage de classement !

Comment ça fonctionne?

Les plans de site Google sont construits en utilisant XML (Extensible Markup Language). Ce langage est souvent utilisé dans les flux et les blogs.

Vous trouverez ci-dessous un exemple du XML que vous devez inclure sur chaque page de votre site :


http://www.votresite.com/
2005-07-15
mensuel
0.5

Vous trouverez ci-dessous une description de chaque ligne de code :

  • emplacement- l'adresse de la page Web, par exemple http://www.votresite.com
  • dernière modification- date de dernière modification de page
  • changer de fréquence- indique à Google à quelle fréquence vous actualisez la page Web. Valeurs possibles: jamais, hebdomadaire, quotidien, horaire, mensuel, annuel
  • priorité- définit la priorité que Google attribuera à une page Web spécifique. Valeurs possibles: 0.0 (priorité la plus basse), 1.0 (priorité la plus élevée), 0.5 (priorité moyenne).

Certaines des pages Web de votre site peuvent être surtout prioritaire puisque mis à jour fréquemment, par exemple la page principale (d'accueil) du site, la page des articles, il faut donc leur donner la plus haute priorité...

Je le répète encore une fois - Google Sitemap n'affecte en aucune façon le classement du site.

Comment créer un sitemap Google XML dynamique ?

Si votre site se compose de 1 000 pages ou plus, la création manuelle d'un plan de site Google sera trop longue, ennuyeuse et peu pratique.

Heureusement, Google fournit son propre script appelé Générateur de plan de site, vous permettant de générer très rapidement fichier requis... Ce script est écrit en langage Python, il crée un plan du site pour votre site en utilisant Plan du site Protocole... Ce script peut créer des sitemaps à partir d'une liste d'URL, de répertoires de serveurs Web ou de journaux d'accès.

Outils tiers de génération de plans de site Google

Google fournit également des informations sur d'autres générateurs de plans de site.

Par exemple, j'utilise un générateur de sitemap gratuit. Il est facile à utiliser et génère rapidement le XML requis pour le site.

Vous trouverez ci-dessous un plan étape par étape. création de google Plan du site utilisant l'un des nombreux générateurs de plan de site gratuits :

  1. Rendez-vous sur le site http://www.sitemapspal.com et saisissez l'adresse de votre site dans le formulaire situé tout en haut de la page du site
  2. Cliquez sur Soumettre
  3. Copiez le code généré pour votre site et collez-le dans un fichier texte de bloc-notes propre
  4. Enregistrez ce fichier texte sous plan du site.xml
  5. Téléchargez ce fichier dans le répertoire racine de votre site (où se trouve la page d'accueil du site)
  6. Dans la barre d'adresse de votre navigateur, saisissez le chemin complet du fichier généré, par exemple http://www.votresite.com/sitemap.xml. Si vous avez tout fait correctement, vous verrez une liste d'URL et aucune erreur
  7. Ouvrez maintenant votre Compte Google Sitemap et ajoutez ce chemin (à partir du point 6) dans la colonne appropriée de votre compte
  8. Suivez ces étapes pour chacun de vos sites.

Résumé

Google est le plus grand et le plus populaire moteur de recherche partout sur Internet. Chaque année, des millions de sites Web sont indexés par Google, ce qui rend naturellement difficile la recherche de votre site dans les résultats des moteurs de recherche (SERP). Alors créez et commencez à utiliser Plan du site Googleà l'heure actuelle.

Nous avons publié un nouveau livre « Le marketing de contenu dans dans les réseaux sociaux: Comment entrer dans la tête des abonnés et tomber amoureux de votre marque."

Plan du site XML

Le plan du site est un fichier spécial au format .xml stocké dans le répertoire racine du serveur. Les propriétaires de sites sont souvent intéressés par les raisons pour lesquelles un plan du site est nécessaire et la présence / l'absence de ce document affecte-t-elle la promotion des moteurs de recherche ? Pour répondre à ces questions, réfléchissez à l'objectif et à la structure d'un plan du site.

Alors, pourquoi avez-vous besoin d'un plan de site XML, qu'est-ce que c'est ? Un plan du site est une sorte de répertoire constitué d'une liste de liens menant à toutes les sections et pages du site. Le fichier Sitemap aide les moteurs de recherche à indexer un projet Internet plus rapidement et plus efficacement. Ceci est particulièrement important si le volume d'une ressource Web est calculé en milliers ou dizaines de milliers de pages.

Plus de vidéos sur notre chaîne - apprenez le marketing Internet avec SEMANTICA

C'est important! Le plan du site ne doit inclure que les pages qui doivent être dans index de recherche... Les documents dont l'indexation ou les informations de service sont interdites ne doivent pas être inclus dans le plan du site. Le plan du site exclut également les pages balisées et les URL dynamiques.

Le plan du site affecte-t-il la promotion ?

Les moteurs de recherche ne pessimiseront pas le projet Internet pour l'absence de ce fichier. En théorie, le robot devrait explorer indépendamment toutes les pages du site et les inclure dans la recherche. Cependant, il convient de garder à l'esprit que le système peut se bloquer et ne pas trouver certains documents Web. En règle générale, les « zones à problèmes » sont des sections qui ne peuvent être atteintes que par une longue chaîne de liens et des URL générées dynamiquement.

Du point de vue du référencement, un plan du site a un impact certain car le plan du site accélère considérablement l'indexation. Cela augmente également la probabilité que les pages Web soient indexées avant que des concurrents peu scrupuleux ne puissent copier et publier le contenu. Les moteurs de recherche privilégient la source originale, tandis que le copier-coller est pessimiste.

Comment créer un site Web cartographique

Le moyen le plus simple est d'utiliser l'un des services spécialisés. Par exemple, le générateur en ligne http://www.mysitemapgenerator.com/ vous permet de créer gratuitement un plan de site jusqu'à 500 pages. Il existe une possibilité de génération de plan de site payante sans aucune restriction. Le webmaster n'aura qu'à préciser l'adresse de son site, puis placer le fichier résultant dans le dossier racine du serveur.

Vous pouvez utiliser le programme SiteMap Generator. Entrez l'adresse dans le champ http: // page de démarrage site, cliquez sur le bouton "démarrer" et attendez que le plan du site soit généré. Ensuite, vous devez vous rendre dans l'onglet "Google Sitemap / XML", copier le code obtenu et le coller dans le fichier .xml.

Plan du site xml - directives disponibles

  • Le paramètre Lastmod indique au robot quand le document dernière fois mis à jour.
  • La balise priory indique la priorité du document par rapport aux autres pages du site.
  • Le paramètre loc indique l'URL de la page.
  • La balise changefreq est utilisée pour indiquer la dynamique de la page (le robot visitera rarement les documents avec le paramètre "0").

Comment informer un moteur de recherche sur un plan du site

Pour notifier Yandex, vous pouvez ajouter la directive sitemap à votre fichier robots.txt. Le code ressemblera à ceci :

Plan du site : http://votresite.ru/sitemap.xml

De plus, vous pouvez télécharger un plan du site via l'interface Yandex.Webmaster. Pour ce faire, accédez à l'onglet Paramètres d'indexation >> Fichiers du plan du site, puis spécifiez l'adresse du plan du site au système.

De même, vous pouvez notifier Google. Dans la barre d'outils pour les webmasters, allez dans l'onglet "Crawl" >> "Sitemaps".

Cet article vous montrera comment créer un plan de site et fournir Accès Googleà lui.

Création et soumission de plans de site

Formats de fichier de plan de site

Google prend en charge plusieurs formats de plan de site, décrits ci-dessous. Tous les formats doivent utiliser un protocole standard. Google ne prend actuellement pas en charge l'attribut Plans du site.

Tous les formats sont soumis aux restrictions suivantes : un fichier Sitemap ne peut pas contenir plus de 50 000 URL et sa taille non compressée ne doit pas dépasser 50 Mo. Si la taille du fichier ou le nombre d'adresses répertoriées dépasse ces limites, divisez-le en plusieurs parties. Vous pouvez créer un fichier d'index de plan de site répertoriant tous les plans de site qu'il contient et les soumettre à Google en une seule fois.

Fichier texte

Si votre plan de site ne contient que des URL de page, vous pouvez soumettre à Google un fichier texte brut avec ces URL (un par ligne). Exemple:

Http://www.example.com/file1.html http://www.example.com/file2.html

  • Vous devez utiliser l'encodage UTF-8.
  • Le fichier ne doit pas contenir autre chose qu'une liste d'URL.
  • Cette fichier texte vous pouvez donner n'importe quel nom, mais vous devez utiliser l'extension .txt (par exemple, sitemap.txt).

Google Sites

Si le site a été créé et vérifié à l'aide de Google Sites, le plan du site est généré automatiquement. Il ne peut pas être modifié, mais il peut être soumis à Google pour recevoir des informations pour les rapports. Veuillez noter que si un sous-répertoire contient plus de 1000 pages, le plan du site peut ne pas s'afficher correctement.

  • Si vos pages sont hébergées sur Google Sites, le plan du site doit être situé à l'adresse http://sites.google.com/site/ VashSait / système / flux / plan du site.
  • Si le site a été créé avec Google Apps L'URL du plan du site doit ressembler à ceci : http://sites.google.com/ VashDomen /VashSait / système / flux / plan du site.

Extensions de fichier de plan de site

Google prend en charge la syntaxe étendue du plan de site pour les types d'informations ci-dessous. Il peut être utilisé pour ajouter des descriptions de vidéos, d'images et d'autres contenus afin d'améliorer son indexation.

Vous pouvez très facilement créer votre plan de site. Saisissez d'abord votre URL, puis sélectionnez les paramètres que vous souhaitez modifier. (fréquence de changement, date de dernière modification et priorité de la page. Vous pouvez également modifier les paramètres par défaut pour les extensions d'exclusion, ne pas analyser les extensions et les identifiants de session. Dans les champs suivants, vous pouvez déclarer les URL que vous souhaitez exclure du plan du site (voir l'exemple ci-dessous). Enfin, vous pouvez sélectionner le nombre maximum de pages et le niveau de profondeur. En option, vous pouvez choisir de créer des plans de site supplémentaires, comme un plan de site ROR, un plan de site HTML ou un plan de site TXT.

Qu'est-ce que la « fréquence de changement de page » ?
La fréquence des changements affecte quand et à quelle fréquence les robots des moteurs de recherche visitent les pages de votre site. Il peut avoir l'une des sept valeurs suivantes : toujours, toutes les heures, tous les jours, toutes les semaines, tous les mois, tous les ans, jamais. Cela indique aux moteurs de recherche à quelle fréquence chaque page est mise à jour. Une mise à jour fait référence aux modifications réelles apportées au code HTML ou au texte de la page.

Qu'est-ce que la « Dernière date de modification » ?
Ce paramètre peut prendre l'une des trois valeurs suivantes :
Réponse du serveur. Définissez la date de la dernière modification du fichier à l'aide des en-têtes de réponse du serveur. Cette valeur donne aux robots d'exploration les informations nécessaires pour ne pas réexplorer les documents qui n'ont pas changé. Nous vous recommandons de conserver ce paramètre.
Heure actuelle. Définissez la date de la dernière modification du fichier en utilisant la date et l'heure actuelles.
Rien. N'utilisez aucune valeur pour Dernière modification des fichiers.

Qu'est-ce que la « priorité de la page » ?
La priorité est définie sur un nombre compris entre zéro et un. Si aucun numéro n'est attribué, la priorité est définie sur 0,5. Ce nombre détermine la priorité d'une URL particulière par rapport aux autres pages du même site. Une page à haute priorité peut être indexée plus souvent et apparaître au-dessus d'autres pages du même site dans les résultats de recherche. La priorité automatique réduit la priorité d'une page en fonction du niveau de profondeur.

Qu'est-ce que le « niveau de profondeur » ?
Le niveau de profondeur d'une page signifie à combien de clics se trouve cette page de la page d'accueil.

Qu'est-ce que "Exclure les extensions" ?
Les fichiers avec ces extensions trouvés dans les pages de votre site Web ne sont pas inclus dans le plan du site (non explorés). Séparez les valeurs d'entrée avec des espaces.

Qu'est-ce que "Ne pas analyser les extensions" ?
Les fichiers avec ces extensions ne seront pas récupérés afin d'économiser de la bande passante, car ce ne sont pas des fichiers html et n'ont pas de liens intégrés mais seront inclus dans le plan du site. Séparez les valeurs d'entrée avec des espaces.

Qu'est-ce que les « ID de session » ?
Si les URL de votre site contiennent des identifiants de session, vous devez les supprimer. L'inclusion d'ID de session dans les URL peut entraîner une exploration incomplète et redondante de votre site. ID de session communs : PHPSESSID, sid, osCsid. Séparer avec des espaces.

Qu'est-ce que « Exclure les URL » ?
Les URL qui contiennent ces chaînes (ou regex) ne seront pas incluses sur le plan du site. Valeurs d'entrée une par ligne.
par exemple. 1 Utilisez la chaîne : composant / afin d'exclure toutes les pages de www.votresite.com/component/
Si regex, ajoutez à la fin : \s* (exemple : blo\s*)
par exemple. 2 Si vous possédez l'un des sites Web suivants, vous pouvez exclure ces chaînes : (copier et coller dans la zone Exclure les URL)

Vous avez aimé l'article ? Partager avec des amis: