Qu'est-ce que le spam des moteurs de recherche (spamdexing) ? Qu'est-ce que le spam des moteurs de recherche

Nous avons publié un nouveau livre « Le marketing de contenu dans dans les réseaux sociaux: Comment entrer dans la tête des abonnés et tomber amoureux de votre marque."

S'abonner à

Spam des moteurs de recherche - tromper l'utilisateur

Qu'est-ce que le spam des moteurs de recherche et comment le reconnaître ? Du point de vue d'une personne ordinaire, le spam est logiciel publicitaire intrusif, qui apparaît à la place des informations que l'utilisateur essaie de trouver. À la base, le spam de recherche ou le spam Web est une tentative de manipuler les résultats du SERP généré afin de le promouvoir dans le TOP 10 des sites de mauvaise qualité. Leur contenu est souvent peu informatif ou ne répond pas aux besoins de l'utilisateur.

Plus de vidéos sur notre chaîne - apprenez le marketing Internet avec SEMANTICA

Quels sont les types de spam de recherche

Il existe une certaine classification des moteurs de recherche par rapport au spam. Yandex et Google exhortent les webmasters et les référenceurs à s'abstenir des méthodes de promotion suivantes.

1. Nombre excessif de phrases clés dans le texte. Il s'agit d'une tentative de « gonfler » le texte avec des clés autant que possible afin de gonfler sa position dans la recherche. Comment identifier les spams de ce genre? Cela peut se faire selon certains signes :

  • la présence de texte généré automatiquement ;
  • répétition répétée de certaines phrases;
  • allocation de clés avec des balises , ;
  • la présence de texte caché qui se confond avec le fond de la page.

2.. Ce terme fait référence aux pages Web intermédiaires qui redirigent un visiteur vers un autre site. Le plus souvent, une porte est un site d'une page optimisé pour une liste de phrases clés. Les portes sont créées à l'aide d'outils tels que DMI, SEoDOR.

3. Lien spam. Afin d'augmenter le « poids », un webmaster peut essayer d'utiliser du spam de liens, ce qui comprend :

  • achat en masse d'hyperliens à partir d'échanges automatiques ;
  • liens de spam reçus de blogs, forums, livres d'or ;
  • créer un réseau de petits.

Le spam des moteurs de recherche et ses conséquences

Les moteurs de recherche améliorent leurs algorithmes de manière à exclure si possible les ressources Internet de spam des résultats de recherche. Les méthodes de pessimisation appliquées aux webmasters peu scrupuleux dépendent du type de violation. Par exemple, une concentration excessive de mots-clés dans le texte entraîne une diminution des résultats d'un seul document. Dans le même temps, le reste du site continue de fonctionner normalement.

Des portes découvertes moteur de recherche sera interdit. Le sort des sites satellites destinés à promouvoir la principale ressource Internet dépend de leur qualité. Si un webmaster a créé un satellite en utilisant des textes uniques et de plus ou moins haute qualité, alors un tel site peut rester dans la recherche.

L'achat excessif de liens menace de pessimiser la ressource Web promue. Afin de lutter contre les tentatives de manipulation Résultats de recherche y, Yandex a lancé l'algorithme Minusinsk en mai 2015.

Chaque année, le nombre de sites placés sur Internet augmente de façon exponentielle. En conséquence, la concurrence pour une place dans le TOP est fortement accrue (en particulier pour les requêtes à haute fréquence).

Les webmasters et les référenceurs sont obligés d'utiliser une variété de méthodes afin de promouvoir leurs propres sites (leurs ressources) dans une concurrence sans cesse croissante.

Et certaines de ces méthodes sont partiellement ou totalement interdites par les moteurs de recherche.

De nombreux utilisateurs connaissent eux-mêmes le spam, mais tout le monde ne connaît pas le spam de recherche.

Spam des moteurs de recherche - qu'est-ce que c'est ?

Le nom commun des techniques d'optimisation interdites que certains webmasters utilisent parfois est le spam de recherche.

Ce nom est dû au fait que les résultats de recherche sont spammés avec des pages au contenu non pertinent en raison de l'utilisation de méthodes de promotion malhonnêtes. En d'autres termes,

Le spam de recherche, c'est quand, à la demande de l'utilisateur, est renvoyé un contenu qui ne correspond pas à cette demande (selon l'utilisateur) et qui ne devrait pas être dans le TOP (selon le moteur de recherche).

La présence de telles pages de spam dans les résultats de recherche affecte négativement l'attitude des gens envers les moteurs de recherche, réduit leur degré de confiance.

Types de spam de recherche

Qu'est-ce que le spam de recherche ? Listons ses principaux types.

  1. Bourrage de contenu mots clés et phrases

Les touches "aux yeux" peuvent être remplies (bourrées) le texte lui-même, ainsi que des descriptions pour les images et les fichiers vidéo, les balises méta, etc.

Tout cela est fait dans l'espoir que l'algorithme du moteur de recherche trouvera la page la plus pertinente pour les mots-clés donnés. En fait, cette méthode d'optimisation SEO n'a pas fonctionné depuis longtemps. Les webmasters qui l'utilisent sont plus susceptibles d'obtenir une interdiction pour leur site qu'une augmentation de sa position dans le SERP.

  1. Redirection automatique

Il redirige instantanément les utilisateurs d'une page à une autre.

Dans ce cas, lors de la saisie d'une page d'un site, une personne est instantanément redirigée vers un autre site.

Souvent, l'utilisateur n'a même pas le temps de remarquer la redirection elle-même (puisqu'elle se produit automatiquement et très rapidement). Le plus souvent, après une redirection, une personne se retrouve sur une page de contenu publicitaire qui est spammée avec des liens.

  1. Cloaque

Dans ce cas, pour chacune des pages promues, le webmaster crée deux versions à la fois.

  • La première version de la page est destinée aux moteurs de recherche,
  • la deuxième version est destinée aux utilisateurs ordinaires.

Ainsi, cloaca est un contenu différent pour les moteurs de recherche et pour les utilisateurs.

Un mécanisme spécial permet de savoir qui visite exactement le site - un robot de moteur de recherche ou une personne ordinaire. Sur cette base, telle ou telle version de la page est émise.

La page pour les moteurs de recherche est très soigneusement optimisée, il manque tout éléments supplémentaires et des détails, mais il y a des tonnes de mots-clés pour les moteurs de recherche. La page pour les visiteurs ordinaires est rendue normale, aussi pratique et belle que possible (en termes de design et d'apparence).

Et il semble que "les loups sont nourris et les moutons sont en sécurité", c'est-à-dire que les moteurs de recherche sont heureux et les utilisateurs sont heureux. Mais en fait, en utilisant cloaca, le webmaster trompe le moteur de recherche, qui, à son tour, ne pardonne pas de telles choses et bannit les pages "fourchues".

  1. Échanger

Ce terme signifie un remplacement complet du contenu d'une page de site immédiatement après son indexation réussie dans les moteurs de recherche. La tâche principale d'un webmaster ou d'un optimiseur utilisant l'échange est de remplir la page avec des informations uniques et contenu de qualité, faites-en la promotion dans le SERP et obtenez un bon trafic des moteurs de recherche.

Puis, après la prochaine mise à jour (mise à jour périodique du moteur de recherche), le webmaster modifie complètement le contenu de sa page. Au lieu d'un contenu unique, du texte y apparaît, bourré de clés et de liens vers des ressources promues (sites).

Il est clair qu'à la prochaine mise à jour, les moteurs de recherche détecteront une substitution et pessimiseront la page. Mais jusque-là, il continuera à collecter du trafic (visiteurs), étant dans le TOP pendant un certain temps.

  1. Texte et liens invisibles
  • de très petites polices peuvent être utilisées,
  • vous pouvez faire en sorte que la couleur de la police et la couleur de fond de la page soient identiques (par exemple, du texte blanc sur un fond blanc),
  • des règles spéciales peuvent être utilisées Styles CSS pour masquer les liens.
  • Vous pouvez insérer des images à un seul pixel contenant un lien, etc. dans une page.

Comment les moteurs de recherche combattent le spam de recherche

Les moteurs de recherche n'aiment pas le spam de recherche non seulement pour tromper, mais principalement parce que le spam de recherche induit l'utilisateur en erreur, l'utilisateur est mécontent et laisse donc (peut partir) chercher des informations sur sa demande vers un autre moteur de recherche. Les moteurs de recherche se battent pour leurs utilisateurs, ils essaient donc de ne pas le décevoir et, en réponse à ses demandes, ne donnent que des informations de haute qualité.

Cette approche implique une lutte inconciliable entre les moteurs de recherche et le spam des moteurs de recherche. Les moteurs de recherche essaient de trouver le spam, de le supprimer de leur base de données et de punir (interdire) un tel site ou une telle page.

Quant aux moyens de détecter le spam de recherche, il n'y en a que trois.

1) Automatique

Dans ce cas, la détection du spam de recherche est effectuée au moyen d'algorithmes de moteur de recherche. Sur la base des signes de tel ou tel type de spam, une recherche est effectuée pour les sites qui utilisent des méthodes de promotion malhonnêtes, et leur pessimisation ultérieure.

2) Semi-automatique

Dans ce cas, la tâche des algorithmes de recherche est de trouver des sites et des pages suspects. La décision finale d'interdire ou de pessimiser le site est prise par le modérateur () du moteur de recherche.

3) Manuel

Ici, le site est contrôlé du début à la fin par un modérateur (évaluateur) pour vérifier son implication dans l'utilisation du spam de recherche. Le plus souvent, ces vérifications ont lieu sur la base de plaintes émanant de propriétaires de sites Web concurrents.

Le spam dans le référencement

Les moteurs de recherche, comme vous le savez, n'aiment pas chaque tentative d'influencer leurs algorithmes. Dans le même temps, par exemple, Yandex lui-même dans son guide pour les webmasters décrit des moyens d'améliorer le classement du site. On ne peut pas dire que ces méthodes conduisent à une manipulation du problème. Mais si chacun d'eux est quelque peu renforcé, alors le soi-disant. recherche de spam, ou alors spamdexing.

Dans J'ai déjà mentionné certains des moments "sombres" optimisation du moteur de recherche, conduisant d'abord au décollage du site, puis à sa chute brutale voire à sa disparition totale.

Avec le spam de recherche, c'est à peu près la même chose, mais cela ne peut pas être attribué spécifiquement au référencement noir, car certaines de ses méthodes ne conduisent qu'à la pessimisation (dégradation du classement) du site et, non à sa mort complète. De plus, de nombreux webmasters, etc. Les référenceurs utilisent inconsciemment le spamdexing (soit par manque d'expérience, soit par surabondance).

Spam sur Internet

Cela vaut probablement la peine de révéler le concept Spam généralement. Initialement, le mot anglais "" signifiait recevoir des lettres indésirables à vous-même le e-mail... En règle générale, le contenu de ces lettres est de nature commerciale avec une offre d'adhésion à n'importe quelle entreprise. Ou un exemple classique - "Donnez-nous vos données personnelles afin que nous puissions vous envoyer 1 000 000 $"

Eh bien, au fil du temps, tous les messages indésirables et non naturels (par exemple, dans les réseaux sociaux et les forums) ont commencé à être classés comme spam. En d'autres termes, ce sont des messages avec le désir de tricher et d'obtenir des avantages.

Qu'est-ce que le spam des moteurs de recherche

Il est logique que le spamdexing soit une tentative de tromper les moteurs de recherche. La licence d'utilisation du moteur de recherche Yandex dit :

Définition de Yandex pour le spam

Ces méthodes peuvent être classées comme très difficiles, du domaine du référencement noir - création de porte, masquage, masquage de texte, et des méthodes plus douces :

  • Inclusion dans mots-clés et description des balises méta un grand nombre de mots-clés et, ou de mots, en général ne pas lié au contenu de la page (mais très populaire pour les requêtes de recherche). Par conséquent, soit dit en passant, il a perdu son sens. Peut-être qu'à l'heure actuelle, l'utilisation détournée de mots-clés n'entraînera pas de conséquences négatives pour le site, mais vous devez être plus prudent.
  • Sursaturation des textes des articles. Cela indique clairement aux moteurs de recherche la présence de spam des moteurs de recherche.
  • Le même que dans le paragraphe précédent + "bourrer" tous ces mots et phrases dans balises d'accent (gras italique). Informe directement les moteurs de recherche sur le spamdexing.
  • Lien spam... Tout ici est simple et clair - obtenir des liens artificiels vers votre ressource. Bon lien, du point de vue d'un moteur de recherche, devrait être une recommandation de visiter tel ou tel site... Et si ce site essaie de l'obtenir pour lui-même, et même pas toujours de "belles" manières, alors il spam. Bien sûr, il est pratiquement impossible de pousser dans le TOP (c'est possible, mais pour longtemps) sans liens externes, les liens externes doivent donc être obtenus judicieusement.
  • Nouvelle tendance dans le spam de recherche - impacter. Elle s'effectue de plusieurs manières : 1) Utilisation de programmes qui émulent le comportement des utilisateurs dans les résultats de recherche 2) Attirer les utilisateurs afin qu'ils, contre récompense, représentent un intérêt pour un site, pour.

Qu'est-ce que ce spam des moteurs de recherche, ou en d'autres termes, qu'est-ce qui ne vaut pas la peine de faire pour que votre site ne soit pas pénalisé par les moteurs de recherche. Je dois dire tout de suite que bon nombre de ces types de spam de recherche ne fonctionnent plus, mais vous devez les connaître.

1. La première chose à dire à un débutant est l'opportunité sursaturation du texte avec des mots-clés... En principe, les robots ont déjà appris à sélectionner des mots-clés dans le texte et à compter le nombre de ces mots-clés dans le texte. Si leur nombre dépasse une certaine valeur, le site est condamné à une amende. Au-dessus de quelle valeur vous ne devriez pas augmenter - je ne le dirai pas avec certitude, ces chiffres changent constamment. 3 à 5 occurrences directes du mot-clé dans un texte de 1000 caractères suffiront.

2. Texte généré automatiquement... En principe, les débutants en matière de blogs utilisent rarement cette méthode, mais elle est utilisée par les fans d'un billet de faveur rapide. Ceci, bien sûr, attire immédiatement l'attention non seulement sur l'utilisateur mais aussi sur la machine. Maintenant, comme pour moi, ce type de spam de recherche n'est pas rentable.

3. Texte invisible- du texte, dans lequel, en règle générale, la liste des mots-clés est écrite dans la même couleur que le fond. Un utilisateur rare échouera, mais pour moteur de recherche le texte est toujours là et les mots-clés sont pris en compte. Ou en général, juste un petit caractère qu'il sera impossible de le lire. Peu importe.

4. Portes- eh bien, tout est simple, une page prise séparément qui est facilement détorsadée, créée spécifiquement pour rediriger l'utilisateur vers le site cible. Si vous créez un site porno avec un bouton "en voulez plus", lorsque vous cliquez dessus, l'utilisateur sera transféré vers un autre site, par exemple, une boutique en ligne vendant des éléphants roses. C'est aussi le spam des moteurs de recherche. Et peu importe comment l'utilisateur sera redirigé vers un autre site. L'utilisation d'un lien dans un menu ou un script java n'est pas non plus un vanjo.

5. Masquage- tout est simple ici, affichant une information à l'utilisateur, et une autre au moteur de recherche. En passant du mot anglais "cloak" - cacher. Soit dit en passant, c'est l'une des technologies utilisées par les portes. Même Google ou Yandex affiche des informations à différents utilisateurs Des informations diverses, en fonction de la géolocalisation. Par exemple, allez sur yandex.ru, et il y aura la météo dans votre ville, une recherche dans votre ville, etc. C'est aussi une technologie. Ce n'est que lorsque différents utilisateurs sont affichés différemment en fonction de leur emplacement géographique qu'il n'est pas pareil si différents utilisateurs et moteurs de recherche affichent des choses différentes. C'est déjà un type de spam de recherche.

6. Clonage- ici, il s'agit plutôt de boutiques en ligne, bien que des blogs existent et soient promus aujourd'hui de cette manière. À quoi ça sert?. Tout le monde crée simplement deux sites similaires avec des conceptions différentes, mais les mêmes services et des contacts différents (enfin, vous commencerez deux ICQ). Vous faites la promotion des deux sites pour une seule demande et commencez à manger à deux gorges.

7. Lien spam- il s'agit d'un échange massif de liens, vous pouvez également inclure ici l'achat de liens, en tant que type de promotion de site Web le plus courant utilisant le spam de recherche.

Lorsqu'ils effectuent des travaux d'optimisation de site, de nombreux spécialistes du référencement "se laissent emporter" et transforment l'optimisation interne en un spam de recherche pur et simple avec des balises html redondantes, des mots-clés, des listes de requêtes de recherche, etc. Ci-dessous, nous présentons les principaux signes de recherche de spam pour un document ordinaire sur un site commercial. Ces facteurs méritent d'être pris en compte lors des travaux d'optimisation.

Quand un document peut-il être considéré comme du spam ?

Titre et balises méta

1. Le titre du document dépasse 12 mots ou 120 caractères.

2. Meta name = "description" est plus long que 40 mots ou 250 caractères.

3. Meta name = "keywords" est plus long que 40 mots ou 250 caractères.

Texte du document, contenu

4. La densité d'occurrence de n'importe quel mot dépasse 3-4%, avec un volume de texte de plus de 1 000 caractères (pour les textes plus petits - 4-5%).

5. La page contient des listes de requêtes de recherche, répertorie les phrases par lesquelles les visites de ce document ont été effectuées.

6. Le document est le résultat de la recherche sur le site.

7. Le document duplique (en grande partie) le contenu d'un autre, afin d'attirer du trafic de recherche, sans valeur ajoutée pour les utilisateurs.

8. Il y a abus des balises d'allocation logique/physique. Exemples de balises similaires : , , , , ,

-
et d'autres.

9. La page n'affiche aucun informations utiles... Exemple : le message « Article introuvable dans le catalogue » s'affiche avec le code de réponse du serveur 200 OK.

10. Le contenu et le titre du document sont trompeurs pour les visiteurs. Disons que le titre indique que la page contient des « photos et vidéos », mais pas le contenu.

11. La page est hébergée sur le site d'une pseudo-entreprise, c'est-à-dire un site qui prétend être une véritable organisation, mais ce n'est pas le cas (il n'y a pas de vrais contacts, mauvaise qualité de l'ensemble de la ressource et du design en particulier) .

12. Le texte sur la page est reconnu comme un programme/robot généré et/ou simplement de très mauvaise qualité avec l'absence de toute information précieuse pour les visiteurs.

Redirections

13. Le document effectue une redirection (redirection de tout type) afin d'induire en erreur les utilisateurs ou le moteur de recherche.

14. Le document n'a pas de valeur indépendante et a été créé dans le but de redistribuer le trafic vers des pages/ressources tierces.

Code source et liens

15.Dans code source il y a plusieurs occurrences du document phrase clé(plus de 15-20), y compris les attributs "alt", "title" pour les images, "Hint", "ToolTip" et toute autre occurrence.

16. Il y a du texte dans le code qui n'est pas affiché sur la page ou qui s'affiche de manière incommode pour la lecture. Cela peut être aussi simple Texte caché et méthodes de masquage partiel - défilement incommode, changement d'onglet et autres.

17. Le document renvoie à des pages/sites au contenu délibérément faux/spam. Il peut s'agir de partage de fichiers frauduleux ou d'autres sites frauduleux.

FAQ

mais. " Tous les sites ont-ils les mêmes critères ?»

Nous pouvons dire non. De nombreux algorithmes des moteurs de recherche sont normalisés par rapport aux indicateurs généraux du site (facteurs d'hôte), donc si pour un site une combinaison donnée entraîne une diminution du niveau de pertinence, alors pour un autre, les problèmes peuvent ne pas être observés. Comme vous le savez, les jeunes projets à faible taux de fréquentation et de citation sont les plus sujets aux sanctions.

b. " Cela signifie-t-il que si vous Pages de titre en 13-18 mots, est-ce considéré comme du spam par le moteur de recherche ?»

Pas nécessairement, le fait est que chaque facteur n'apporte qu'une certaine contribution à la classification finale, et les décisions sont prises sur la base d'une combinaison de facteurs.

dans. " Il s'avère que le titre et les méta-tags ne doivent en aucun cas être plus longs que les valeurs spécifiées ?»

Pas exactement, il y a une confrontation entre la pertinence et les algorithmes anti-spam. Parfois, un titre de 13 à 20 mots fournira plus grande importance visibilité du document qu'un titre de 12 mots ou moins, en raison d'un meilleur classement par requêtes basse fréquence... La décision dans ces cas doit être prise individuellement.

En ce qui concerne les balises meta description et mots-clés, la probabilité d'être pénalisé pour leur contenu de spam est minime, tout comme l'avantage probable.

G. " Qu'en est-il du texte défilant, est-ce du spam à 100 % ?»

Les pénalités pour placer du texte dans un défilement maladroit et/ou changer d'onglet sont rares, et plus souvent appliquées sur une base individuelle. Ici, tout d'abord, il faut partir de la facilité de lecture de ce texte, si le texte peut être lu facilement, alors il est peu probable que les sanctions s'ensuivent.

etc. " Un texte écrit par un humain (copywriter) peut-il être reconnu comme généré par un robot ?»

Oui, de telles situations se produisent, surtout lorsque le rédacteur produit des textes de très mauvaise qualité ou que le matériel est sursaturé Requêtes de recherche"Au-dessus du toit".

e." Dans quel cas le moteur de recherche pense-t-il que la page répertorie les listes de requêtes de recherche ?»

Le plus souvent, il s'agit d'énumérations explicites de la forme : "Nous avons été trouvés par des requêtes" ou "La page a été visitée par des phrases", mais parfois, caractéristique donnée peut être attribué à des textes fortement optimisés.

Vous avez aimé l'article ? A partager entre amis :