Qu'est-ce que le nouvel algorithme Yandex ? Yandex "Korolev". À quoi s'attendre du nouvel algorithme Yandex et comment s'y adapter. Comment fonctionne l'algorithme de Korolev

Après la présentation du nouvel algorithme Yandex « Korolev » le 22 août, de nombreux spécialistes du référencement se sont inquiétés d'une éventuelle baisse du trafic sur le site. D’un autre côté, si le trafic de recherche sur certains sites diminue, d’autres connaîtront une augmentation.

Mais voyons ensemble si tout est si effrayant.

À propos, sur la base des données de Yandex Metrica, nous constatons que de nombreux utilisateurs saisissent la requête « Comment activer Yandex Korolev ? » et visitez notre article. En fait pas besoin d'allumer quoi que ce soit, ce nouveau système de classement fonctionne déjà automatiquement pour tout le monde.

Qu'est-ce que l'algorithme Yandex Korolev ?

En substance, "Korolyov" est une version gonflée Palekha, dont le travail repose sur la reconnaissance de sens à l'aide d'un réseau neuronal. Si Palekh ne pouvait reconnaître que les titres et traiter jusqu'à 150 documents, alors Korolev évalue tout le texte de la page et peut traiter plus de 200 000 pages.

Le blog officiel précise également que les changements ne concernent pas seulement l'application réseaux de neurones pour la recherche non pas dans les mots, mais dans le sens, mais aussi dans l'architecture même de l'index des résultats de recherche.

Comment fonctionne l'algorithme de Korolev

Selon les créateurs de l'algorithme, cela nous permettra de passer à un tout autre niveau de compréhension du sens des demandes des utilisateurs. Désormais, la page entière du site sera évaluée avec vecteur sémantique Requêtes de recherche.

Lorsqu'un utilisateur saisit une requête, le moteur de recherche doit comprendre quelle page et quel titre y correspond le plus. Pour ce faire, la requête et le titre sont convertis en une multiplication de vecteurs, et plus le résultat est grand, plus la page est pertinente par rapport à la requête. Au moment de générer une réponse à une requête, le texte des en-têtes et des requêtes est instantanément converti en vecteurs et comparé. Cela permet d'identifier d'éventuelles connexions de sens, mais nécessite en même temps une énorme puissance de calcul. C'est ainsi que fonctionne Palekh.

Qu'a-t-on fait pour améliorer ses performances ? L'algorithme de Korolev effectue un calcul préliminaire des vecteurs, qui permet de ne pas charger le serveur lors de la requête elle-même, mais de prendre un résultat tout fait. De plus, comme mentionné ci-dessus, Korolev convertit non seulement le titre de la page, mais également l'intégralité de son contenu en vecteur sémantique.

Mais vous devez comprendre que « Korolev » n’est pas un algorithme révolutionnaire de classement de sites Web qui bouleverserait les résultats de recherche Yandex. Il s'agit d'un complexe de solutions déjà mises en œuvre, améliorées à l'aide des réseaux de neurones et de l'expérience utilisateur.

Qu'est-ce qui attend l'industrie après la sortie de « Korolev » ?

Pour le moment, il n’y a aucun changement global dans les résultats de recherche et il est peu probable qu’ils se produisent dans un avenir proche. Par exemple, dans la recherche, il existe encore de nombreuses pages qui répondent aux requêtes synonymes « intérieur de cuisine » et « design de cuisine », en utilisant différentes pages où il y a une occurrence directe de la clé.

Les vrais changements se produiront lorsqu’il ne sera plus nécessaire de collecter une base de données pour une « grosse » requête. requêtes basse fréquence, écrivez sous eux un texte de 10 000 caractères.

1. Utilisateurs

Du point de vue des utilisateurs, il peut être étrange que des requêtes de sens identique mais d'orthographe différente produisent des résultats différents. De nombreux utilisateurs soumettent des requêtes à un moteur de recherche comme s’ils la posaient à un ami. Le nouvel algorithme permettra de répondre plus facilement à ces demandes.

2. Webmasters

Dans un monde idéal, les webmasters créeraient de bons produits, créeraient du contenu de qualité et ne penseraient pas spécifiquement à promouvoir leur site dans les moteurs de recherche. En réalité, ils doivent souvent adapter les textes et le site lui-même aux moteurs de recherche.

3. Spécialistes du référencement

Certaines des méthodes qui permettaient auparavant de promouvoir des sites Web (par exemple, la rédaction SEO) ne donneront plus un tel effet. Bien sûr, il y aura des tentatives pour déjouer le nouvel algorithme, mais une partie des efforts visera à créer un contenu de qualité.


Il est trop tôt pour juger de la qualité du nouvel algorithme, mais plus il donnera de réponses, meilleur il s’améliorera. Par conséquent, à long terme, les utilisateurs devraient ressentir la différence.

De quel genre de machine s'agit-il ?

Avec l'introduction et la croissance du niveau de QI des réseaux de neurones dans les moteurs de recherche, la qualité et la pertinence du contenu renvoyé augmenteront de façon exponentielle. La machine peut analyser le contenu visuel et comprendre le sens des mots et des expressions.


Une tentative d’intégrer dans des pages des actualités populaires qui n’ont pas de relation sémantique directe avec le sujet de la niche de la ressource entraînera l’exclusion des résultats de recherche.

Avantages

Le principal avantage d’un réseau neuronal n’est pas qu’il puisse analyser, mais qu’il puisse apprendre et mémoriser. Autrement dit, les ressources qui, au choix des utilisateurs, ne répondent pas aux attentes des résultats de recherche disparaîtront également progressivement des résultats de recherche.

Autrement dit, la machine enregistre que pour la requête A, le nombre d'utilisateurs concerné clique toujours sur la ressource B et ne clique jamais sur la ressource D. La ressource D sera exclue du créneau de la demande correspondante A.


Attendons quelques semaines et nous verrons

D’une part, le nom n’est pas aussi putain que « Palekh ». Et c'est déjà bien. En revanche, tout le monde n’a pas encore eu le temps de s’adapter parfaitement à « Palekh », quand arrive ici un nouvel algorithme plus tordu et qui se concentre de plus en plus sur le contenu.

Le contenu est roi – confirmé après chaque mise à jour

Parmi les avantages, il est évident que cela offre une opportunité croissante aux sites progressistes, avisés et nouveaux de rivaliser dans des niches saturées avec des leaders de longue date en matière de résultats de recherche, ainsi que d'envoyer tout dans le plan astral plus lointain des rédacteurs SEO irréfléchis qui ont fait une décharge sur les sites en listant les ancres dans les textes.

L'algorithme offre la possibilité d'une nouvelle croissance professionnelle aux rédacteurs ayant une tête, ils peuvent faire quelque chose de plus utile que d'écrire des messages pour les réseaux sociaux.

Mais, d'un point de vue sceptique, il est peu probable que Yandex manque le moment de promouvoir ses capacités commerciales et leur nécessité, notamment le contexte.


Je perçois toujours ces nouvelles de manière très positive. Car en plus de l’optimisation du référencement, vous disposez d’un vaste espace pour des actions stratégiques de contenu, ce qui amène le référencement à un nouveau niveau. Ils arrêtent de le traiter comme quelque chose d'étrange et d'incompréhensible. Dans la forme que les gens connaissent, le référencement est foutu, c'était comme ça avant, mais le temps passe et la perception dépassée demeure.

La logique est la suivante : Auparavant, il y avait de nombreux studios Web sur le marché qui faisaient du référencement, et certains faisaient simplement semblant de le faire, mais prenaient un budget pour cela. Ces derniers prédominaient en nombre. C'est pourquoi il existe une opinion selon laquelle le référencement est une arnaque. Le temps passe, chaque mise à jour de l'algorithme déplace ceux qui ont « fait semblant », et la perception dépassée des gens demeure.



Le nouvel algorithme Queen poursuit logiquement les changements intervenus dans la recherche Yandex ces dernières années. Accent accru sur les réseaux de neurones, analyse de l'ensemble du contenu de la page, et pas seulement des titres.


Un point très important est l'analyse d'autres requêtes de recherche qui amènent les utilisateurs à la page actuelle, ce qui vous permet de déterminer plus précisément la pertinence du contenu et la relation entre les requêtes de recherche.

Résumer: la qualité de la recherche s’améliorera. Et c'est génial.

Adieu les textes SEO

Il sera intéressant de voir comment le nouvel algorithme fonctionnera dans la vie réelle. Il faut du temps pour évaluer à la fois l’adéquation du résultat sémantique et le classement des priorités.


Il est certain que la recherche devra désormais mieux gérer les requêtes non standard et rares si le réseau voit vraiment plus de sens derrière les mots-clés. Je l’espère vraiment, car c’est une autre étape vers « Au revoir les textes SEO ». Cependant, le réseau devra être formé. Cela ne semble pas être une blague.

Je viens d'essayer la recherche sur "Movie Boy with a Scar on His Forehead" et j'ai obtenu de nombreuses références au film "Scarface" dans les résultats de recherche. Autrement dit, les mots-clés triomphent toujours du sens.

Et seulement si je trouve les pages Harry Potter dont j'ai besoin dans les résultats de recherche et que j'y consacre beaucoup de temps, la machine comprendra le sens que j'ai donné à la demande et clarifiera les résultats de la recherche pour la prochaine fois. Du moins, c'est comme ça que ça devrait être. Le processus d’apprentissage ne sera pas rapide, mais il s’agit en tout cas d’un bon pas vers l’avenir.

Un peu plus proche des affaires...

Aujourd'hui, en réponse à la demande « Acheter un meuble à porte coulissante », je reçois constamment des fours et un tas de choses inutiles (à persiennes, à charnières, etc.).



L'essence de l'algorithme est de déterminer des propriétés supplémentaires du document au stade de l'indexation de l'URL, exprimant sous forme numérique la correspondance du texte de la page avec des expressions précédemment connues et fréquemment utilisées. Il est indiqué que l'innovation affectera les requêtes à basse fréquence, qui représentent environ un tiers des résultats de recherche.


En raison du manque de statistiques sur ces requêtes « rares », la qualité de leur recherche en souffre. En fait, cet algorithme sortira de l’oubli les documents qui ne contiennent pas directement une requête longue, mais dont le sens est proche de la requête de l’utilisateur.

Il est important pour les spécialistes du marketing et du référencement que leurs sites optimisés soient en concurrence non seulement entre eux, mais aussi avec avec des sites qui n'ont pas du tout été touchés par l'optimiseur.

Bien entendu, cela ne s’applique qu’aux requêtes peu fréquentes, et estimer la part des requêtes à 1/3 du flux est une estimation haute. Mais dans un avenir proche, certains sites pourraient connaître une sortie de trafic basse fréquence. Dans le même temps, il est inutile de faire des prévisions chiffrées.


À mon avis, l'idée même de construire divers indices composés de n-grammes étiquetés (et c'est ce que prétend Yandex) réside en surface. Par exemple, l’une des principales fonctionnalités du robot d’exploration statoperator est la construction d’un index n-gramme.


Les N-grammes sont plus informatifs que les mots individuels, ils se prêtent à la classification et vous permettent d'augmenter considérablement le nombre de facteurs pour construire une recherche par sens. Je suis heureux que Yandex avance dans la bonne direction et mette en œuvre les méthodes actuelles à un niveau élevé pour augmenter la vitesse et la qualité de la recherche.

Avis de Dmitry Sevalnev, chef du département SEO et publicité chez «

Yandex a lancé un nouvel algorithme de classement - « Korolev ». Le moteur de recherche fait désormais correspondre la signification de la requête de recherche et de la page. C'est très pratique pour les utilisateurs. Cependant, que signifie le nouvel algorithme pour les optimiseurs et les propriétaires de sites Web, comment la promotion va-t-elle changer et si nous devons nous attendre à des changements dans le trafic.

Plus que jamais, l’ensemble du monde du SEO attendait le lancement d’un nouvel algorithme de classement, annoncé le 22 août 2017. Bien sûr, de telles annonces sont une chose complètement atypique pour Yandex : ils préfèrent généralement ne pas parler de leurs projets et annoncer la prochaine version de l'algorithme de classement après coup.

Le 22 août 2017, Yandex a lancé une nouvelle version de la recherche. Il est basé sur l'algorithme de recherche Korolev (depuis 2008, de nouveaux algorithmes de classement dans Yandex portent le nom des villes). À l'aide d'un réseau neuronal, l'algorithme compare la signification des requêtes et des pages Web, ce qui permet à Yandex de répondre avec plus de précision aux requêtes complexes. Les statistiques de recherche et les évaluations de millions de personnes sont utilisées pour entraîner la nouvelle version de la recherche. Ainsi, non seulement les développeurs, mais également tous les utilisateurs de Yandex contribuent au développement de la recherche.

Le champ d'application du nouvel algorithme n'affecte pratiquement pas les domaines d'intérêt traditionnels du référencement, qui incluent principalement les résultats de recherche commerciale. "Korolev" s'est avéré être une suite logique de l'algorithme "Palekh" et est conçu pour répondre à la longue traîne de requêtes micro-fréquences, généralement posées en langage naturel. La particularité de ces requêtes est que les documents qui les concernent peuvent ne pas contenir la plupart des mots inclus dans la requête. Cela confond les algorithmes de classement traditionnels basés sur la pertinence textuelle.

Une solution a été trouvée en utilisant des réseaux de neurones, qui sont formés, entre autres, au comportement des utilisateurs. Par conséquent, le nouvel algorithme Yandex fonctionne sur la base d'un réseau neuronal. Il apprend des exemples de requêtes des utilisateurs et sélectionne les réponses en fonction de la signification du texte sur la page. Cela signifie notamment qu'il sera beaucoup plus efficace de travailler avec des requêtes non standard lorsque les utilisateurs eux-mêmes ne savent pas exactement comment s'appelle le nom de ce qu'ils souhaitent trouver. Ici, beaucoup dépend de la puissance de calcul.

En général, une telle approche pour résoudre le problème du classement de la longue queue microfréquence des requêtes n’est pas nouvelle. En 2015, on a découvert la technologie utilisée par le moteur de recherche Google pour trouver des réponses aux requêtes multi-mots posées en langage naturel - RankBrain. Cette technologie, également basée sur le machine learning, permet de reconnaître les mots les plus significatifs dans les requêtes et d'analyser le contexte dans lequel s'effectue la recherche. Cela vous permet de trouver des documents pertinents qui ne contiennent pas tous les mots recherchés.

De plus, l’algorithme fonctionne également avec des images. Il analyse le contenu de l'image et sélectionne l'option nécessaire en fonction de celle-ci, et pas seulement à partir de la description dans les balises ou du texte qui l'entoure.

Cependant, la longue traîne des requêtes multi-mots microfréquences en langage naturel pourrait bien intéresser les « brûleurs » de sémantique de l'information - les créateurs de sites d'information dits « pour toutes les occasions ». De manière générale, ils tentent déjà d'organiser une entrée exacte dans leurs textes pour autant de requêtes qu'ils connaissent, qu'ils parviennent à obtenir grâce à diverses méthodes de collecte de sémantique. Au même endroit où il n'y aura pas d'occurrences exactes, c'est-à-dire pour les requêtes qui n'ont pas été aspirées par « l'aspirateur sémantique » des créateurs de sites d'information ou pour lesquelles ils n'ont pas pu fournir des occurrences exactes dans le contenu, commence le domaine de « Korolev », conçu pour rechercher la correspondance entre requêtes et réponses dans le cas où il y a peu d'intersections entre elles sur des mots clés. Dans de tels cas, Korolev augmentera sans aucun doute les exigences en matière de qualité du contenu, et les articles lisibles vraiment intéressants bénéficieront encore plus de collections d'occurrences de phrases clés diluées avec de l'eau, car Ce sont précisément ces articles qui peuvent contenir des signaux utiles pour le nouvel algorithme. Eh bien, tous les autres référenceurs peuvent vraiment se détendre : la prochaine fessée est reportée. Il n’y a pas de victimes ni de destructions.

En lançant Palekh, Yandex a appris à un réseau de neurones à convertir les requêtes de recherche et les titres de pages Web en groupes de nombres - vecteurs sémantiques.

Une propriété importante de ces vecteurs est qu'ils peuvent être comparés les uns aux autres : plus la similitude est forte, plus la requête et l'en-tête sont proches l'un de l'autre en termes de signification.

En quoi est-ce différent de Palekh ?

La principale différence du nouvel algorithme, en plus d'améliorer la mise en œuvre technique, est la capacité de reconnaître des « significations » similaires dans tout le document, et pas seulement par le titre (Titre), qui apparaît dans la fenêtre du navigateur.

Comment fonctionne l'algorithme de Korolev

Algorithme de recherche "Korolev" compare les vecteurs sémantiques moteurs de recherche requêtes et pages Web entières- et pas seulement leurs gros titres. Cela nous permet d’atteindre un nouveau niveau de compréhension du sens.

Comme dans le cas de Palekh, les textes des pages web sont convertis en vecteurs sémantiques par un réseau de neurones. Cette opération nécessite beaucoup de ressources informatiques. Par conséquent, Korolev calcule les vecteurs de page non pas en temps réel, mais à l'avance, au stade de l'indexation.

Lorsqu'une personne pose une requête, l'algorithme compare le vecteur de requête avec les vecteurs de page déjà connus.

L'effet "Reine"

La capacité à comprendre la signification est particulièrement utile lors du traitement de requêtes rares et inhabituelles - lorsque les gens tentent de décrire les propriétés d'un objet avec leurs propres mots et s'attendent à ce que la recherche leur donne son nom.


Ce schéma vous permet de commencer à sélectionner les pages Web qui correspondent à votre requête de recherche dès les premières étapes du classement. Dans "Palekh" analyse sémantique- une des étapes finales : seuls 150 documents y transitent. Chez Korolev, il est produit pour 200 000 documents.

De plus, le nouvel algorithme compare non seulement le texte d'une page Web avec la requête de recherche, mais prête également attention aux autres requêtes qui amènent les gens vers cette page.

De cette façon, vous pouvez établir des connexions sémantiques supplémentaires.

Les gens enseignent aux machines

L’utilisation du machine learning, et notamment des réseaux de neurones, permettra tôt ou tard d’apprendre à la recherche à opérer avec sens au niveau humain. Pour qu'une machine comprenne comment résoudre un problème particulier, il est nécessaire de lui montrer un grand nombre d'exemples : positifs et négatifs. De tels exemples sont donnés par les utilisateurs de Yandex.

Le réseau neuronal utilisé par l'algorithme Korolev est formé sur des statistiques de recherche anonymisées. Les systèmes de collecte de statistiques prennent en compte les pages consultées par les utilisateurs pour certaines requêtes et le temps qu'ils y passent.

Si une personne ouvre une page Web et y reste longtemps, elle a probablement trouvé ce qu'elle cherchait, c'est-à-dire que la page répond bien à sa demande. C'est un exemple positif.

Il est beaucoup plus facile de trouver des exemples négatifs : il suffit de prendre une requête et n'importe quelle page Web aléatoire. Les statistiques utilisées pour entraîner l'algorithme sont anonymisées.

Matrixnet, qui construit une formule de classement, a également besoin de l’aide des gens.

Nettoyer

Pour que la recherche se développe, les utilisateurs doivent continuellement évaluer ses performances. Il était une fois seuls les employés de Yandex, les soi-disant évaluateurs. Mais plus il y a de notes, mieux c'est - alors Yandex a attiré tout le monde et a lancé le service Yandex.Toloka. Aujourd'hui, plus d'un million d'utilisateurs y sont enregistrés : ils analysent la qualité de la recherche et participent à l'amélioration des autres services Yandex. Les tâches Toloka sont rémunérées - le montant pouvant être gagné est indiqué à côté de la tâche. Au cours des deux années d’existence du service, les intervenants ont attribué environ deux milliards d’audiences.

La recherche moderne repose sur des algorithmes complexes. Les algorithmes sont inventés par les développeurs et enseignés par des millions d'utilisateurs de Yandex. Toute demande est un signal anonyme qui aide la machine à mieux comprendre les gens. Une nouvelle recherche est une recherche que nous faisons ensemble.

Hier soir, en présence de plusieurs milliers de webmasters et de deux astronautes, Yandex a annoncé le lancement d'un nouvel algorithme appelé « Korolev ». Jamais auparavant l'entreprise n'avait annoncé un changement d'algorithme à une aussi grande échelle : une présentation à la Apple, une communication directe avec l'espace, une immense salle du Planétarium de Moscou, une diffusion en ligne et des post-publications dans les principales publications de Runet. Il n'est pas surprenant qu'une relation publique aussi puissante ait provoqué une forte réaction de la communauté SEO et une autre explosion d'émotions envers « Yandex assoiffé de sang, qui veut passionnément conduire tout le monde vers Direct ».

Voyons ce qui s'est réellement passé et ce que nous pouvons attendre des prochaines innovations.

Que pouvons-nous attendre de Korolev dans un avenir proche ?

La principale différence entre Korolev et les algorithmes précédents est qu'un document classé peut être considéré comme pertinent pour une requête même si la requête elle-même n'est jamais contenue dans le corps du document (une suite logique de Palekh, qui a fait la même chose, uniquement pour le titre). ).

Le réseau neuronal identifie les relations sémantiques entre différents mots et expressions et les stocke dans une base de données distincte. L'algorithme s'appuie sur ces relations pour générer une réponse à une requête spécifique. En conséquence, les pages TOP peuvent donner une réponse claire à la question de l’utilisateur, mais en même temps ne contenir aucun mot de la demande elle-même.

Ce fait soulève de nombreuses questions et spéculations de la part des webmasters. Comment optimiser les textes maintenant ? Comment répartir les requêtes sur les pages ? Faut-il s’attendre à une baisse des positions et du trafic dans un avenir proche ?

Il est trop tôt pour tirer des conclusions, mais j’ai tendance à croire que dans un avenir proche, la plupart des experts ne verront aucune différence, car :

1) Pour les sujets commerciaux, peu de choses changeront

D'après les exemples donnés dans la présentation et les communiqués de presse, il est clair que l'algorithme fonctionne principalement avec des NP informationnels qui reflètent la signification des noms et des termes qui vous sont sortis de la tête :

- une photo où le ciel tourbillonne(Van Gogh)

– chat paresseux de Mongolie(Chat de Pallas)

- un film sur un homme qui cultivait des pommes de terre sur une autre planète("Martien")

Il est difficile d'imaginer qu'un utilisateur recherche un produit en utilisant une telle requête, par exemple « smartphone avec le logo de la pomme mordue » ou "un véhicule en forme de planche avec deux roues sur les côtés".

2) Les changements affectent principalement les requêtes multi-mots

À en juger par la présentation, la tâche principale de l'algorithme est de mieux comprendre le sens de la clarification des requêtes. En règle générale, il s'agit de requêtes composées de 5 mots ou plus. Devons-nous utiliser des réseaux de neurones pour comprendre le sens de requêtes telles que « louer un appartement à Moscou», « stores enrouleurs pour la chambre" ou " taxi à l'aéroport" ? Je pense que la question est rhétorique.

Comment puis-je déterminer si Korolev a eu un impact sur mes sites ?

À en juger par le nombre de tâches de vérification des positions dans SEOlib, tous les webmasters se sont précipités aujourd'hui pour vérifier comment le nouvel algorithme affectait le classement de leurs sites.

Selon la présentation, l'algorithme a été lancé plus tôt et fonctionne depuis un certain temps dans la recherche grand public. Par conséquent, la dynamique doit être évaluée non pas sur les dernières 24 heures, mais sur les dernières semaines.

De plus, il est incorrect de diagnostiquer l’impact du nouvel algorithme uniquement en fonction des positions. Si au cours des derniers mois vos positions médium/basse ont baissé ou augmenté, je suis sûr à 99% que le problème ne vient pas de la « Queen » (si vous avez besoin d'aide pour en trouver les raisons, envoyez-nous une demande - nous le ferons essayer d'aider).

Comment vérifier? Vérifiez si votre trafic depuis Yandex le long de la queue basse fréquence a changé (voir le rapport « Mots-clés » - « Autres » dans Y.Metrika). S'il a diminué ou augmenté de manière significative, alors vous êtes l'heureux propriétaire des conséquences « Reine ».

Comment optimiser les textes pour Korolev ?

Pour les spécialistes de l’information collectant du trafic sur la base de requêtes à faible fréquence, cette question est plus que jamais d’actualité. Mais très peu de temps s'est écoulé pour élaborer des instructions précises ou donner des recommandations ciblées sur des textes.

Pour l'instant, je ne peux donner qu'un seul conseil. Si vous avez déjà planifié le travail des rédacteurs des mois à l'avance, prenez une pause de 2 à 4 semaines et commencez à réviser les spécifications techniques. Vous ne parvenez pas à arrêter le convoyeur ? Écrivez ensuite des textes riches en sémantique pour augmenter les chances d'obtenir le bonheur :

"Une autre caractéristique importante de Korolev est qu'en plus de comparer la signification de la requête et de la page, il prend également en compte la signification d'autres requêtes pour lesquelles la page est pertinente." Lien Pruf

Je pense que dans un avenir très proche, les services apparaîtront pour automatiser le processus et que l'ère des clusterers sera remplacée par l'ère des analyseurs LSI.

Il y a des raisons de croire qu'au fil du temps, Yandex étendra l'influence de « Queen » sur les requêtes commerciales et courtes. C’est peut-être quelque chose dont on peut se réjouir. Après tout, il n'y aura alors plus besoin de trouver un équilibre entre la nécessité d'optimiser le texte avec des occurrences et le risque d'obtenir Baden-Baden. Quoi qu’il arrive, tout va pour le mieux.

Si votre site est en panne dans Yandex ou Google et que vous ne parvenez pas à en déterminer la raison, contactez-nous, nous essaierons de vous aider.

Bonjour, chers lecteurs du site blog. Je m'excuse que certains articles soient publiés sur une longue période, mais j'ai lancé plusieurs autres projets qui sont soudainement passés au TOP en 1,5 mois, en utilisant mes connaissances dans le domaine des blogs (si quelqu'un a besoin de conseils, écrivez dans un message personnel) . Je dois être tiraillé entre les projets et la construction d'une maison pour ma famille.

Aujourd'hui, nous aborderons le nouvel algorithme Korolev de Yandex et essaierons de le comparer avec ses prédécesseurs. Personnellement, cela n’a pas eu beaucoup d’impact sur mon blog, sauf que les articles utiles et volumineux sont devenus encore plus haut dans le TOP. Eh bien, examinons de plus près tout ce qui se trouve dans l'article et tirons les conclusions nécessaires après avoir observé cet algorithme.

Algorithme Korolev Yandex - qu'est-ce que c'est et comment ça marche

Fin août 2017, un nouvel algorithme Yandex Queen a été publié. La nouvelle de la mise à jour du moteur de recherche a immédiatement suscité l'intérêt des spécialistes du référencement et des médias.

La principale caractéristique de Korolev est d'augmenter la vitesse de traitement de l'information et d'améliorer la qualité de l'analyse sémantique du texte.

La vitesse de traitement des données a été multipliée par plusieurs milliers. Palekh a utilisé 150 documents pour former le TOP. Aujourd'hui, plus de 200 000 articles sont comparés les uns aux autres. Ce résultat a été obtenu en optimisant le protocole de classement.

Pour comprendre le nouvel algorithme, il faut remonter à Palekh. Sa présentation a eu lieu le 2 novembre 2016. Les statistiques ont montré que la plus grande partie des expressions de recherche étaient des expressions à faible fréquence adaptées à la seule réponse correcte. Cette partie tombe sur la longue queue de l'oiseau.

Pour donner la réponse souhaitée, le client doit avoir une pensée associative et des compétences d'auto-apprentissage, comme une personne. Les réseaux de neurones sont les mieux adaptés à de telles tâches, c'est pourquoi ils sont devenus la base du nouvel algorithme.

L'objectif principal de "Korolev"

Si une personne veut trouver un objet spécifique, elle commence à décrire ses propriétés : ce sont des caractéristiques de la pensée associative. Si nous avons oublié le nom de la vidéo, alors nous commençons à dire ce qu'elle contenait : « un film sur les filles pendant la guerre » ou « un film sur une créature avec une queue et des ailes ». Dans le premier cas, Yandex propose « Et les aubes ici sont calmes », dans la deuxième option, nous obtenons « chimère ».

Yandex améliore la qualité de la comparaison des expressions multi-mots. Le programme analyse le lien entre chaque mot dans une phrase et construit une association unique avec plusieurs options de réponse. Tout comme le fait le cerveau humain.

Quoi de neuf?

Innovations :

  • vecteur sémantique pour tout le contenu, pas seulement le titre ;
  • comparaison de plus de 200 000 articles lors de la création des résultats de recherche ;
  • le comportement de l'utilisateur sur la page est pris en compte ;
  • les gens aident à former le système.

Korolev analyse non seulement le titre, mais l'ensemble du contenu (y compris les photos, vidéos, tableaux, etc.) et compose un vecteur sémantique basé sur celui-ci.

La principale innovation a été l'accélération multiple des méthodes de recherche. Dans le passé, le vecteur sémantique était construit au moment où la phrase était saisie dans la barre de recherche. Cette méthode chargeait fortement les serveurs et retardait la vitesse de réponse.

Lorsque vous envoyez une phrase de recherche, son vecteur sémantique est comparé au tableau déjà enregistré dans la base de données. Palekh a comparé environ 150 options, mais la nouvelle version analyse plus de 200 000 articles à la fois. Cela augmente les chances de trouver la réponse souhaitée.

Réseau de neurones Yandex : principe de fonctionnement du réseau de neurones Korolev + exemples

La principale caractéristique d’un réseau neuronal est sa capacité à s’auto-apprendre. Le travail est effectué non seulement selon des formules délibérées, mais également sur la base d'expériences et d'erreurs antérieures.

Le cerveau humain est un immense réseau neuronal doté d’une pensée associative, et les ordinateurs tentent d’imiter le comportement humain en recréant l’architecture des réseaux neuronaux.

Caractéristiques de la structure du réseau neuronal

Un réseau de neurones est un ensemble de neurones uniques, chacun stockant ou traitant des informations. Chacun des neurones est capable de recevoir, traiter et transmettre des signaux. Le flux de données d'entrée est progressivement traité d'un neurone à l'autre et le résultat souhaité est finalement obtenu.

Les réseaux de neurones artificiels se transmettent des poids conditionnels (des nombres de 0 à 1) pour déterminer dans quelle mesure l'une ou l'autre version des informations entrantes correspond aux informations souhaitées. Une fois l’analyse terminée, le neurone ayant le poids le plus élevé est considéré comme le plus apte à répondre à la question.

Le diagramme représente un réseau neuronal. Les deux premières couches effectuent le traitement. Chacun des neurones contient une fonction spécifique qui reçoit les données d'entrée et, après traitement, produit la réponse nécessaire. C'est ainsi que les vecteurs sémantiques sont comparés.

Vecteurs sémantiques

Les ordinateurs ne peuvent pas fonctionner avec des mots ou des images, ils utilisent donc des tableaux de nombres pour comparer les informations entre elles. Les moteurs de recherche doivent déterminer indépendamment le sujet principal et l'idée du texte afin de donner à l'utilisateur ce dont il a besoin.

Plus le vecteur de la question posée et le texte sont similaires, plus l'article est haut dans la priorité de recherche. Korolev utilise l'analyse de tout le contenu :

  • les tables;
  • texte;
  • photo;
  • vidéo;
  • en-têtes ;
  • citations;
  • listes;
  • accentuation (italique, gras, etc.).

La qualité de la construction vectorielle augmente plusieurs fois en raison de la conversion de plus d'informations.

Pour créer des vecteurs, un réseau de neurones est utilisé, le texte passe à travers une séquence de neurones et, par conséquent, un tableau de nombres à trois cents dimensions est obtenu. Par la suite, ils sont saisis dans une base de données unique et utilisés à des fins de comparaison.

Éducation

La principale caractéristique des réseaux de neurones est la capacité d’apprentissage. Contrairement aux algorithmes standards, les neurones sont capables de se souvenir de leur expérience antérieure et d’en tirer des leçons. L’ordinateur s’améliore à chaque fois pour distinguer les informations.

Dans le passé, la formation était dispensée par les employés de l'entreprise, leur tâche consistait à parcourir des millions de demandes et à modifier les priorités d'émission à leur discrétion. Ensuite, les développeurs ont créé l'application Yandex.Toloka, il s'agit d'une liste de tâches simples. Vous devez parcourir les requêtes et évaluer la qualité des résultats de recherche. Pour chaque tâche, ils paient environ 0,1 à 1 $

Quel contenu le nouvel algorithme de recherche considère-t-il comme bon ?

L'article le plus adapté pour les résultats de recherche TOP sera celui contenant le maximum d'informations utiles pour l'utilisateur et correspondant à la requête. Par conséquent, il doit couvrir toutes sortes de questions des clients section par section.

Chez Korolev, le comportement des utilisateurs sur la page est pris en compte en priorité. Par conséquent, la tâche des administrateurs est d'essayer de fidéliser l'utilisateur et de l'intéresser. Pour ce faire, utilisez des titres structurés, des tableaux, des listes, des faits saillants, des photos et des vidéos.

Nouvelles priorités de recherche

Les spécialistes du référencement, après la publication, ont mené une étude pour évaluer les changements dans les priorités de classement. Aucun changement significatif n’a été observé ; les priorités restent :

  • structure du texte ;
  • exhaustivité du sujet;
  • lecture du contenu de la prostate ;
  • correspondance des titres avec le contenu sémantique du texte ;
  • formation correcte du noyau sémantique.

L'essentiel est d'écrire pour des vivants, cette priorité reste la plus importante.

Pourquoi Yandex a lancé un nouvel algorithme de recherche et comment il menace les sites

Toute entreprise s'efforce de rendre ses produits les meilleurs sur le marché des services. Dans ce cas, le plus grand rival de Yandex est Google. Les innovations ont été créées dans les buts suivants :

  • améliorer la qualité de la recherche sur des questions non standard ;
  • attirer de nouveaux investisseurs;
  • augmentation de la productivité du classement (plus de 200 000 articles lors de la génération de résultats).

L'objectif principal était d'améliorer la qualité de la livraison. En outre, il fallait montrer aux investisseurs que le travail de l’entreprise battait son plein et que leur argent était utilisé aux fins prévues. Les innovations ont ensuite été utilisées pour créer l’assistant vocal Alice.

Ligne d'algorithmes précédents

Pour mieux comprendre les nouvelles technologies, il faut remonter dans le passé. Dans ce cas, nous considérerons la gamme d’algorithmes précédents utilisés par le moteur de recherche pour le classement.

Au début, Internet ne contenait que quelques milliers de sites ; pour trouver l'article souhaité sur eux, il suffisait de comparer les mots-clés de l'expression de recherche. Par la suite, le réseau mondial s'est développé de façon exponentielle : désormais, sur un sujet, vous pouvez trouver plus de centaines de milliers de sites similaires avec un million d'articles.

Par conséquent, il a été nécessaire de compliquer les systèmes de classement et a commencé à prendre en compte les paramètres supplémentaires suivants :

  • nombre de documents de référence ;
  • caractère unique du contenu ;
  • comportement du client sur la page.

Matricenet

En 2009, Yandex a été confronté à un problème : les articles ne répondaient de plus en plus aux questions des utilisateurs. Pour corriger cette erreur, il a fallu apprendre au serveur à prendre des décisions de manière indépendante et à apprendre par lui-même.

Une formule mathématique complexe comportant de nombreux paramètres a été inventée pour déterminer si le texte correspond à une expression recherchée.

Mais les problèmes suivants subsistaient :

  • la recherche dépend des mots ;
  • les supports auxiliaires (photos, vidéos, citations, etc.) ne sont pas pris en compte.

Le principal problème était qu’il n’était pas toujours possible de décrire entièrement le sens de l’article dans un seul titre. Très souvent, l’article ne contient pas de mots-clés spécifiques, mais en même temps il révèle pleinement le sujet et donne une réponse détaillée à la question de l’utilisateur.

Algorithme Palekh

En 2016, un modèle informatique de réseau neuronal a été utilisé dans le système de classement. La principale caractéristique de cette approche est que l’ordinateur est désormais capable de se souvenir de ses erreurs et d’apprendre de sa propre expérience.

La même année, des vecteurs sémantiques sont introduits. Le titre de l’article a été transmis via un réseau de neurones et décomposé en plusieurs vecteurs. Désormais, les ordinateurs ne comparent pas les mots issus de la recherche, mais des tableaux multidimensionnels de nombres et de vecteurs. Nous avons réussi à s'éloigner de la dépendance directe du nombre de certains mots dans une phrase et à donner la priorité au contenu sémantique.

L’un des défauts reste le problème de la faible vitesse. Pour créer les résultats de recherche, seuls 200 articles parmi les plus pertinents ont été comparés. Par conséquent, il était difficile pour le système de trouver des expressions sémantiques à plusieurs mots comme « un film sur une fille, un espion qui s'enfuit et va à l'école ».

Algorithme Yandex Korolev

Dans la dernière innovation, nous avons principalement optimisé le réseau neuronal et amélioré la productivité du traitement de texte. Désormais, les vecteurs sont comparés à l'avance en mode hors ligne, ce qui permet d'augmenter l'efficacité de la recherche.

Yandex collecte indépendamment des statistiques sur les intérêts des utilisateurs et les utilise pour créer des résultats de recherche prédéfinis.

Grâce à l'optimisation, un vecteur sémantique est compilé non seulement pour les titres, mais pour l'ensemble du contenu. Il est possible de trouver un maximum de connexions sémantiques entre les mots.

Menaces sur les sites Web

En général, aucun danger n'a été créé pour les sites et les statistiques de conversion ne changent pas beaucoup. Tout d'abord, les innovations affecteront les blogs d'information, les forums et les sites proposant des films.

Les sites Web qui ne répondent pas aux intérêts de l'utilisateur peuvent perdre leur position de leader. Par exemple, le titre est « jus de pomme fait maison », mais l'article traite des méthodes de culture des arbres, des crêpes à la confiture et d'un texte complètement différent.

N'oubliez pas de reposter et de vous abonner à la newsletter du blog. Tous mes vœux.

Bonne chance, Galiuin Ruslan.

Avez-vous aimé l'article? Partager avec des amis: